Um dev que usa Claude Code como ferramenta principal não paga R$ 116/mês. Paga muito mais. O quanto mais depende de uma variável que o site da Anthropic não destaca: quantos tokens você consome por hora.
Engenheiros em uso intenso chegaram a $2.000/dev/mês em cenários documentados, consumindo o budget anual de AI de divisões inteiras em 4 meses. A conta não é outlier, é a matemática funcionando como esperado.
Esse artigo abre a planilha: quantos tokens uma sessão real de 8 horas consome, quanto isso custa por modelo, onde o Pro quebra e quando o Max 20x compensa.
Quanto custa uma sessão de 8 horas no Claude Code?
Uma sessão intensa de refactoring com um agente de programação não é linear. Cada turno acumula contexto: o agente lê o arquivo, analisa o erro, propõe a mudança, você refina, ele revisa com o histórico completo. O contexto cresce por toda a sessão.
Com base em dados de uso real (Morphllm e CloudZero, junho/2026), uma sessão full-day consome em média 20 milhões de tokens de entrada por dia, com 500 mil de saída. Com 75% de cache hit rate, típico de sessões longas com contexto estável, a distribuição real fica:
- 15M tokens servidos do cache (cobrados a 10% do preço de input)
- 5M tokens de entrada frescos
- 500K tokens de saída
A conta por modelo, com preços da API Anthropic em junho/2026:
| Modelo | Input fresco (5M) | Cache (15M) | Output (500K) | Total/dia | Total/mês (22 dias) |
|---|---|---|---|---|---|
| Haiku 4.5 | $5,00 | $1,50 | $2,50 | $9,00 | $198 (R$ 1.148) |
| Sonnet 4.6 | $15,00 | $4,50 | $7,50 | $27,00 | $594 (R$ 3.445) |
| Opus 4.7/4.8 | $25,00 | $7,50 | $12,50 | $45,00 | $990 (R$ 5.742) |
Fontes: CloudZero e Morphllm AI Coding Costs 2026. Preços API Anthropic jun/2026. Câmbio: R$ 5,80.
Esses números são para uso via API direta, sem plano de assinatura. São o teto. Mas entender o teto é o que permite avaliar se o plano escolhido faz sentido para o volume que você tem.
10 bilhões de tokens ao longo de 8 meses via API direta chegaria a $15.000. O mesmo período no Max 20x custaria $800. Os planos de assinatura existem para absorver esse delta. A questão é se o delta que você gera cabe no plano que escolheu. (Fonte: CloudZero, jun/2026)
O que cada plano do Claude Code realmente cobre
Os planos de assinatura do Claude Code não funcionam por token. Funcionam por janela de consumo de 5 horas com rolagem.
- Pro ($20/mês): janela básica de 5 horas. Funciona para uso moderado, até 2 horas de sessão intensa por dia.
- Max 5x ($100/mês): 5x a capacidade da janela base. Breakeven em torno de 5 features médias por dia útil.
- Max 20x ($200/mês = R$ 1.160/mês): o plano para quem usa o agente como ferramenta principal de trabalho.
O Max 20x é mais barato que a conta de API direta em Sonnet 4.6 ($594/mês = R$ 3.445). Para power users, é uma proteção de custo real.
O ponto de atenção: "20x a janela do Pro" não tem cota absoluta em tokens documentada. Depende de quanto você consumiria no Pro base. Se o baseline é intenso, o multiplicador não garante um teto fixo em dias de refactor muito pesado. Em sessões com contextos de 200k tokens por turno, o "20x" pode não atravessar uma semana inteira de alta produtividade.
Quanto custa por tipo de tarefa?
Uma forma mais concreta de entender o custo é por tarefa, não por hora. Com Sonnet 4.6 em junho/2026:
| Tarefa | Chamadas estimadas | Tokens de entrada | Custo Sonnet 4.6 | Custo Opus 4.7/4.8 |
|---|---|---|---|---|
| Bug fix simples | ~25 chamadas | 400K acumulado | $0,54 (R$ 3,13) | $0,90 (R$ 5,22) |
| Implementação de feature | ~100 chamadas | 2M acumulado | $2,28 (R$ 13,22) | $3,80 (R$ 22,04) |
| Refactor de módulo grande | ~300 chamadas | 8M acumulado | $9,12 (R$ 52,90) | $15,20 (R$ 88,16) |
Um dev em uso profissional diário faz tipicamente 5 a 10 bug fixes e 1 a 2 features por dia. A conta fica em torno de $5 a $12/dia em Sonnet 4.6, ou $110 a $264/mês via API direta. O plano Max 5x ($100/mês) cobre essa faixa com margem.
O breakeven do Max 5x ($100/mês): aproximadamente 111 bug fixes mensais ou 26 features, cerca de 5 tasks de porte médio por dia útil. Abaixo disso, o Pro $20 cobre. Acima disso, o Max 5x ou 20x é mais barato que API direta.
O que o limite faz com a forma de trabalhar
A questão mais importante não está nos números. Está no que o limite faz com as decisões técnicas antes de você atingi-lo.
Dev que sabe que a janela do Pro fecha em 5 horas não começa o refactor pesado às 14h. Dev que acompanha o crédito restante no Max 5x escolhe o modelo mais barato mesmo quando o problema pede o mais capaz. Dev que precisa de contexto longo corta o prompt para economizar token em vez de passar o arquivo completo.
O custo variável força trade-offs entre contabilidade e engenharia. Tokens ilimitados mudam o comportamento antes mesmo de mudar a conta: a sessão longa deixa de ser uma decisão financeira e vira uma decisão técnica.
Modelos open source mudam a conta
O que a tabela de preços da Anthropic não mostra: modelos open source têm custo radicalmente diferente por token. O DeepSeek V4 Flash cobra $0,14/M input e $0,28/M output via API, contra $3/$15 do Sonnet 4.6. Uma diferença de 20x no custo por token.
A mesma sessão de 8h que custaria $594/mês em Sonnet 4.6 custaria aproximadamente $30/mês em DeepSeek V4 Flash via API. A diferença de qualidade existe em raciocínio complexo. Mas para alto volume de tarefas mecânicas como geração de testes, refactors de padrão e documentação, o open source entrega resultado aceitável a uma fração do preço.
Qual plano faz sentido para qual perfil?
- Uso casual (menos de 2h/dia): Claude Code Pro ($20/mês). A janela de 5h raramente é atingida.
- Uso profissional (3 a 5h/dia): Max 5x ($100/mês = R$ 580). O breakeven se paga rapidamente.
- Full-day com modelos frontier (6 a 8h/dia): Max 20x ($200/mês = R$ 1.160).
- Full-day com open source (6 a 8h/dia): Verboo Code (R$ 75/mês), 6 modelos em GPU dedicada, sem cap, sem janela.
- Times em uso intenso: multiplique o número de devs pela faixa de uso. A conta escala linearmente e pode chegar a R$ 1.160 a R$ 3.445 por assento ao mês.
O Verboo Code roda o deepseek-v4-flash entre seus 6 modelos open source, com tokens ilimitados e sem janela de 5 horas. Para quem precisa de custo previsível em reais e volume intenso, a diferença é direta: R$ 75/mês vs R$ 1.160/mês (Max 20x) ou R$ 3.445/mês via API com Sonnet.
Para entender como Cursor e Copilot definem "ilimitado" na prática, veja a matemática real do ilimitado em Claude Code, Cursor e Copilot. Para o comparativo completo entre 5 coding agents de 2026 em custo e caps, veja o guia de agentes de programação com tokens ilimitados.
O Verboo Code resolve isso com modelos open source rodando em GPU dedicada e tokens ilimitados. Veja como funciona.



