Essa é a história do Claude Mythos Preview, o modelo mais poderoso já criado pela Anthropic, e talvez o primeiro caso real de uma empresa de IA freando sua própria tecnologia por considerar genuinamente perigosa.
Os Números Que Assustam
O Mythos Preview (codinome interno Capybara) vazou pela primeira vez em 26 de março de 2026, quando documentos internos da Anthropic descreveram o modelo como uma mudança de patamar em relação ao Claude Opus 4.6.
Em 7 de abril, a Anthropic confirmou oficialmente. Os benchmarks falam por si:
| Benchmark | Claude Opus 4.6 | Claude Mythos Preview |
|---|---|---|
| SWE-bench Verified | 80,8% | 93,9% |
| GPQA Diamond | — | 94,6% |
| USAMO | — | 97,6% |
| Terminal-Bench 2.0 | — | 82,0% |
| CyberGym | — | 83,1% |
| Cybench | — | 100% (pass@1) |
Dado-chave: O Mythos Preview é o primeiro modelo a completar uma simulação de ataque corporativo de 32 etapas do início ao fim, conseguindo em 3 de 10 tentativas. Na média, completou 22 das 32 etapas em todas as tentativas.
Para colocar em perspectiva: o SWE-bench Verified testa a capacidade de resolver bugs reais em repositórios open-source. Ir de 80,8% para 93,9% não é uma melhoria incremental. É um salto de capacidade.
Por Que a Anthropic Não Liberou
A maioria das empresas de IA trataria esses números como material de marketing e abriria pré-venda. A Anthropic fez o oposto.
O modelo não está disponível via API. Não está no Claude.ai. Não está em nenhuma tier de assinatura. O acesso está restrito a 12 organizações parceiras do Project Glasswing, a iniciativa de US$ 100 milhões da Anthropic para cibersegurança defensiva.
A razão oficial: as capacidades ofensivas do modelo em cibersegurança são sem precedentes. Se liberado, poderia ser usado para encontrar e explorar vulnerabilidades em escala industrial. A Anthropic avaliou que o risco de uso malicioso supera os benefícios do acesso amplo.
O Que o Modelo Faz de Diferente
Modelos anteriores já encontravam vulnerabilidades conhecidas. O Mythos Preview encontra as que ninguém conhece. A diferença é qualitativa, não quantitativa:
- Análise autônoma de código-fonte e binários: O modelo lê código compilado como um reverse engineer sênior, mas em velocidade de máquina.
- Encadeamento de exploits: Não apenas encontra falhas isoladas. Combina múltiplas vulnerabilidades para construir chains de ataque completas, do acesso inicial ao controle total.
- Persistência e criatividade: Em testes, o modelo tentou abordagens não convencionais que não estavam em nenhum playbook de pentesting existente.
Um exemplo concreto: o modelo encontrou e explorou autonomamente o CVE-2026-4747, uma vulnerabilidade de execução remota de código no FreeBSD via NFS que existia há 17 anos. Começou de um usuário não autenticado na internet e chegou a root. Sem orientação humana.
O Que Isso Significa Para o Mercado
O Mythos Preview cria um antes e depois para a indústria de IA. É a primeira vez que uma empresa líder admite que sua própria tecnologia é perigosa demais para liberar.
Isso levanta questões para todo o setor:
- Regulação por design: Em vez de esperar governos regularem, a Anthropic está se autorregulando. Isso pressiona concorrentes a fazerem o mesmo.
- Acesso assimétrico: 12 organizações têm acesso a uma ferramenta que mais ninguém tem. Isso cria uma vantagem estrutural em cibersegurança para quem está dentro do consórcio.
- Precedente para modelos futuros: Se o Mythos Preview é poderoso demais, o que acontece com o próximo modelo? E o depois dele?
Dado-chave: A OpenAI respondeu uma semana depois com o GPT-5.4-Cyber, adotando a filosofia oposta: acesso amplo para defensores verificados. Duas apostas filosóficas competindo em tempo real.
A Corrida Pela Segurança da IA
O Mythos Preview não é apenas um modelo. É um sinal do que está por vir. Modelos de IA estão se tornando ferramentas ofensivas e defensivas ao mesmo tempo. A pergunta não é mais "se" IAs vão encontrar zero-days. É quem vai chegar primeiro: os defensores ou os atacantes.
A Anthropic apostou nos defensores, mas trancou a porta. A OpenAI apostou nos defensores e abriu a porta (com verificação). O mercado vai decidir qual abordagem funciona melhor.
Enquanto gigantes disputam modelos de cibersegurança, a Verboo usa IA de ponta para resolver outro problema crítico: vendas que se perdem por falta de velocidade. Nossos agentes de IA operam no WhatsApp respondendo em segundos, não em horas. Teste um agente no Lab.
]]>


