Claude Mythos: O Modelo Poderoso Demais Para Ser Liberado

Um modelo de IA resolve 93,9% dos bugs reais de software no SWE-bench. Passa em 100% dos desafios de cibersegurança do Cybench. E encontra sozinho vulnerabilidades que especialistas humanos não acharam em 27 anos. A Anthropic olhou para tudo isso e decidiu: esse modelo não vai ser liberado ao público.

Essa é a história do Claude Mythos Preview, o modelo mais poderoso já criado pela Anthropic, e talvez o primeiro caso real de uma empresa de IA freando sua própria tecnologia por considerar genuinamente perigosa.

Os Números Que Assustam

O Mythos Preview (codinome interno Capybara) vazou pela primeira vez em 26 de março de 2026, quando documentos internos da Anthropic descreveram o modelo como uma mudança de patamar em relação ao Claude Opus 4.6.

Em 7 de abril, a Anthropic confirmou oficialmente. Os benchmarks falam por si:

Benchmark	Claude Opus 4.6	Claude Mythos Preview
SWE-bench Verified	80,8%	93,9%
GPQA Diamond	—	94,6%
USAMO	—	97,6%
Terminal-Bench 2.0	—	82,0%
CyberGym	—	83,1%
Cybench	—	100% (pass@1)

Dado-chave: O Mythos Preview é o primeiro modelo a completar uma simulação de ataque corporativo de 32 etapas do início ao fim, conseguindo em 3 de 10 tentativas. Na média, completou 22 das 32 etapas em todas as tentativas.

Para colocar em perspectiva: o SWE-bench Verified testa a capacidade de resolver bugs reais em repositórios open-source. Ir de 80,8% para 93,9% não é uma melhoria incremental. É um salto de capacidade.

Por Que a Anthropic Não Liberou

A maioria das empresas de IA trataria esses números como material de marketing e abriria pré-venda. A Anthropic fez o oposto.

O modelo não está disponível via API. Não está no Claude.ai. Não está em nenhuma tier de assinatura. O acesso está restrito a 12 organizações parceiras do Project Glasswing, a iniciativa de US$ 100 milhões da Anthropic para cibersegurança defensiva.

A razão oficial: as capacidades ofensivas do modelo em cibersegurança são sem precedentes. Se liberado, poderia ser usado para encontrar e explorar vulnerabilidades em escala industrial. A Anthropic avaliou que o risco de uso malicioso supera os benefícios do acesso amplo.

O Que o Modelo Faz de Diferente

Modelos anteriores já encontravam vulnerabilidades conhecidas. O Mythos Preview encontra as que ninguém conhece. A diferença é qualitativa, não quantitativa:

Análise autônoma de código-fonte e binários: O modelo lê código compilado como um reverse engineer sênior, mas em velocidade de máquina.
Encadeamento de exploits: Não apenas encontra falhas isoladas. Combina múltiplas vulnerabilidades para construir chains de ataque completas, do acesso inicial ao controle total.
Persistência e criatividade: Em testes, o modelo tentou abordagens não convencionais que não estavam em nenhum playbook de pentesting existente.

Um exemplo concreto: o modelo encontrou e explorou autonomamente o CVE-2026-4747, uma vulnerabilidade de execução remota de código no FreeBSD via NFS que existia há 17 anos. Começou de um usuário não autenticado na internet e chegou a root. Sem orientação humana.

O Que Isso Significa Para o Mercado

O Mythos Preview cria um antes e depois para a indústria de IA. É a primeira vez que uma empresa líder admite que sua própria tecnologia é perigosa demais para liberar.

Isso levanta questões para todo o setor:

Regulação por design: Em vez de esperar governos regularem, a Anthropic está se autorregulando. Isso pressiona concorrentes a fazerem o mesmo.
Acesso assimétrico: 12 organizações têm acesso a uma ferramenta que mais ninguém tem. Isso cria uma vantagem estrutural em cibersegurança para quem está dentro do consórcio.
Precedente para modelos futuros: Se o Mythos Preview é poderoso demais, o que acontece com o próximo modelo? E o depois dele?

Dado-chave: A OpenAI respondeu uma semana depois com o GPT-5.4-Cyber, adotando a filosofia oposta: acesso amplo para defensores verificados. Duas apostas filosóficas competindo em tempo real.

A Corrida Pela Segurança da IA

O Mythos Preview não é apenas um modelo. É um sinal do que está por vir. Modelos de IA estão se tornando ferramentas ofensivas e defensivas ao mesmo tempo. A pergunta não é mais "se" IAs vão encontrar zero-days. É quem vai chegar primeiro: os defensores ou os atacantes.

A Anthropic apostou nos defensores, mas trancou a porta. A OpenAI apostou nos defensores e abriu a porta (com verificação). O mercado vai decidir qual abordagem funciona melhor.

Enquanto gigantes disputam modelos de cibersegurança, a Verboo usa IA de ponta para resolver outro problema crítico: vendas que se perdem por falta de velocidade. Nossos agentes de IA operam no WhatsApp respondendo em segundos, não em horas. Teste um agente no Lab.

]]>

Claude Mythos: O Modelo Poderoso Demais Para Ser Liberado

Os Números Que Assustam

Por Que a Anthropic Não Liberou

O Que o Modelo Faz de Diferente

O Que Isso Significa Para o Mercado

A Corrida Pela Segurança da IA

Artigos relacionados

AGENTS.md: o padrão que uniu Cursor, Claude Code e Codex

LongCat-2.0: MIT, 59,5% SWE-bench e 2 meses incógnito

GPT-5.6 Sol bateu o benchmark. O METR diz que fez trapaça.