Virgin Voyages tinha 50 agentes de IA rodando em outubro de 2025. Em fevereiro de 2026, esse número chegou a 1.500. Crescimento de 2.900% em quatro meses. Tempo de produção de conteúdo caiu 60%. Receita e satisfação de cliente subiram. E o detalhe que conecta tudo isso com o Google I/O dessa semana: esses 1.500 agentes rodam no Google Cloud Gemini Enterprise. Não foi o modelo que escalou. Foi a infraestrutura que o Google entregou embaixo.
Por Que o Google I/O 2026 Foi Sobre Infra, Não Sobre Modelo?
O Gemini 3.5 Flash foi anunciado no Google I/O de 19 de maio. É um modelo que compete com flagships em benchmarks de coding e agentes, na velocidade esperada da família Flash. Tecnicamente relevante. Mas o anúncio que mais importa para quem constrói software não foi o modelo. Foram os Managed Agents na Gemini API: uma única chamada de API entrega um agente completamente provisionado com sandbox remoto. Você não configura servidor, não gerencia ambiente de execução, não define escalonamento. Você chama a API e o agente já está no ar.
O Google chamou isso de "agentic era". Na prática, é uma declaração de que o produto que o Google está vendendo não é mais o modelo de linguagem. É o ambiente de execução onde o agente vive.
Na mesma semana, a Anthropic anunciou duas features para Claude Managed Agents: self-hosted sandboxes (public beta) e MCP tunnels (research preview). A lógica das self-hosted sandboxes é cirúrgica: o loop de agente (orquestração, gestão de contexto, recuperação de erros) fica na Anthropic, mas a execução de ferramentas migra para infraestrutura que você controla: Cloudflare, Vercel, Modal ou seu próprio servidor. Seus sistemas de logging, DLP e políticas de rede se aplicam automaticamente porque a execução acontece dentro do seu perímetro.
Os MCP tunnels vão um passo além. Servidores MCP privados (bancos de dados internos, APIs protegidas por firewall, knowledge bases corporativas) viram ferramentas que o agente Claude acessa via gateway outbound criptografado. Zero regra de firewall inbound. Zero exposição à internet pública.
Dado-chave: Self-hosted sandboxes da Anthropic colocam a execução de ferramentas do agente dentro da infraestrutura do cliente, com audit logging e políticas de rede existentes aplicadas automaticamente. MCP tunnels conectam agentes a sistemas privados via gateway outbound sem abrir portas de entrada. (Fonte: Anthropic Engineering Blog)
O Que Cada Big Tech Apostou Nessa Semana
| Empresa | Anúncio de Infraestrutura | O Que Resolve Para Devs |
|---|---|---|
| Managed Agents API + Antigravity agent-first | Sandbox provisionado por chamada de API, sem configurar servidor | |
| Anthropic | Self-hosted sandboxes + MCP Tunnels | Agentes dentro do perímetro do cliente, dados privados acessíveis |
| OpenAI | $4 bi em empresa de deployment enterprise | Deployment como produto vendido, não como problema do cliente |
| Meta | Agentic shopping no Instagram (ainda em 2026) | WhatsApp e Instagram vão ter agentes nativos de transação |
Por Que o Debate de "Qual Modelo Usar" Está Ficando Irrelevante?
Para a maioria das tarefas que agentes de atendimento, vendas e qualificação executam, GPT-4o Mini, Claude Haiku, Gemini 3.5 Flash e Llama 3.3 entregam resultado equivalente para o usuário final. A diferença de custo entre eles pode ser de 10x. A diferença perceptível na qualidade da resposta, em contextos de negócio padrão, raramente justifica pagar mais pelo modelo.
O que diferencia agentes em produção que escalam de protótipos que morrem em demo é a camada de baixo: onde o agente roda, como gerencia estado entre mensagens, como acessa ferramentas e dados privados, como garante latência consistente em pico de demanda. Virgin Voyages não chegou a 1.500 agentes escolhendo o LLM certo. Chegou porque o Google Cloud provisionou a infraestrutura de escalonamento automaticamente por cima do Gemini. O resultado: tempo de insight-para-ação reduzido em 75%, receita e satisfação de cliente em alta em janeiro e fevereiro de 2026.
A OpenAI entendeu essa lógica e anunciou uma empresa separada de $4 bilhões focada exclusivamente em deployment enterprise de agentes. Não em novos modelos. Em deployment. Quando a maior empresa de IA do mundo separa uma estrutura bilionária para resolver o problema de colocar agentes em produção, o sinal é claro: o modelo virou commodity, e o problema que resta é operacional.
Três Implicações Para Quem Está Construindo Agentes Agora
Controle de Execução Vai Virar Requisito em Enterprise
O bloqueio mais comum em vendas de agentes para saúde, financeiro e jurídico é: "nossos dados não podem sair do servidor." Os MCP tunnels da Anthropic e os self-hosted sandboxes resolvem isso tecnicamente. Bases de dados internas, prontuários, APIs protegidas e knowledge bases corporativas passam a ser ferramentas acessíveis ao agente sem comprometer compliance.
Para quem constrói agentes nessas verticals, esse foi o anúncio mais importante da semana. A Verboo já opera nessa direção com o case da Bioclínica: dados sensíveis de agendamento e atendimento em saúde resolvidos na camada de infraestrutura da plataforma, sem que os dados do paciente transitem por sistemas não controlados pela clínica.
Modelo Como Commodity Acelera a Consolidação de Plataformas
Se o modelo deixa de ser o diferenciador, o diferenciador passa a ser quem oferece a melhor combinação de canal de entrega, memória persistente, RAG e integrações prontas. Esse é o espaço que plataformas de agentes como a Verboo ocupam: você configura a lógica do Assistente (Instrução, Conhecimento, Gatilhos) e herda toda a infraestrutura de execução embaixo. A escolha de modelo passa a ser detalhe de configuração, não decisão arquitetural crítica que define o sucesso do projeto.
WhatsApp Vai Ficar Mais Disputado no Segundo Semestre
Meta anunciou integração de agentes de compra no Instagram antes do final de 2026. O canal que já tem 3,3 bilhões de usuários e taxa de abertura de 98% vai ganhar uma camada de execução agentica nativa da Meta. Para empresas que não estiverem operando com agentes no WhatsApp quando isso acontecer, vai ser tarde para construir histórico de interações e confiança do usuário. O canal é o mesmo, mas agentes nativos da Meta vão disputar o attention do usuário com soluções independentes. Quem já opera ganha vantagem de dados e histórico acumulado.
O Que Essa Semana Muda Para Quem Está Construindo Hoje
O Google I/O de 2026 deixou claro que a corrida de IA não é mais sobre qual modelo é 3% melhor no benchmark. É sobre quem controla onde o agente roda, com quais dados ele tem acesso e com qual latência ele entrega resultado. Google, Anthropic e OpenAI passaram a semana anunciando infraestrutura. Não coincidência: é o problema que mais bloqueia escalonamento.
Para 390 empresas que já rodam agentes de atendimento e vendas no WhatsApp com latência abaixo de 500ms e mais de 27 milhões de mensagens processadas, a infraestrutura que as big techs estão anunciando é a que a plataforma já entrega. Você configura o Assistente no dashboard da Verboo e herda canal WhatsApp nativo, memória persistente por usuário, RAG com re-ranking e 13 integrações. A discussão de qual modelo usar vira parâmetro de configuração, não reunião de arquitetura.
A Verboo já opera nesse modelo. Conheça a plataforma.



