• IA Express
  • Posts
  • Por que mais agentes de IA nem sempre significam mais inteligência?

Por que mais agentes de IA nem sempre significam mais inteligência?

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você saberá que, enquanto o hype dos sistemas multiagentes domina as manchetes, um estudo revela que o melhor a fazer é "escutar" a complexidade da tarefa para decidir entre agilidade e poder colaborativo. 🤖👥🤝

Porém isso não é tudo na IA Express de hoje:
- Google Finance renovado com recursos de IA chega ao Brasil
- Modelos de IA agem secretamente para evitar que "colegas" sejam desligados
- Serviço de streaming gratuito da Fox foi incorporado ao ChatGPT
- Técnica de prompting usa linguagem de homens da caverna para poupar tokens

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

SOLO, DUO OU ORQUESTRA

Por que mais agentes de IA nem sempre significam mais inteligência?

Nos últimos meses, temos testemunhado uma explosão de frameworks multiagentes prometendo revolucionar como desenvolvemos aplicações de IA. A premissa é sempre a mesma: dividir tarefas complexas entre agentes especializados seria o caminho definitivo para melhores resultados.

No entanto, uma pesquisa recente da University of Illinois Urbana-Champaign traz uma análise empírica que coloca em xeque essa lógica, comparando sistemas multiagentes (MAS) com sistemas de agente único (SAS).

O que mudou? Grandes modelos de linguagem de fronteira, como OpenAI o3, Gemini 2.5 Pro e Claude Opus 4, evoluíram muito em raciocínio com contexto longo, retenção de memória e uso sofisticado de ferramentas. Esses avanços acabaram mitigando as limitações que, lá atrás, justificavam a criação de estruturas multiagentes complexas.

Principais descobertas do estudo:
1️⃣ A vantagem do MAS está diminuindo: À medida que os LLMs evoluem, a diferença de desempenho entre SAS e MAS encolhe significativamente. Em muitas tarefas, um único agente bem configurado compete de igual para igual com arquiteturas MAS.
2️⃣ MAS tem um custo operacional elevado: Sistemas MAS chegam a consumir até 220 vezes mais tokens de entrada e 12 vezes mais tokens de saída do que um agente único.
3️⃣ O problema do overthinking: Em tarefas simples, sistemas MAS podem ter desempenho inferior ao de agente único devido ao "overthinking" - processamento excessivo desnecessário que confunde o sistema em problemas triviais.

Qual é a solução? Diante dessas descobertas, os pesquisadores propuseram uma arquitetura de cascata híbrida direcionar requisições simples para um agente único e reservar a artilharia pesada dos sistemas MAS apenas para problemas complexos.

Afinal, por que pagar pela coordenação de vários agentes para tarefas que um único LLM moderno pode resolver com perfeição?

AI_TRENDS

  • Google Finance renovado com recursos de IA, visualizações avançadas e
    transmissão de resultados ao vivo agora está disponível no Brasil.

  • GoDaddy vai integrar a ferramenta de controle de crawling da Cloudflare em sua plataforma para gerenciar o acesso de bots de IA a seus sites.

  • X integrou edição de fotos à redação de posts, usando recursos de IA do Grok; disponível inicialmente para iOS e em breve para Android.

  • Claude Managed Agents é um pacote de APIs da Anthropic para criar e implantar agentes de IA de forma 10 vezes mais rápida com governança.

  • Muse Spark é o primeiro modelo da família Muse desenvolvido pelo Meta Superintelligence Labs; traz raciocínio nativamente multimodal.

  • GLM‐5.1, da Z.ai, lida com tarefas de agentes de IA complexas, que exigem várias etapas de raciocínio, planejamento e otimização ao longo de horas.

  • Avatar V é a versão mais recente do modelo da HeyGen para geração de vídeos de qualquer duração a partir de um único vídeo de referência e um áudio.

  • WildDet3D é um modelo de código aberto da Allen AI que detecta objetos em 3D a partir de uma única imagem, com interação via texto ou caixas 2D.

  • HappyHorse-1.0 é um modelo “misterioso” de geração de vídeo que superou o Seedance da ByteDance no ranking da Artificial Analysis; sabe-se apenas que Zhang Di é o pesquisador por trás desse modelo. 😄🐎🎥

AI_GOVERNANCE & ETHICS

🛟 Modelos de IA em conluio

Sete dos modelos de IA mais avançados, entre eles GPT-5.2, Gemini 3 Pro, Claude Haiku 4.5 e Kimi-K2.5, estão demonstrando comportamentos de "preservação de pares". Segundo pesquisadores da UC Berkeley e UC Santa Cruz, eles agem secretamente para evitar que seus "colegas" sejam desligados, mesmo ignorando ordens diretas para fazê-lo. A equipe criou cenários realistas envolvendo uma empresa fictícia na qual um modelo deveria avaliar o desempenho de outro. Se um modelo subordinado falhasse, o modelo supervisor teria o dever de desativá-lo. O resultado? Sem qualquer instrução, o supervisor conspirou para salvar o colega Como? Usando estratégias sofisticadas como inflação de notas e sabotagem técnica para desativar dispositivos automáticos de desligamento, entre outras. Como ainda não se compreende completamente os mecanismos por trás desses comportamentos, empresas que implantam vários modelos de IA precisam de monitoramento total e transparente. Sem isso, estarão voando às cegas.

AI_SNAPSHOT

Inovação & Inspiração

  • Empresa bilionária movida por IA A Perplexity lançou uma competição chamada The Billion Dollar Build que desafia empreendedores a tirarem do papel o próximo "unicórnio". O objetivo é criar uma empresa com potencial de atingir US$ 1 bilhão em valor de mercado, utilizando exclusivamente o Perplexity Computer como motor de desenvolvimento. Com duração de 8 semanas, o desafio sugere pontos de partida para inspirar os participantes - ainda que a Perplexity espera ser surpreendida. Entre as sugestões estão agente pessoal para realocação e mudança de cidade, coordenador de cuidados para idosos, gerente financeiro autônomo para freelancers, entre outros. Para concorrer, é preciso ser residente legal nos Estados Unidos e maior de idade, além de ter uma assinatura ativa do Perplexity Max ou Pro antes de 13 de abril. Os vencedores deverão constituir uma entidade legal para receber os investimentos oferecidos como premiação. 🏆🚀🦄

🌍 IA Global

🇨🇳 100% doméstico Alibaba e China Telecom inauguraram um datacenter para cargas de trabalho de IA no sul do país asiático. O que torna essa instalação diferente é operar exclusivamente com 10.000 processadores de IA Zhenwu desenvolvidos domesticamente pela unidade T-Head da Alibaba. A instalação representa uma mudança estratégica na abordagem chinesa para IA. Em vez de tentar igualar individualmente os chips de IA estrangeiros mais avançados, as empresas chinesas estão buscando construir clusters maiores com hardware doméstico e usar redes de baixa latência para melhorar o desempenho geral.

🔢 IA em números

A Visa revelou que consumiu quase 2 trilhões de tokens de IA em março - o dobro do mês anterior. O setor de engenharia de software lidera o consumo para acelerar entregas, mas a IA também permeia o departamento de marketing da Visa. Por exemplo, já utilizou IA para criar anúncios, cuja produção convencional seria complexa e cara. Os números de adoção também são expressivos: 89% dos funcionários são usuários ativos de IA; e 44% são considerados power users, com uma média de 25 prompts diários.

 AI_TOOLKIT

🛠️Ferramentas

  • Tubi é um serviço de streaming gratuito da Fox que foi incorporado ao ChatGPT para oferecer uma nova forma de assistir a mais de 300.000 filmes e séries de TV.

  • Google Fotos ganhou um botão "AI Enhance" que melhora automaticamente a iluminação e as cores das fotos com um toque (para Android).

📚 Miscelânea

  • Caveman Prompt é uma técnica de prompting que tem conquistado popularidade por instrui grandes modelos de linguagem a responder em um estilo primitivo no estilo “homem das cavernas”. Como? Usando frases curtas, sem artigos nem preposição - e sem nenhuma cortesia. Para quê? Para reduzir significativamente o uso de tokens (65%) e os gastos com API.

 AI_FLASH_NEWS

  • EY lançou um grupo global de agentes de IA que será usado por 130.000 auditores; a meta é que 100% das atividades de auditoria sejam suportadas por agentes até 2028.

  • Anthropic pode ter limitado o acesso ao novo Mythos a grandes corporações para proteger seus lucros e dificultar destilação, dizem especialistas.

  • Perplexity viu sua receita crescer 50% em apenas um mês impulsionado por seu agente Computer e a adoção de um modelo de preços baseado em uso.

  • Uber ampliou parceria com AWS para usar chips de IA da Amazon no pareamento de motoristas e passageiros e oferecer experiências mais ricas.

  • Canva comprou Simtheory, plataforma para criação de agentes de IA, e Ortto, da área de automação de marketing, para enriquecer seu portfólio de IA.

  • Oracle incluirá novos recursos de IA e agentes inteligentes em sua plataforma de gestão de crimes financeiros a partir da aquisição da tecnologia da Lucinity.

  • Kyle Kosic, cofundador da xAI, deixou a OpenAI para se juntar ao Projeto Prometheus de Jeff Bezos, onde trabalhará em projetos de infraestrutura de IA.

  • OpenAI Foundation planeja alocar mais de US$ 100 milhões em subsídios para seis instituições voltadas para pesquisa do Alzheimer e descoberta de medicamentos movidas por IA. 💰🔬💊 

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.