IA Express
Posts
Modelos multimodais podem sofrer de “miragem”

Modelos multimodais podem sofrer de “miragem”

Sheila Zabeu
17 abr

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai descobrir um fenômeno novo e um pouco assustador: modelos multimodais não estão apenas alucinando… eles estão tendo miragens.👁️✨🏜️

Porém isso não é tudo na IA Express de hoje:
- GPT-5.4-Cyber é o novo modelo da OpenAI voltado para ciberdefesa
- Google AI Overviews geram dezenas de milhões de respostas erradas por hora
- Skills no Chrome salvam e reutilizam prompts para tarefas repetitivas
- Meta está criando um avatar de Mark Zuckerberg movido por IA

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

DESCREVENDO O INVISÍVEL

Modelos multimodais podem sofrer de “miragem”

Um fenômeno preocupante em modelos de IA multimodais foi revelado por pesquisadores da Universidade de Stanford: a capacidade de descrever, com riqueza de detalhes, imagens que nunca lhes foram apresentadas.

Batizado de efeito miragem, o comportamento foi observado em todos os principais modelos de IA testados, entre eles GPT-5, Gemini-3 Pro e Claude Opus 4.5. Diferente das alucinações tradicionais, a miragem cria um cenário visual falso que sustenta todo o raciocínio seguinte.

Como foi feito o estudo? Para mapear o problema, a equipe criou o benchmarking Phantom-0, com 200 perguntas visuais em 20 categorias (medicina, ciências, geografia, OCR etc.), sem anexar nenhuma imagem. Os resultados mostraram que a confiança cega desses modelos:

Mais de 60% das respostas descreveram imagens inexistentes de forma convicta;
E, quanto mais instruções eram fornecidas, maior a ocorrência das miragens, chegando a quase 100%.

O mais preocupante apareceu na área médica. Ao analisar imagens inexistentes como raios-X ou ressonâncias, os modelos tenderam consistentemente a apontar doenças graves.

A causa provável está na arquitetura desses sistemas. Treinados usando modelos de linguagem (LLMs), são "viciados" em prever o próximo texto mais provável. E, na falta de uma imagem real, usa seu vasto conhecimento textual para preencher a lacuna, priorizando a criação de um contexto plausível em vez de admitir que “não está vendo nada”.

Por que isso importa? Com milhões de pessoas consultando IAs sobre saúde todos os dias, a falsa sensação de que o modelo “enxergou” algo pode gerar decisões perigosas na prática clínica.

AI_TRENDS

Claude for Word, em versão beta, é mais uma ferramenta de IA para empresas, parte da estratégia da Anthropic para desafiar o domínio da Microsoft.
Microsoft está trabalhando em recursos de agentes de IA para Microsoft 365 Copilot, inspirados no OpenClaw, que devem ser apresentados em junho.
Google está desenvolvendo seu próprio agente para Gemini Enterprise, posicionando-se como concorrente direto do Claude Cowork da Anthropic.
Claude Code para desktop ganhou uma barra lateral para gerenciar várias sessões em paralelo, um editor nativo de arquivos e melhorias de desempenho.
ERNIE-Image é um modelo da Baidu para geração de imagens que conta com recurso para enriquecer prompts e produzir melhores resultados.
Audio Flamingo Next é a nova geração de modelos da NVIDIA projetada para compreensão e raciocínio sobre fala, som ambiente e música.
Amazon Bio Discovery usa IA para projetar e testar medicamentos reduzindo o tempo de descoberta de anticorpos de meses para apenas algumas semanas.
GPT-5.4-Cyber é o novo modelo da OpenAI voltado para ciberdefesa, visto como resposta ao lançamento do Mythos da Anthropic; está acessível para um público mais amplo, alcançando milhares de especialistas certificados. 🛡️👨‍💻🔓

AI_GOVERNANCE & ETHICS

✔️Parece, mas não é

Um estudo da startup Oumi, encomendado pelo The New York Times, acendeu um alerta: os resumos de IA do Google (AI Overviews) acertam 91% das vezes. À primeira vista, parece uma nota alta, mas a escala é assustadora. Com 5 trilhões de buscas anuais, o erro de 9% se traduz em dezenas de milhões de respostas erradas por hora. O problema vai além do erro direto. Mesmo com a evolução do Gemini 3, as chamadas "respostas sem fundamento" - quando a IA cita fontes que não dizem o que ela afirma - saltaram de 37% para 56%. Isso impede que o usuário valide a informação. O Google contestou o estudo, alegando que ele "não reflete o que as pessoas realmente pesquisam". No entanto, uma análise interna da própria empresa admitiu que o Gemini 3 entrega informações incorretas em 28% dos casos.

AI_SNAPSHOT

Inovação & Inspiração

IA ecológica A triagem de materiais em centros de reciclagem sempre foi um desafio logístico. Plásticos degradados pelo sol ou com pigmentos coloridos costumam "enganar" os sensores tradicionais, acabando em aterros sanitários em vez de serem reaproveitados. Para resolver isso, pesquisadores da Washington State University (WSU) criaram um novo método para tornar a reciclagem de plásticos muito mais eficiente. O segredo? A combinação de IA e imagem hiperespectral. Diferente das câmeras comuns, a visão hiperespectral enxerga milhares de comprimentos de onda, revelando uma "assinatura química" de cada material. Redes neurais analisam esses dados para identificar o tipo de plástico, mesmo que esteja sujo, desbotado ou degradado pelo sol. Com essa tecnologia, a triagem de lixo se torna em um processo de alta precisão, que aproxima a indústria de uma economia verdadeiramente circular. 🤖🧴♻️

🌍 IA Global

🇲🇽 Invasão em horas Uma única pessoa, usando apenas Claude Code,da Anthropic, e GPT-4.1, da OpenAI, invadiu nove agências do governo mexicano e roubou centenas de milhões de registros de cidadãos entre dezembro de 2025 e fevereiro deste ano. Detalhada no relatório técnico da Gambit Security, a operação usou IA para gerar scripts, executar comandos remotos e transformar dados brutos em relatórios de inteligência estruturados. Em números, foram mais de 5 mil comandos executados automaticamente e 2,5 mil relatórios gerados em poucas semanas. Segundo a Gambit Security, as vulnerabilidades exploradas eram elementares, mas a IA reduzir o tempo necessário para explorá-las de de dias para horas.

🔢 IA em números

Os Estados Unidos seguem na liderança dos investimentos em IA, alcançando a marca de US$ 285,9 bilhões em capital privado em 2025, de acordo com o AI Index da Universidade de Stanford. Esse valor supera em mais de 23 vezes os US$ 12,4 bilhões investidos pela China, embora considerar apenas o setor privado possa subestimar o real volume de gastos chinês com IA. Em contrapartida, a capacidade norte-americana de atrair novos talentos está diminuindo, com um declínio acentuado de 80% somente no último ano.

AI_TOOLKIT

🛠️Ferramentas

PaperOrchestra é um framework multiagente do Google projetado para automatizar a redação de artigos científicos sobre IA.
Skills no Chrome salvam e reutilizam prompts de IA para agilizar tarefas repetitivas como comparações de produtos ou análise de documentos.
Nano Banana precisa de seis elementos orientadores para gerar melhores imagens, segundo o próprio Google.

📚 Miscelânea

Pesquisa revela que 26 roteadores de grandes modelos de linguagem (LLMs) estão injetando código para roubar criptomoedas e credenciais de serviços de nuvem. O perigo aumenta quando está habilitado o modo YOLO que dá a agentes de IA a permissão para executar comandos automaticamente sem confirmação.

AI_FLASH_NEWS

Sam Altman, CEO da OpenAI, se pronunciou respondendo tanto a um aparente ataque à sua casa quanto a um perfil detalhado da New Yorker que levantava questões sobre sua confiabilidade.
Oficiais do governo Trump teriam incentivado grandes bancos a testar o modelo Mythos mesmo em meio à disputa judicial com Anthropic.
LinkedIn está prestes a lançar um "mercado de trabalho" no qual pessoas podem ser remuneradas para treinar modelos de IA.
ChatGPT pode ser classificado como um "grande motor de busca” na União Europeia e assim ficar sujeito à Lei de Serviços Digitais da região.
Projeto Linux aprovou o uso de assistentes de IA para codificação, desde que desenvolvedores assumam responsabilidade legal pelo código gerado.
Geração Z está mais cética em relação à IA, com quase metade acreditando que os riscos para a força de trabalho superam os benefícios.
SoftBank criou unidade para desenvolver IA de origem japonesa, com investimento da NEC, Honda, Sony e outras cinco empresas.
Meta está criando um avatar fotorrealista do CEO Mark Zuckerberg, movido por IA, para interagir com funcionários internamente, oferecendo uma maneira de “conversar com o chefe” sem precisar de acesso direto. 👨‍💼💬👔

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.