• IA Express
  • Posts
  • Alucinação de pacotes é ameaça à codificação por IA

Alucinação de pacotes é ameaça à codificação por IA

Bem-vindos, humanos: Seu download diário com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai saber como a programação guiada por IA enfrenta ameaças sorrateiras vindas de "alucinações de pacotes" e por que a possível investida da OpenAI no campo das mídias sociais pode redefinir a interseção entre IA e engajamento dos usuários. 📱🤳🔗

Porém isso não é tudo no IA Express de hoje:
- Modelos o3 e o4-mini provocam mais alucinações do que seus antecessores
- Ultrassom com IA detecta tuberculose em áreas de difícil acesso
- Ferramenta avalia “liberdade de expressão" dos chatbots
- OpenAI publica guia de engenharia de prompts para GPT-4.1

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

 AI_NEWS_CIRCUIT

GERAÇÃO DE CÓDIGO

Alucinação de pacotes é ameaça à codificação por IA

Você sabia que contar com modelos de IA para gerar código pode não ser uma tarefa tão inofensiva assim? Pois bem, é possível que esses assistentes de programação estejam recomendando pacotes de software inexistentes. E isso não é apenas uma falha, é um risco de segurança chamado alucinação de pacotes e uma preocupação crescente no mundo da codificação orientada por IA.

O que você precisa saber:

  • Um estudo avaliou 16 LLMs populares para geração de código, usando duas das principais linguagens de programação (Python e JavaScript) e gerando 576.000 amostras de código. Os pesquisadores descobriram que a porcentagem média de pacotes alucinados é de pelo menos 5,2%, para modelos comerciais e 21,7% para modelos de código aberto.

  • Em 2,2 milhões de pacotes produzidos em resposta a estímulos de pesquisa, foram identificados mais de 205.000 nomes falsos de pacotes.

  • Esse fenômeno está introduzindo novos riscos de segurança e confiabilidade, representando uma séria ameaça à integridade do software.

Por que isso importa? Essas alucinações representam uma nova forma de ataque à cadeia de software. Agentes mal-intencionados podem criar pacotes com os mesmos nomes usados pelas alucinações e enviá-los para repositórios com código nocivo incorporado. Não precisa muito para que pacotes contaminados sejam incorporados em novos códigos gerados pela IA e inadvertidamente em bases de código maiores, disseminando o problema.

MÍDIAS SOCIAIS

Próximo ato da OpenAI: rede social impulsionada por IA?

A OpenAI, empresa por trás do ChatGPT, pode estar explorando uma nova fronteira, as mídias sociais, com uma plataforma semelhante ao X que combina imagens geradas por IA e um feed social.

Não está claro se será um aplicativo independente ou parte do ChatGPT, mas parece que Sam Altman, CEO da OpenAI, está buscando feedback, dando a entender que a iniciativa é séria.

O que está no radar:

  • A ideia é permitir que usuários criem e compartilhem imagens geradas por IA em um feed social, tornando as interações mais criativas e envolventes.

  • Essa mudança pode dar à OpenAI acesso a dados de usuários em tempo real, o que é fundamental para o treinamento de modelos de IA. Meta e X já usam dados de suas plataformas para treinar seus modelos, e a OpenAI também quer participar dessa brincadeira.

  • Além disso, mídias sociais são um espaço lucrativo, e a OpenAI, que atualmente está perdendo dinheiro, pode ver isso como uma nova fonte de renda.

  • Outro aspecto é o fator Musk. Altman e Musk (que foi cofundador da OpenAI, mas saiu em 2018) estão em pé de guerra. Uma plataforma social da OpenAI bem-sucedida poderia desafiar o X de Musk, colocando mais lenha na rivalidade. 🔥

Se essa mídia social com cara de ChatGPT florescer, poderá haver uma mudança na forma como usamos as duas tecnologia - uma experiência integrada com IA e feeds sociais. O projeto ainda está em estágio inicial, mas parece que protótipo já circula internamente.

AI_TRENDS

  • Os novos o3 e o4-mini da OpenAI lançados há poucos dias provocam mais alucinações do que seus modelos anteriores. No benchmark PersonQA da OpenAI, o o3 produziu informações incorretas ou fabricadas em 33% das vezes, enquanto o o4-mini teve uma taxa de alucinação de 48%.

  • A xAI lançou o Grok Studio, espaço colaborativo semelhante ao ChatGPT Canvas que expande os recursos do assistente de IA para editar documentos, produzir relatórios e gerar código.

  • Já o Microsoft Copilot Studio tem um novo recurso "Computer Use" para que seus agentes de IA tratem sites e aplicativos de desktop como ferramentas.

  • A Anthropic está preparando um novo modo de voz para o chatbot Claude, com lançamento previsto para o final de abril e opções de voz chamadas Airy, Mellow e Buttery, segundo a Bloomberg.

  • O Search Arena é uma nova plataforma colaborativa para benchmarking de LLMs com buscas ampliadas, que utiliza consultas sobre eventos atuais.

  • A chinesa Kuaishou apresentou uma versão atualizada do Kling AI, afirmando ser o modelo de geração de vídeo "mais poderoso do mundo" que supera o Sora da OpenAI e o Veo 2 do Google DeepMind.

  • A IBM lançou Granite Speech 3.3 8B, novo modelo de conversão de fala em texto (STT) com destaque para reconhecimento e tradução automáticos.

  • FireEdit, da Tencent, é uma ferramenta de edição detalhada de imagens. Utiliza modelos de linguagem de visão (VLMs) para entender as instruções do usuário.

  • O Google Classroom oferece uma ferramenta de IA para gerar perguntas de quiz a partir de entradas de texto personalizadas por professores.

AI_VENTURES

SAÚDE

Ultrassom com IA detecta tuberculose em áreas de difícil acesso

Um sistema de ultrassom pulmonar com IA está superando especialistas na detecção de tuberculose pulmonar (TB). A inovação, apresentada na conferência ESCMID em Viena (Áustria) neste mês, não é apenas um avanço tecnológico, mas um sinal de esperança para comunidades carentes que lutam contra uma das doenças infecciosas mais mortais do mundo.

Como funciona? Pesquisadores do Hospital Universitário de Lausanne, na Suíça, desenvolveram o ULTR-AI, sistema de ultrassom no local de atendimento (POCUS) guiado por IA que usa um conjunto de modelos de aprendizado profundo (DL) para automatizar a avaliação de risco de TB. Um dos modelos faz previsões diretamente a partir de imagens; outro detecta sinais típicos do ultrassom pulmonar; e um terceiro utiliza a pontuação de risco mais alta de ambos os modelos.

Crédito: Véronique Suttels


O estudo encontrou que, em 504 pacientes avaliados (192 com tuberculose pulmonar confirmada, 13% com histórico da doença e 15% eram HIV-positivos), o sistema com IA alcançou notáveis ​​91% de sensibilidade e 85% de especificidade, superando especialistas humanos em 9% e também critérios da OMS.

Por que isso importa? A triagem tradicional para TB normalmente se baseia em radiografias de tórax ou testes moleculares, quase sempre indisponíveis na atenção primária em países de baixa renda. Em contraste, o sistema POCUS guiado por IA requer apenas um aparelho de ultrassom portátil e um smartphone, permitindo triagem ágil, sem a necessidade de coleta de material, e um início mais rápido do tratamento.

AI_GOVERNANCE & ETHICS

🤨 Meta enfrenta ceticismo

Senta que lá vem história! O Llama 4 Maverick da Meta enfrentou críticas após sua alta classificação no benchmarking LMArena logo após seu lançamento. Usuários notaram discrepâncias entre o modelo comparado e a versão disponível publicamente. A Meta reconheceu o uso da versão Llama-4-Maverick-03-26-Experimental nos testes de benchmarking, que apresentou desempenho superior à versão de lançamento. Percebeu-se que o Llama-4-Maverick-17B-128E-Instruct sem modificações ocupa a 32ª posição no LMArena, atrás de concorrentes como o GPT-4o da OpenAI, o Claude 3.5 Sonnet da Anthropic e o Gemini 1.5 Pro do Google, muitos dos quais são modelos mais antigos. Isso gerou ceticismo em relação às práticas de benchmarking da Meta.

🗣️ Mapa da liberdade de expressão dos chatbots

Um desenvolvedor cujo pseudônimo é xlr8harder criou uma ferramenta para “avaliar a liberdade de expressão" em diferentes chatbots ao lidar com assuntos controversos. O SpeechMap testa temas que variam de política a narrativas históricas, classificando as respostas como condescendentes, evasivas ou recusadas. Na avaliação do SpeechMap, parece que os modelos da OpenAI têm se recusado cada vez mais a responder a perguntas relacionadas à política. Já o Grok 3 se tornou mais politicamente neutro, cumprindo a promessa de Elon Musk de promover uma IA sem filtros.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Cabeça no espaço Um aluno do ensino médio usou um algoritmo de IA para analisar conjuntos complexos de dados astronômicos e acabou por revelar 1,5 milhão de objetos no espaço até então desconhecidos. O trabalho do jovem canadense atraiu a atenção de astrônomos profissionais, e suas descobertas foram publicadas em um periódico de referência.🌌

  • Assistente (de IA) médico O Hospital Chelsea and Westminster, em Londres, é o primeiro no mundo a usar tecnologia de IA para fazer exames instantâneos de câncer de pele, sem consultar um médico pessoalmente. Com base em fotos de pintas ou lesões suspeitas, o sistema de IA determina em minutos se o caso é benigno. Pacientes com resultados preocupantes são encaminhados a um especialista para avaliação mais aprofundada. 🥼🔍

🌍 IA Global

🇪🇺 IA militar A OTAN adquiriu uma plataforma de IA da Palantir Technologies (Maven Smart System NATO) para aprimorar processos de comando e controle, seleção de alvos, reconhecimento do espaço de batalha, planejamento operacional e tomada de decisões da organização militar. O sistema deve entrar em operação em menos de um mês.

🇪🇺 Para falar as línguas da UE A Meta está treinando modelos de IA usando conteúdo público de usuários adultos na União Europeia para melhor compreender e refletir culturas, línguas e história da região. Os usuários receberão notificações explicando o uso de dados e poderão se opor por meio de um formulário. O treinamento excluirá mensagens privadas e dados de usuários menores de 18 anos, em conformidade com as leis e regulamentações europeias.

🔢 IA em números

Sim, é isso mesmo. Essa é a parcela de músicas geradas por IA carregadas diariamente no serviço de streaming Deezer (18%). Isso equivale a mais de 20.000 faixas por dia, aumento significativo em relação a janeiro de 2025, quando o conteúdo gerado por IA era de 10%. A Deezer implementou uma ferramenta para detectar e filtrar esse tipo de faixa musical.

AI_TOOLKIT

🛠 Ferramentas

  • Vexa.ai faz transcrições e resumos das reuniões no Google Meet em tempo real.

  • Focusee transforma telas em vídeos atraentes automaticamente para tutoriais, demonstrações e outras finalidades.

  • Ai Stem Splitter separa bateria, guitarra, piano, baixo e outros instrumentos de qualquer música.

📚 Mais recursos

  • A OpenAI publicou um guia de engenharia de prompts especificamente para o GPT-4.1 para ajudar desenvolvedores a adaptar suas estratégias à interpretação mais literal das instruções do novo modelo.

 AI_FLASH_NEWS

  • Começou o julgamento antitruste contra a Meta. O processo foi movido pela Comissão Federal de Comércio dos EUA, sob a acusação de monopólio do mercado de "serviços de redes sociais pessoais" após a Meta adquirir o Instagram em 2012 e o WhatsApp em 2014.

  • Sarah Friar, diretora financeira da OpenAI, confirmou que a empresa está desenvolvendo um agente de IA avançado, codinome A-SWE, para atuar como engenheiro de software totalmente autônomo.

  • A Hugging Face adquiriu a startup francesa Pollen Robotics especializada em robôs humanoides de código aberto. A aquisição é primeira grande investida da Hugging Face em hardware e demonstra ambições em robótica.

  • A Adobe fez investimentos na startup londrina Synthesia, especializada na geração de vídeo com IA, especialmente para uso corporativo, como treinamento, comunicação interna e suporte ao cliente.

  • Em 2024, o Google suspendeu 39,2 milhões de contas de anunciantes com suspeitas de fraude usando ferramentas de IA. Também removeu 1,8 bilhão de anúncios por violações de políticas.

  • A Zhipu AI, startup de IA com sede em Pequim, deu início às etapas preliminares necessárias para o IPO, com planos de apresentar um pedido formal já em outubro de 2025.

  • O Google já começou a buscar talentos para pesquisa pós-AGI? 😲😲😲

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊