- IA Express
- Posts
- Qual é o mistério por trás da inconstância dos chatbots?
Qual é o mistério por trás da inconstância dos chatbots?
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você conhecerá um pouco mais da natureza caprichosa dos chatbots de IA e de como pesquisadores estão delineando um caminho da aleatoriedade na direção da confiabilidade dos modelos de IA. 𐦂𖨆𐀪𖠋⛙🎯
Porém isso não é tudo na IA Express de hoje:
- Sistema de IA do Google ajuda a desenvolver software para refinar hipóteses
- Dubladora de Lara Croft protesta contra uso da IA para alterar sua voz original
- Cientistas chineses criam modelo de linguagem semelhante ao cérebro
- Microsoft e OpenAI firmaram acordo provisório para rever a parceria
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
DE ALEATÓRIO À CONFIÁVEL
Qual é o mistério por trás da inconstância dos chatbots?
A experiência é familiar para qualquer um que tenha passado algum tempo com chatbots de IA como ChatGPT, Gemini ou Grok. Você faz uma simples pergunta, por exemplo, "Qual é a capital da França?" e recebe como resposta "Paris". Então repete a questão algum tempo depois - usando as mesmas palavras e as mesmas configurações – e o retorno é “Paris, a cidade das luzes!”. Como isso pode acontecer? Onde fica o determinismo dos grandes modelos de linguagem (LLMs)?

No mundo da IA, esse fenômeno se deve à falta de reprodutibilidade. Um estudo recente do Thinking Machines Lab investigou por que isso acontece e, mais importante, como eliminá-lo, já que obter a mesma saída a partir da mesma entrada é fundamental para quase tudo, especialmente em áreas de alto risco, como pesquisa científica ou tomada de decisão autônoma.
O que você precisa saber:
O indeterminismo dos LLMs acontece mesmo quando ajustamos sua “aleatoriedade” em zero (na linguagem da IA, esse é o parâmetro da temperatura).
Por que a falta de reprodutibilidade acontece? O bode expiatório mais provável é uma combinação entre concorrência (milhares de GPUs trabalhando em paralelo) e aritmética de ponto flutuante (a forma como os computadores lidam com números decimais). A ideia é que esses núcleos computacionais em paralelo concluam tarefas em ordens imprevisíveis e, como a matemática do ponto flutuante em computadores não é perfeita, pequenos erros de arredondamento se acumulam e geram resultados diferentes.
Está bem, a matemática de ponto flutuante é peculiar, mas não é completamente responsável por interferir na inferência da IA. Isso tem a ver com o o tamanho dos lotes (consultas empacotadas e processadas juntas). E é aqui que está o nó da questão - a maneira como os cálculos são feitos muda sutilmente de acordo com o tamanho dos lotes, desencadeando minúsculas mudanças.
Parece confuso? De fato, é algo sorrateiro. Pense que, em uma noite tranquila, sua consulta pode ser processada sozinha; já em horário de pico, se mistura com dezenas de outras, variando o tamanho dos lotes, e daí vem a inconstância.
A boa notícia? Esse não é um enigma insolúvel. A chave é tornar as principais operações matemáticas dos LLMs invariantes em lote. O Thinking Machines Lab compartilhou um repositório no GitHub para abordar o problema. Com esses ajustes, o mesmo prompt produzirá respostas idênticas todas as vezes. É uma pequena perda de desempenho em troca de ganhos significativos em confiabilidade.
AI_TRENDS
Stable Audio 2.5, da Stability AI, é um modelo de IA para produção de áudio em escala para uso comercial.
ElevenLabs apresentou a versão alfa do recurso Voice Remixing que reimagina aspectos da voz, como gênero, idade ou sotaque.
HunyuanImage 2.1 é o novo modelo da Tencent que equilibra desempenho e qualidade na geração nativa de imagens 2K ((2048×2048).
Qwen3-Next é baseado em uma nova arquitetura que proporciona alto desempenho tanto no treinamento quanto na inferência.
Novo ERNIE-4.5-21B-A3B se destaca na criação de conteúdo, raciocínio lógico, tarefas de matemática e programação, segundo a Baidu.
Agent 3, da Replit, cria, testa e corrige aplicativos de forma autônoma por ciclos de até 200 minutos sem intervenção manual.
Anthropic adicionou memória ao Claude para reduzir a necessidade de reexplicar o contexto; inicialmente disponível para planos Team e Enterprise.
Grammarly expandiu a assistência de escrita guiada por IA para cinco novo idiomas, entre eles português.
Sistema de IA do Google Research alimentado pelo Gemini ajuda a desenvolver software para testar e refinar hipóteses, acelerando a descoberta científica. 🔬📡
AI_GOVERNANCE & ETHICS
🔍Chatbots sobre escrutínio da FTC
A Federal Trade Commission (FTC) dos Estados Unidos deu início à investigação de chatbots de IA das empresas Alphabet (Google), Meta, OpenAI, xAI, Snap, Character Technologies, examinando potenciais riscos para crianças e adolescentes. O objetivo é avaliar com esses assistentes podem prejudicar jovens usuários com violações de privacidade, interações inadequadas ou outras questões de segurança. Também vai abordar práticas de monetização, uso de dados e esforços de conformidade para mitigar os danos. A investigação foi motivada por preocupações decorrentes de relatos de chatbots da Meta envolvidos em conversas inadequadas com crianças e de um caso de suicídio de adolescente relacionado com uso do ChatGPT da OpenAI.
🎙️ Dublagem alterada
A dubladora Françoise Cadol, voz de Lara Croft nas versões francesas de Tomb Raider IV-VI Remastered, entrou com uma notificação legal contra a editora Aspyr Media. A alegação é de que a Aspyr teria usado IA para alterar a performance original sem seu consentimento em um patch destinado a corrigir problemas de áudio. Cadol afirma que a voz resultante soa metalizada e sem entonação. Aspyr não comentou o caso publicamente.
AI_SNAPSHOT
💡 Inovação & Inspiração
Colocando cérebro para funcionar Cientistas da Academia Chinesa de Ciências criaram o SpikingBrain1.0, descrito como o primeiro grande modelo de linguagem (LLM) do mundo “semelhante ao cérebro”. A inovação imita as operações cerebrais ativando apenas neurônios relevantes e priorizando palavras contextualmente próximas, em vez de processar conjuntos de dados inteiros de uma só vez. O resultado? O modelo é de 25 a 100 vezes mais rápido do que os LLMs convencionais - exigindo menos de 2% de dado para treinamento e reduzindo significativamente o uso de energia e de recursos computacionais. 🧠💡
IA que lê pensamento A AlterEgo desenvolveu um dispositivo vestível (wearable) que dá aos usuários a capacidade de se comunicar articulando palavras silenciosamente – essencialmente “pensando em falar”. Como funciona? Detectando sinais neuromusculares no rosto e na garganta gerados quando verbalizamos internamente as palavras. Esses sinais são decodificados por software de aprendizado de máquina alimentado por IA e convertidos em comandos ou texto, que podem ser transmitidos para computadores ou outros dispositivos. 💭🧐
🌍 IA Global
🇺🇸 Sandbox para IA O senador Ted Cruz, presidente da Comissão de Comércio, Ciência e Transporte do Senado nos Estadas Unidos, apresentou um projeto de lei para criar uma ambiente de testes (sandbox) de IA dentro do Escritório de Políticas de Ciência e Tecnologia da Casa Branca - parte do amplo plano de Cruz para prioridades legislativas em torno da IA. Esse ambiente controlado permitiria testar sistemas de IA com isenções temporárias do cumprimento de certas normas regulatórias, acelerando a inovação com riscos sob controle.
🇦🇱 IA para combater corrupção A Albânia nomeou Diella, assistente de IA cujo nome tem origem na palavra albanesa que significa sol), como primeira ministra virtual responsável por supervisionar os contratos públicos. O anúncio foi feito pelo primeiro ministro Edi Rama durante a formação de seu quarto governo consecutivo. A Diella já vem auxiliando usuários no portal e-Albania desde janeiro e agora vai ajudar a eliminar a corrupção em concursos públicos, avaliando objetivamente as licitações e gradualmente assumindo a tomada de decisões dos ministérios do governo, garantindo que os processos sejam “100% livres de corrupção”.
🔢 IA em números
![]() |
|
AI_TOOLKIT
🛠️Ferramentas
📚 Miscelânea
Um estudo publicado no Findings of the Association for Computational Linguistics: ACL 2025 revela inconsistências significativas na forma como sete sistemas de moderação de conteúdo de IA detectam discurso de ódio. Sete foram os modelos testados. Confira a análise aqui.
AI_FLASH_NEWS
Inception Point AI produz 3 mil episódios por semana a um custo unitário de US$ 1, usando IA na automação de scripts, síntese de voz e edição.
Microsoft está ampliando investimentos em um cluster próprio de chips de IA, visando autossuficiência na criação de modelos de IA.
Alibaba e Baidu começaram a utilizar chips de desenvolvimento próprio para treinar modelos de IA, substituindo parcialmente os da NVIDIA.
Adobe lançou agentes de IA para ajudar empresas a aprimorarem as experiências de clientes e campanhas de marketing.
BlackLine lança Verity AI, conjunto de ferramentas de IA auditável voltado para equipes de finanças e contabilidade.
Math Inc. apresentou o agente de autoformalização Gauss para ajudar matemáticos na verificação formal de teoremas.
Encyclopedia Britannica e Merriam-Webster estão processando a Perplexity nos Estados Unidos por violação de direitos autorais e marcas registradas.
Microsoft e OpenAI firmaram um acordo provisório para reestruturação da OpenAI como empresa com fins lucrativos sob controle de sua entidade sem fins lucrativos (que terá participação acionária de US$ 100 bilhões). 🤝🪙
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊
