IA Express
Posts
Indo além do próximo token para acelerar chatbots

Indo além do próximo token para acelerar chatbots

Sheila Zabeu
13 ago

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Na edição de hoje, você saberá como uma nova estrutura proposta pela Apple ajuda chatbots a responder mais rapidamente pensando alguns tokens à frente. Também conhecerá a abordagem "Aprendizado Guiado" do Google Gemini que transforma respostas simples em momentos "aha!" 🖊️📖🕵️

Porém isso não é tudo na IA Express de hoje:
- GLM-4.5V é apontado como melhor modelo de raciocínio visual de código aberto
- Novo GPT-5 da OpenAI tem início de vida turbulento no mundo real
- IA ajuda a reduzir contaminação em material enviado para reciclagem
- Ex-pesquisador da OpenAI arrecada US$ 1,5 bilhão para investimentos em IA

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

PESQUISA

Indo além do próximo token para acelerar chatbots

Pesquisadores da Apple apresentaram uma nova maneira para acelerar as repostas dos grandes modelos de linguagem (LLMs) sem perder a qualidade. Como? Indo além do próximo token.

LLMs convencionais usam um método "autoregressivo", por meio do qual cada nova “palavra” ou token é gerado com base no anterior. Embora ótimo para treinamento, essa técnica explora correlações entre os elementos sequenciais, mas pode ser lenta, especialmente para respostas longas. Pense nisso como uma pessoa escrevendo uma frase, uma letra de cada vez, em vez de pensar em toda a frase primeiro.

Qual é a novidade? A nova estrutura, chamada Multi-Token Prediction (MTP), permite que LLMs prevejam várias tokens ao mesmo tempo. Para fazer isso funcionar, os pesquisadores desenvolveram algumas inovações, descritas de modo simplificado a seguir:

Entrada por máscaras: Em vez de gerar um token de cada vez, o modelo é treinado para prever vários tokens futuros de uma só vez usando "máscaras" especiais de tokens.
Uma técnica chamada Gated LoRA garante que o novo processo de ajuste fino não prejudique a capacidade original do LLM de gerar texto de alta qualidade.
Um módulo do tipo sampler ajuda a garantir que os tokens previstos formem uma sequência coerente e lógica.
Para evitar erros, o modelo usa um processo de verificação (geração especulativa) para verificar se os tokens gerados são válidos, semelhante ao que o LLM teria produzido normalmente.

Crédito: Apple

Quais foram os resultados? Em tarefas exigentes, como gerar código e resolver problemas de matemática, o novo método chegou a ser até cinco vezes mais rápido. Para tarefas como conversar e responder perguntas, o ganho foi de quase duas vezes e meia. E o melhor, a maior velocidade foi alcançada sem perda de qualidade.

EDUCAÇÃO

Gemini leva estudantes de respostas simplificadas ao "aha!"

Já parou para pensar que a Inteligência Artificial pode ir além do que simplesmente dar respostas para se tornar uma parceiro no processo de aprendizagem? É exatamente essa a proposta do Guided Learning (Aprendizado Guiado) desenvolvido pelo Google como base nos novos modelos LearnLM e adicionado ao chatbot do Gemini.

O Aprendizado Guiado atua como um tutor pessoal que usa perguntas abertas para despertar curiosidade e pensamento crítico e fazer o aluno chegar aos seus próprios momentos de descoberta do tipo “a-ha“. O processo divide assuntos complexos em passos gerenciáveis, adaptando-se ao ritmo e às necessidades de cada pupilo. 🧑‍🎓

E o processo de aprendizado não se restringe somente a texto. É um trabalho multimodal, com respostas ricas que incluem diagramas, imagens, vídeos e até questionários interativos.

Crédito: Google

O Aprendizado Guiado foi desenvolvido com a ajuda de educadores e alunos, garantindo que o resultado se tornasse em um espaço de conversação para exploração. É mais do que um recurso; é uma nova maneira de aprender com a IA.

AI_TRENDS

Grok 4 está disponível gratuitamente para todos - mas por tempo limitado e com restrições de uso.
Outra novidade: usando o Grok, agora você pode transformar qualquer imagem no X em um vídeo simplesmente com um clique longo sobre ela.
NuMarkdown-8B-Thinking é um modelo de raciocínio de código aberto projetado para tarefas de OCR (reconhecimento óptico de caracteres).
Speech 2.5, da MiniMax, transforma texto em fala usando clonagem de voz realista que preserva detalhes de sotaque, idade, emoção e voz.
Alibaba lançou Qwen3-4B-Instruct-2507 para tarefas de uso geral com respostas eficientes e Qwen3-4B-Thinking-2507 de raciocínio avançado.
Xiaomi tem um novo modelo de voz MiDashengLM-7B otimizado para sistemas para automóveis e dispositivos domésticos inteligentes.
Recurso de geração de imagens por prompt do Bing agora pode usar o modelo GPT-4o da OpenAI.
Ideogram liberou uma API para que desenvolvedores integrem recursos de personagens em seus projetos.
Google está testando uma nova versão do Google Finance com recursos de IA com respostas incluindo gráficos e links para fontes relevantes.
Roblox abriu o código do Sentinel, sistema de IA que detecta possíveis padrões de exploração infantil dentro de bate-papos on-line.
GLM-4.5V, da Z.ai, é apontado como melhor modelo de raciocínio visual de código aberto, dominando em 41 sistemas de benchmarking. Faz análises sofisticadas de imagens, cenas, vídeos, gráficos e interfaces. Teste-o aqui. 👀🧠

AI_GOVERNANCE & ETHICS

⛈️ Início turbulento para GPT-5

Um dia após o lançamento, Sam Altman, CEO da OpenAI, reconheceu que há problemas no novo GPT-5, como falhas no roteador de modelos, mau desempenho e confusão de usuários. Em resposta aos percalços, a OpenAI restabeleceu o acesso a modelos anteriores, como o GPT-4o, para assinantes do ChatGPT Plus, permitindo que eles optem por não usar o GPT-5. Usuários relataram erros em tarefas de matemática, lógica e codificação, e desenvolvedores observaram as fraquezas do GPT-5 em comparação com rivais como o Claude Opus 4.1 da Anthropic. Em outra publicação no X, Altman também admitiu que muitas vezes desempenho bruto não é tudo e que a OpenAI subestimou o quanto as pessoas gostam de algumas coisas no GPT-4o, mesmo que o GPT-5 tenha um desempenho melhor em muitos aspectos. Concluiu que o principal desafio será equilibrar superioridade técnica com experiência do usuário e que a OpenAI pretende oferecer experiências mais personalizadas, embora esse seja um objetivo de longo prazo. Por enquanto, o foco estará em estabilizar o novo GPT-5 para depois fazer as primeiras mudanças para tornar o modelo mais receptivo.

📝 Inimigo oculto

Simplesmente ler um documento compartilhado por outra pessoa agora pode ser um ato inseguro. Em um prova de conceito, pesquisadores da Zenity demonstraram o que pode acontecer. Um documento contendo um prompt invisível (texto branco, tamanho de fonte minúsculo) é compartilhado no Google Drive com a devida permissão. Ao tentar, por exemplo, resumir tal documento usando o recurso Connectors da OpenAI - que vincula o ChatGPT, ao Google Drive -, a vítima aciona ingenuamente o prompt oculto. Além de fazer o resumo, o prompt pode ordenar o ChatGPT a pesquisar o Google Drive da vítima em busca de dados confidenciais e enviá-los a um servidor externo. Esse ataque do tipo clique zero não exige nenhuma interação além de receber o documento e usá-lo como a vítima sempre faria.

AI_SNAPSHOT

💡 Inovação & Inspiração

IA educacional Tacoma (Washington, EUA) está se voltando para IA para enfrentar um desafio persistente: contaminação na reciclagem residencial. Com um projeto-piloto de dois anos, a cidade está testando câmeras inteligentes montadas em caminhões de reciclagem que escaneiam materiais coletados em busca de itens não recicláveis. Ao detectar algum contaminante, como um saco plástico não reciclável, o sistema, desenvolvido pela canadense Prairie Robotics, envia uma correspondência educacional para o endereço do residente, com uma imagem do item em questão. 🚍୧⍤⃝📷
Saúde nas alturas Google e NASA se uniram para testar um assistente de IA que ajuda astronautas a diagnosticar e tratar sintomas de forma autônoma durante as missões no espaço, quando a comunicação em tempo real com a Terra é um desafio. Treinado com extensa literatura de voos espaciais, o Crew Medical Officer Digital Assistant (CMO-DA) usa processamento de linguagem natural e aprendizado de máquina para analisar sintomas relatados pelo astronauta e fornecer um diagnóstico detalhado e plano de tratamento. Nos primeiros testes, o CMO-DA apresentou resultados promissores em termos de confiabilidade. Por que isso importa? Embora desenvolvida para o espaço, a tecnologia também poderá gerar benefícios aqui na Terra, ao oferecer cuidados médicos de qualidade em áreas remotas ou carentes.🧑‍🚀👨‍⚕️

🌍 IA Global

🇰🇷 Para entrar na corrida A Coreia do Sul lançou uma iniciativa nacional voltada à IA para competir com Estados Unidos e China e criar um setor quase autossuficiente usando tecnologias domésticas como semicondutores e software. O Ministério da Ciência e Tecnologia sul-coreano selecionou cinco consórcios, liderados por grandes empresas como SK Telecom, LG e Naver, para desenvolver capacidade em toda a pilha de IA, de semicondutores a software. O esforço certamente enfrentará desafios para competir com líderes globais. No entanto, se for bem-sucedido, a Coreia do Sul não apenas atenderá às demandas domésticas, mas poderá se tornar um exportador, como alternativa no cenário mundial de IA.

🇺🇸 Jogos de guerra com IA O Laboratório de Física Aplicada (APL) da Universidade Johns Hopkins está desenvolvendo para o Departamento de Defesa dos Estados Unidos versões inteligentes das ferramentas de jogos de guerra GenWar e Strategic AI Gaming Engine (SAGE). Jogos de guerra tradicionais têm sido essenciais para a tomada de decisões do Pentágono, mas incluem métodos trabalhosos, que muitas vezes exigem semanas de preparação ou horas de jogo. Com a IA entrando em cena, um chatbot de IA traduzirá comandos simples em linguagem natural em parâmetros de simulação precisos no caso do GenWar, reduzindo o tempo de meses para minutos a configuração de simulações de alta fidelidade já existentes. Para o SAGE, que simula uma reunião do Conselho de Segurança Nacional para discutir um plano de ação, chatbots poderão assumir o papel de todos ou de alguns participantes do jogo.

📢 IA em uma frase

“Modelos como Gemini ganham medalha de ouro na Olimpíada Internacional de Matemática, mas às vezes não conseguem resolver problemas básicos de matemática do ensino médio.”

Usando um trocadilho, Demis Hassabis, CEO do Google DeepMind, afirmou que estamos no estágio da AJI (Artifcial Jagged Intelligence), apontando a inconsistência como importante obstáculo no caminho da AGI (Artificial General Intelligence).

AI_TOOLKIT

🛠️Ferramentas

AvatarTalk gera vídeos de avatar de alta qualidade em segundos com uma única chamada de API.
Endex é um agente de IA para operar nativamente dentro do Microsoft Excel e ajudar na modelagem financeira e na análise de dados.
Beatoven ajuda a criar música de fundo a partir de prompts de IA.

📚 Miscelânea

Comparação técnica entre dois modelos baseados na arquitetura Mixture-of-Experts (MoE) lançados recentemente: Qwen3 30B-A3B da Alibaba (lançado em abril de 2025) e GPT-OSS 20B da OpenAI (lançado em agosto de 2025).

AI_FLASH_NEWS

NVIDIA e AMD concordaram pagar ao governo dos Estados Unidos 15% da receita gerada pelas vendas de chips de IA à China em troca das licenças de exportação de semicondutores.
Tesla vai se concentrar em chips AI5 e AI6 para treinamento de sistemas de IA, que servirão como sucessores do Projeto Dojo de supercomputador.
Elon Musk disse no X que já é hora de abrir o código do Grok 2.
NVIDIA revelou uma série de ferramentas e tecnologias para acelerar o desenvolvimento da nova geração de robôs inteligentes.
Apple está enfrentando um êxodo de pesquisadores de IA de nível sênior em meio ao que tem sido descrito como “crise de confiança” na empresa.
Leopold Aschenbrenner, ex-pesquisador da OpenAI de 23 anos, arrecadou mais de US$ 1,5 bilhão para um fundo de investimentos com foco em IA.
Thomas Dohmke deixará o cargo de CEO do GitHub para se dedicar à sua própria startup; GitHub será integrado ao departamento CoreAI da Microsoft.
O modelo o3 da OpenAI levou o troféu do primeiro torneio de xadrez da Kaggle Game Arena AI, em um jogo de recuperação tática. O vice foi o Grok 4 da xAI, e o terceiro lugar ficou com o Gemini 2.5 Pro do Google. 🏆👑

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.