• IA Express
  • Posts
  • Solução da NVIDIA usa contexto para treinamento de modelos em tempo real

Solução da NVIDIA usa contexto para treinamento de modelos em tempo real

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você conhecerá a proposta da NVIDIA para deixar de ampliar as janelas de contexto dos chatbots e começar a usá-las para treinar os modelos em tempo real. 🪟💬🧠

Porém isso não é tudo na IA Express de hoje:
- Google revela protocolo para facilitar tarefas de compra dos agentes de IA
- Elon Musk saiu em defesa do Grok diante de polêmica
- Índia busca parceria com NVIDIA para nacionalizar produção de GPUs
- OpenAI adquire startup Torch da área de saúde para unificar dados médicos

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

PESQUISA

Solução da NVIDIA usa contexto para treinamento de modelos em tempo real

Uma das limitações mais persistentes dos grandes modelos de linguagem (LLMs) está prestes a ser superada: a gerência de extensas janelas de contexto, por exemplo, com longos relatórios, bases de código ou simples históricos de conversas. Pesquisadores da NVIDIA propuseram um novo paradigma que deixa de lado a simples expansão das janelas para tratar o contexto diretamente como dados de treinamento.

Durante a fase de treinamento, os LLMs demonstram uma capacidade impressionante de compressão, condensando terabytes de texto em bilhões de parâmetros (pesos). A nova estrutura denominada Test-Time Training End-to-End (TTT-E2E) aplica essa mesma lógica durante o uso do modelo. Em vez de apenas processar e manter o contexto em uma memória temporária, o modelo o comprime dinamicamente em novos pesos.

Como funciona? O TTT-E2E muda o foco do armazenamento para compactação. Pense nisso como a memória humana - nosso cérebro não armazena cada segundo de experiência, mas filtra e condensa vivências em memórias essenciais.

O TTT-E2E faz exatamente isso: o modelo não estará apenas processando a entrada, mas também realizando uma minissessão de treinamento instantânea - e compactando os dados!

Por que isso importa? O grande gargalo dos LLMs atuais é manter a coerência em textos longos sem que o custo computacional e a latência disparem. O TTT-E2E oferece um caminho para manter o custo por token constante, preservando a precisão preditiva mesmo em grande escala. E emulando uma das soluções mais elegantes da humanidade – a compressão neural.

AI_TRENDS

  • Do Anything liberou o acesso à versão alfa de agentes de IA para operação autônoma de longo prazo, que trabalham por semanas ou meses.

  • Qwen3-VL-Embedding e Reranker são os novos modelos da Alibaba que unificam texto, imagem e vídeo em uma pesquisa multimodal.

  • Niji V7 é o mais recente modelo de geração de imagens especializado em anime da Midjourney com melhor consistência de personagens.

  • Z.ai, que estreou na Bolsa de Valores de Hong Kong recentemente, anunciou que está treinando seu próximo modelo GLM-5.

  • GPT-5.2 ajudou a resolver o problema de Erdős #728, conjectura matemática aberta sobre divisibilidade fatorial.

  • Google revelou o Protocolo de Comércio Universal (UCP) para facilitar o fluxo de trabalho dos agentes de IA na jornada de compras, da descoberta de produtos ao pós-venda. 🏷️🛍️💲

AI_GOVERNANCE & ETHICS

🗣Rebatendo críticas

Elon Musk saiu em defesa do Grok, modelo de IA integrada ao X, após um onda de críticas sobre a geração de imagens sexualizadas de mulheres e crianças publicadas automaticamente no X. A polêmica escalou rapidamente no Reino Unido, onde autoridades locais acusaram a plataforma de violar a Lei de Segurança Online, chegando a ameaçar o bloqueio da plataforma X no país. Para sustentar seu argumento, Musk usou o próprio X para compartilhar comparativos de imagens geradas pelo Grok, pelo ChatGPT e pelo Gemini (a partir do mesmo prompt. Ao demonstrar que os três geraram resultados semelhantes, Musk alegou que as críticas não passam de tentativa de censura. Como medida de controle, a xAI - startup da Musk responsável pelo Grok - já restringiu as funções de geração e edição de imagens exclusivamente a assinantes de planos pagos do X.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • McLanche mais do que feliz Em 2026, o McDonald's planeja transformar seu serviço de drive-thru com a ajuda da Inteligência Artificial. Depois de uma tentativa inicial com a IBM em 2024, a gigante do fast-food volta a apostar na tecnologia de chatbots de voz para atender pedidos, desta vez em parceria com Google Cloud. E a modernização vai além do atendimento: o sistema contará com balanças inteligentes para evitar erros na entrega, e geolocalização para avisar a cozinha sobre a chegada do cliente permitindo que o preparo comece no melhor momento exato. Por enquanto, as novidades serão implantadas apenas nos Estados Unidos. 🚗🍔🍟

🌍 IA Global

🇮🇳 Hub tecnológico Após a expansão bem-sucedida da manufatura local da Apple na Índia, o governo indiano agora busca uma parceria estratégica com a NVIDIA para nacionalizar a produção de GPUs e hardware de IA. A iniciativa é parte de um ambicioso roteiro tecnológico que prevê o desenvolvimento de projetos próprios de GPU nos próximos quatro anos, possivelmente utilizando arquiteturas de código aberto ou tecnologias licenciadas para acelerar o processo. É um passo decisivo para transformar o país em uma referência mundial e um hub estratégico para a indústria de IA.

📢 IA em uma frase

“Isso parece concentração de poder excessiva para o Google, considerando que também controla Android e Chrome.”

A frase é de Elon Musk, criticando o acordo bilionário entre Apple e Google para integrar o modelo Gemini aos futuros recursos da Apple Intelligence, entre elas a futura versão do assistente Siri prevista para março ou abril de 2026.

 AI_TOOLKIT

🛠️Ferramentas

  • Nextify é um plataforma one-stop movida por IA para cria anúncios, desde a ideia ao vídeo pronto para publicar.

  • Crystal Video Upscaler aumenta a resolução de vídeos de forma otimizada para retratos, faces e produtos.

  • Cowork é um novo recurso do Claude para não-desenvolvedores que conclui tarefas baseadas em arquivos de forma autônoma.

📚 Miscelânea

 AI_FLASH_NEWS

  • OpenAI adquiriu a startup Torch da área de saúde com apenas um ano de existência, integrando a tecnologia para unificar dados médicos.

  • Anthropic lançou Claude for Healthcare para propósitos médicos e mais recursos para apoiar desde ensaios clínicos a tarefas regulatórias.

  • Google removeu alguns resumos gerados por AI Overviews após investigação do The Guardian apontando informações de saúde equivocadas.

  • Walmart permitirá a realização de compras diretamente no aplicativo Gemini usando novo protocolo UCP do Google (inicialmente nos Estados Unidos).

  • Honeywell criou, em conjunto com Google Cloud, uma plataforma de varejo baseada em IA para aprimorar a experiência de compra nas lojas.

  • AstraZeneca adquiriu a Modella AI, startup com sede em Boston especializada em modelos de IA para oncologia.

  • NVIDIA contratou o primeiro diretor de marketing da sua história. É Alison Wagonfeld, ex-vice-presidente de marketing do Google Cloud.

  • Primeira edição do programa Esporte Record de 2026 marcou a estreia de Toninho da ResenhIA, comentarista de futebol criado por IA. ⚽🎤🗣️

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊