IA Express
Posts
Solução da NVIDIA usa contexto para treinamento de modelos em tempo real

Solução da NVIDIA usa contexto para treinamento de modelos em tempo real

Sheila Zabeu
16 jan

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você conhecerá a proposta da NVIDIA para deixar de ampliar as janelas de contexto dos chatbots e começar a usá-las para treinar os modelos em tempo real. 🪟💬🧠

Porém isso não é tudo na IA Express de hoje:
- Google revela protocolo para facilitar tarefas de compra dos agentes de IA
- Elon Musk saiu em defesa do Grok diante de polêmica
- Índia busca parceria com NVIDIA para nacionalizar produção de GPUs
- OpenAI adquire startup Torch da área de saúde para unificar dados médicos

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

PESQUISA

Solução da NVIDIA usa contexto para treinamento de modelos em tempo real

Uma das limitações mais persistentes dos grandes modelos de linguagem (LLMs) está prestes a ser superada: a gerência de extensas janelas de contexto, por exemplo, com longos relatórios, bases de código ou simples históricos de conversas. Pesquisadores da NVIDIA propuseram um novo paradigma que deixa de lado a simples expansão das janelas para tratar o contexto diretamente como dados de treinamento.

Durante a fase de treinamento, os LLMs demonstram uma capacidade impressionante de compressão, condensando terabytes de texto em bilhões de parâmetros (pesos). A nova estrutura denominada Test-Time Training End-to-End (TTT-E2E) aplica essa mesma lógica durante o uso do modelo. Em vez de apenas processar e manter o contexto em uma memória temporária, o modelo o comprime dinamicamente em novos pesos.

Como funciona? O TTT-E2E muda o foco do armazenamento para compactação. Pense nisso como a memória humana - nosso cérebro não armazena cada segundo de experiência, mas filtra e condensa vivências em memórias essenciais.

O TTT-E2E faz exatamente isso: o modelo não estará apenas processando a entrada, mas também realizando uma minissessão de treinamento instantânea - e compactando os dados!

Por que isso importa? O grande gargalo dos LLMs atuais é manter a coerência em textos longos sem que o custo computacional e a latência disparem. O TTT-E2E oferece um caminho para manter o custo por token constante, preservando a precisão preditiva mesmo em grande escala. E emulando uma das soluções mais elegantes da humanidade – a compressão neural.

AI_TRENDS

Do Anything liberou o acesso à versão alfa de agentes de IA para operação autônoma de longo prazo, que trabalham por semanas ou meses.
Qwen3-VL-Embedding e Reranker são os novos modelos da Alibaba que unificam texto, imagem e vídeo em uma pesquisa multimodal.
Niji V7 é o mais recente modelo de geração de imagens especializado em anime da Midjourney com melhor consistência de personagens.
Z.ai, que estreou na Bolsa de Valores de Hong Kong recentemente, anunciou que está treinando seu próximo modelo GLM-5.
GPT-5.2 ajudou a resolver o problema de Erdős #728, conjectura matemática aberta sobre divisibilidade fatorial.
Google revelou o Protocolo de Comércio Universal (UCP) para facilitar o fluxo de trabalho dos agentes de IA na jornada de compras, da descoberta de produtos ao pós-venda. 🏷️🛍️💲

AI_GOVERNANCE & ETHICS

🗣️Rebatendo críticas

Elon Musk saiu em defesa do Grok, modelo de IA integrada ao X, após um onda de críticas sobre a geração de imagens sexualizadas de mulheres e crianças publicadas automaticamente no X. A polêmica escalou rapidamente no Reino Unido, onde autoridades locais acusaram a plataforma de violar a Lei de Segurança Online, chegando a ameaçar o bloqueio da plataforma X no país. Para sustentar seu argumento, Musk usou o próprio X para compartilhar comparativos de imagens geradas pelo Grok, pelo ChatGPT e pelo Gemini (a partir do mesmo prompt. Ao demonstrar que os três geraram resultados semelhantes, Musk alegou que as críticas não passam de tentativa de censura. Como medida de controle, a xAI - startup da Musk responsável pelo Grok - já restringiu as funções de geração e edição de imagens exclusivamente a assinantes de planos pagos do X.

AI_SNAPSHOT

💡 Inovação & Inspiração

McLanche mais do que feliz Em 2026, o McDonald's planeja transformar seu serviço de drive-thru com a ajuda da Inteligência Artificial. Depois de uma tentativa inicial com a IBM em 2024, a gigante do fast-food volta a apostar na tecnologia de chatbots de voz para atender pedidos, desta vez em parceria com Google Cloud. E a modernização vai além do atendimento: o sistema contará com balanças inteligentes para evitar erros na entrega, e geolocalização para avisar a cozinha sobre a chegada do cliente permitindo que o preparo comece no melhor momento exato. Por enquanto, as novidades serão implantadas apenas nos Estados Unidos. 🚗🍔🍟

🌍 IA Global

🇮🇳 Hub tecnológico Após a expansão bem-sucedida da manufatura local da Apple na Índia, o governo indiano agora busca uma parceria estratégica com a NVIDIA para nacionalizar a produção de GPUs e hardware de IA. A iniciativa é parte de um ambicioso roteiro tecnológico que prevê o desenvolvimento de projetos próprios de GPU nos próximos quatro anos, possivelmente utilizando arquiteturas de código aberto ou tecnologias licenciadas para acelerar o processo. É um passo decisivo para transformar o país em uma referência mundial e um hub estratégico para a indústria de IA.

📢 IA em uma frase

“Isso parece concentração de poder excessiva para o Google, considerando que também controla Android e Chrome.”

A frase é de Elon Musk, criticando o acordo bilionário entre Apple e Google para integrar o modelo Gemini aos futuros recursos da Apple Intelligence, entre elas a futura versão do assistente Siri prevista para março ou abril de 2026.

AI_TOOLKIT

🛠️Ferramentas

Nextify é um plataforma one-stop movida por IA para cria anúncios, desde a ideia ao vídeo pronto para publicar.
Crystal Video Upscaler aumenta a resolução de vídeos de forma otimizada para retratos, faces e produtos.
Cowork é um novo recurso do Claude para não-desenvolvedores que conclui tarefas baseadas em arquivos de forma autônoma.

📚 Miscelânea

Pesquisadores da Anthropic afirmam que agentes de codificação estão se tornando "universais” por meio das chamadas "skills modulares” e que não é preciso proliferar agentes especializados para cada função específica.

AI_FLASH_NEWS

OpenAI adquiriu a startup Torch da área de saúde com apenas um ano de existência, integrando a tecnologia para unificar dados médicos.
Anthropic lançou Claude for Healthcare para propósitos médicos e mais recursos para apoiar desde ensaios clínicos a tarefas regulatórias.
Google removeu alguns resumos gerados por AI Overviews após investigação do The Guardian apontando informações de saúde equivocadas.
Walmart permitirá a realização de compras diretamente no aplicativo Gemini usando novo protocolo UCP do Google (inicialmente nos Estados Unidos).
Honeywell criou, em conjunto com Google Cloud, uma plataforma de varejo baseada em IA para aprimorar a experiência de compra nas lojas.
AstraZeneca adquiriu a Modella AI, startup com sede em Boston especializada em modelos de IA para oncologia.
NVIDIA contratou o primeiro diretor de marketing da sua história. É Alison Wagonfeld, ex-vice-presidente de marketing do Google Cloud.
Primeira edição do programa Esporte Record de 2026 marcou a estreia de Toninho da ResenhIA, comentarista de futebol criado por IA. ⚽🎤🗣️

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊