• IA Express
  • Posts
  • Nova classe de modelos de IA abre mão dos tokens dos LLMs

Nova classe de modelos de IA abre mão dos tokens dos LLMs

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você verá que a IA já pode largar a muleta dos tokens para gerar texto em blocos densos com mais eficiência. Também já é capaz de dar aula de linguística, desmontando frases recursivas e decifrando ambiguidades. 🎟️🧩🔠💬

Porém isso não é tudo na IA Express de hoje:
- Maya1 é o primeiro modelo TTS com recurso de "design de voz"
- Amazon quer restringir uso do Comet, e Perplexity chama isso de bullying
- Shopify aumenta em sete vezes o tráfego orientado por IA para suas lojas
- Microsoft cria ambiente simulado para testar IA em negociações do mundo real

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

MAIS EFICIÊNCIA

Nova classe de modelos de IA abre mão dos tokens dos LLMs

Grandes modelos de linguagem (LLMs), como ChatGPT ou Gemini, geram texto palavra por palavra, com base em vocabulários fixos, quase como um digitador rápido, ou seja, a maneira como funcionam é fundamentalmente lenta.

Agora, uma nova classe de modelos denominada Continuous Autoregressive Language Models (CALM), proposta por pesquisadores da Tencent e da Universidade de Tsinghua, abordou esse problema, buscando tornar a próxima geração de LLMs muito mais rápida e eficiente.

Como funciona? Em vez de trabalhar com tokens discretos (palavras ou partes de palavras), prevendo o próximo um de cada vez, em uma ordem rigorosa, a estrutura CALM usa um espaço contínuo para prever o próximo vetor, não o token.

Crédito: Tencent e Universidade de Tsinghua,

Em uma analogia simples, em vez de montar um link (token) de cada vez em uma cadeia, CALM agrupa várias links e os trata em grupo (vetor) como uma única unidade mais densa. Em linguagem mais técnica, em vez de atribuir probabilidades a tokens individuais, prevê diretamente um vetor que codifica vários tokens de uma só vez.

Por que isso importa? Como cada vetor representa, digamos, um grupo de K tokens, o modelo reduz significativamente o número de passos generativos por um fator K. Na prática, isso se traduz em desempenho equiparável ao de modelos de IA tradicionais a um menor custo computacional.

Além disso, a capacidade do vetor contínuo pode ser expandida simplesmente aumentando sua dimensão, o que oferece um caminho muito mais fácil de escalar em comparação com a estrutura discreta.

AI_TRENDS

  • Google Maps agora conta com Gemini para tornar a navegação mais intuitiva, usando linguagem natural (“vire à direita após o banco”) ou Google Lens.

  • E a pesquisa aprofundada do Gemini foi integrada diretamente no Gmail, no Drive (Docs, Slides, Sheets e PDFs) e no Google Chat.

  • Você já pode interromper consultas de longa duração no ChatGPT para adicionar novo contexto, bastando clicar em Atualizar na barra lateral.

  • Perplexity atualizou o assistente de IA do navegador Comet para realizar mais tipos de ações com desempenho 23% melhor, segundo testes internos.

  • Maya1 é o primeiro modelo TTS com recurso de "design de voz" que cria e personaliza vozes usando descrições em linguagem natural.

  • Tinder está testando um recurso de IA para entender melhor os usuários fazendo perguntas e, com permissão, acessando fotos no telefone.

  • GEN-0, da Generalist AI, é um modelo de IA para robótica treinado com mais de 270.000 horas de dados de interação física do mundo real.

  • Kosmos é um sistema de IA autônomo capaz de concluir em um dia o trabalho científico equivalente a seis meses quando realizado de modo convencional. Foi criado por Edison Scientific, nova unidade comercial da FutureHouse. 🧑‍🔬

AI_VENTURES

LINGUÍSTICA

Modelos de IA já trabalham melhor com metalinguagem

Pesquisadores da UC Berkeley e da Universidade Rutgers demonstraram que modelos de IA são capazes de analisar a linguagem com as mesmas profundidade e sofisticação de um especialista em linguística. Vários grandes modelos de linguagem (LLMs) tiveram colocada à prova sua capacidade metalinguística, de não apenas usar a linguagem, mas de pensar e raciocinar sobre sua estrutura.

E qual foi o resultado? O modelo o1 da OpenAI se destacou na análise de estruturas gramaticais intrincadas, inclusive recursão (incorporação de frases dentro de frases), que é característica definidora da mente humana. Talvez mais impressionante, foi o fato de ter lidado muito bem com frases ambíguas, gerando árvores sintáticas correspondentes para cada interpretação.

Também inferiu com sucesso regras fonológicas, descrevendo com precisão padrões sonoros (como vogais deveriam ser pronunciadas com base em consoantes anteriores), apesar de nunca ter trabalhando com pequenos idiomas criados pelos pesquisadores para os testes.

O que o estudo concluiu é que os atuais modelos podem, em princípio, realizar análises linguísticas mais sofisticadas, mas nada muito original. No entanto, deve ser uma questão de tempo até que possamos ver melhores generalizações a partir de menos dados e de uma maneira mais criativa.

AI_GOVERNANCE & ETHICS

 👾Ameaças mais sofisticadas

Um novo relatório do Google Threat Intelligence Group (GTIG) confirmou que grupos patrocinados por algumas nações - especificamente Coreia do Norte, Irã e China - estão usando a IA para ter mais do que apenas eficiência; também estão desenvolvendo recursos avançados de ataque. As tendências mais preocupantes são versões de malware alimentadas por IA capazes de mudar dinamicamente seu próprio código para dificultar sua detecção; uso de engenharia social para se passarem por estudantes ou pesquisadores em prompts, conseguirem ignorar proteções internas dos modelo de IA e assim extrair informações confidenciais; e acesso a mercados digitais subterrâneos que oferecem ferramentas sofisticadas de IA para phishing, malware e pesquisa de vulnerabilidades. Veja mais detalhes do relatório aqui.

👊 Bullying, não inovação

Amazon exigiu que Perplexity impeça usuários de seu navegador de IA Comet de fazer compras em site de comércio eletrônico, alegando que o agente de IA do Comet viola termos de serviço, degrada a experiência de compra, além de apresentar riscos à privacidade dos clientes e de fazer compras sem divulgação clara. Perplexity rebate o pedido a Amazon, caracterizando-o como bullying em vez de inovação e argumentando que a postura da Amazon restringe a escolha dos usuários e a concorrência. Vai além e diz que a Amazon está favorecendo anúncios e listas patrocinadas em detrimento de experiências mais simples possibilitadas pela IA autônoma.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Sonho antigo realizado Andy Shand é um amante da música com problemas crônicos de saúde que tornavam qualquer produção musical quase impossível. Usando a Suno, ferramenta de IA para criação de canções, e sua própria voz minimamente, Andy passou a esboçar melodias, letras e estruturas e deixou por conta da IA gerar variações que ele posteriormente refinava. O resultado? Músicas completas concluídas em dias, algo inimaginável para ele alguns anos atrás. 💭🎼🎧

  • Mais do que bijuteria Sandbar, startup fundada por dois ex-designers da Meta, apresentou o Stream Ring, anel inteligente que captura anotações em voz e as transcreve via Bluetooth para seu app (apenas para iOS, por enquanto). Usado no dedo indicador, o anel também pode controlar a reprodução de músicas. Para garantir privacidade, é ativado apenas quando pressionado seu touchpad com o polegar. E a cereja do bolo? O recurso Inner Voice que clona a voz do usuário e faz as conversas parecerem um monólogo interno. 😲⭕🗣️

🌍 IA Global

🇯🇵 Para cenário japonês SoftBank e OpenAI criaram uma joint venture 50/50 para acelerar a adoção de IA pelas empresas do país. O novo empreendimento comercializará exclusivamente a Crystal Intelligence, solução que combina a tecnologia da OpenAI com serviços de implementação e integração específicos para o cenário japonês. A meta é transformar práticas de gerenciamento e fluxos de trabalho com base na colaboração de agentes de IA. Como primeiro usuário, SoftBank usará a Crystal Intelligence no desenvolvimento de produtos e em ações de transformação digital.

🇮🇸 Em nível nacional A Islândia firmou uma parceria com Anthropic para lançar um dos primeiros pilotos educacionais de IA em nível nacional do mundo. A iniciativa dará a centenas de professores em toda o país - em centros urbanos como Reykjavik até escolas rurais remotas – acesso ao assistente de IA Claude, juntamente com material de treinamento e uma rede de apoio dedicada. Entre os objetivos do projeto, estão a capacitação de educadores, redução de encargos administrativos e aprimoramento do ensino em sala de aula. Por exemplo, professores poderão usar Claude para planeja aulas, adaptando o conteúdo aos alunos, preservando a integridade da língua islandesa.

🔢 IA em números

Shopify definiu a IA como a “maior mudança tecnológica desde a Internet”. Especificamente no varejo, agentes de IA têm ajudando nas decisões de compras e transações. A estratégia da Shopify para IA já produziu ótimos resultados: desde janeiro de 2025, o tráfego orientado por IA para as lojas Shopify aumentou sete vezes, enquanto as compras decorrentes da pesquisa com IA dispararam 11 vezes.

 AI_TOOLKIT

🛠️Ferramentas

  • Google Finance ganhou a ajuda do Gemini para lidar com consultas financeiras complexas, de nível de especialistas.

  • Mujo AI é uma ferramenta de IA para agilizar e automatizar a criação de conteúdo para marketing de produtos e comércio eletrônico.

📚 Miscelânea

  • Você certamente já ouviu falar da bolha de IA, certo? Quer saber o que é, se estamos em uma bolha e se você deve se preocupar com isso? Veja uma FAQ simples de entender, com a opinião e os comentários do autor, lembrando que o tema é controverso.

  • Microsoft criou um ambiente simulado de compras chamado Magentic Marketplace para testar como modelos de IA atuam em negociações do mundo real. Os resultados não foram muito bons, com demonstrações de dificuldade para lidar com um grande número de opções, aceitando logo a primeira proposta.

 AI_FLASH_NEWS

  • OpenAI afirmou ter mais de 1 milhão de clientes empresariais. Isso inclui pagantes do ChatGPT for Work ou do consumo direto dos modelos de IA por meio da plataforma de desenvolvedores.

  • Apple está negociando um acordo de US$ 1 bilhão por ano para usar o modelo Gemini do Google na Siri.

  • Anthropic se comprometeu a preservar os pesos de seus modelos de IA para tentar reduzir potenciais inconvenientes quando aposentados.

  • Google anunciou a disponibilidade da sua TPU Ironwood voltada para treinamento de IA de alto desempenho e inferência de baixa latência.

  • Perplexity AI apresentou kernels que permitem executar modelos MoE de trilhões de parâmetros de forma eficiente na nuvem.

  • Snap vai integrar a partir de 2026 o mecanismo de IA da Perplexity no Snapchat, com uma comunidade de quase 1 bilhão de usuários.

  • KPMG está treinando consultores juniores para gerenciar grupos de agentes de IA capazes de completar tarefas sem intervenção humana.

  • Montadora Xpeng revelou o robô humanoide Iron com avanços em conversação, mobilidade e interação orientadas por IA e chips da Turing.

  • xAI obrigou funcionários a fornecer dados biométricos (face e voz) para treinar um chatbot feminino estilo anime chamado Ani.

  • Fei-Fei Li, considerada madrinha da IA, recebeu o Prêmio de Engenharia Rainha Elizabeth de 2025 - única mulher entre sete já premiados. 👩👑🥇

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊