- IA Express
- Posts
- Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200
Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai saber que a Microsoft está entrando de vez na guerra dos chips com um processador que promete inferência 30% mais barata e três vezes mais rápida do que a da concorrência. 🏿💲✂
Porém isso não é tudo na IA Express de hoje:
- YouTube vai permitir criar clones dos usuários para produzir Shorts
- Ferramenta de código aberto identifica áudio manipulado
- Fabricante de vasos sanitários está se beneficiando do boom da IA
- OpenAI soma mais de US$ 1 bilhão em receita recorrente anual com API
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
CONCORRÊNCIA ACIRRADA
Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200
A corrida pela supremacia no campo da inferência de IA ganhou um novo protagonista de peso. Com o Maia 200, a Microsoft se posiciona agressivamente no mercado de chips proprietários, apostando que a vantagem competitiva já não está mais em quem treina os maiores modelos, mas em quem consegue operá-los com eficiência de custo em escala.

Crédito: Microsoft
A Microsoft afirma que o chip Maia 200 oferece performance 30% melhor por dólar do que o hardware que hoje compõe os servidores de IA do Azure.
Fabricado usando o processo de 3nm da TSMC, o Maia 200 é composto por mais de 140 bilhões de transistores, 216 GB de memória HBM3E com velocidade de 7 TB/s e 272 MB de SRAM on-chip. Na prática, isso significa que o Maia 200 mantém grandes volumes de dados residentes em memória de alta velocidade, acelerando a taxa de transferência de tokens.
Por isso, a Microsoft não se intimida com comparações. Garante que o chip Maia 200 supera com folga seus principais rivais: é três vezes mais rápido que o Trainium3 da Amazon (em FP4) e bate a TPU de sétima geração do Google em operações de precisão FP8.
E não se trata apenas de uma promessa de laboratório. O Maia já é uma realidade operacional atualmente no datacenter da Microsoft em Iowa, com expansão prevista para as unidades no Arizona.
Por que isso importa? A chegada do Maia 200 sinaliza uma queda significativa nos custos de inferência. A Microsoft usará o novo chip na infraestrutura de IA que serve de base para vários modelos de IA, o Microsoft Foundry e o Microsoft 365 Copilot.
AI_TRENDS
ChatGPT Atlas ganhou modo "Auto" que alterna entre respostas do ChatGPT e resultados da Pesquisa do Google dependendo da natureza da consulta.
YouTube vai permitir que usuários criem seus clones movidos por IA para produzir Shorts sem precisar gravar vídeos.
Personal Intelligence no Modo IA de pesquisa do Google pode se conectar ao Gmail e Google Fotos para apresentar resultados personalizados (por enquanto, para planos Pro e Ultra).
Ernie 5.0, da Baidu, ficou em primeiro lugar no LMArena entre todos os modelos chineses e em oitava posição em nível global.
VibeVoice-ASR é um modelo da Microsoft do tipo Speech-to-Text que processa áudios de longa duração, com até 60 minutos, em uma única passagem.
LightonOCR 2.1B é um novo modelo OCR que supera vários concorrentes em velocidade, entre eles DeepSeek OCR.
Kona 1.0 é um modelo da Logical Intelligence projetado como sistema de raciocínio para aplicações críticas, para as quais a falha não é uma opção.
Questie.ai é uma plataforma de IA com assistentes de IA que acompanham partidas de jogos na tela em tempo real. 🕹️🎮💻
AI_SNAPSHOT
💡 Inovação & Inspiração
Essa voz parece familiar, não é? Vozes sintéticas se tornaram praticamente indistinguíveis das reais, gerando uma crise de confiança em tudo, desde chamadas telefônicas de negócios a debates políticos. O WeDefense, novo kit de ferramentas de código aberto, chega para restaurar a confiança no que ouvimos. Mais do que apenas sinalizar um áudio falso, o WeDefense aponta exatamente quais trechos da gravação foram manipulados. Isso é essencial para identificar "falsificações parciais", aquelas em que a voz real de alguém é editada de forma quase imperceptível.
🌍 IA Global
🇯🇵 De bidês a semicondutores para IA A fabricante japonesa TOTO, famosa por seus bidês de luxo Washlet e vasos sanitários, está se tornando uma improvável beneficiária do boom da IA. Como? A TOTO vem fabricando silenciosamente componentes críticos para semicondutores desde 1988. Usando a mesma expertise em cerâmica que cria peças avançadas para banheiros, a empresa produz mandris eletrostáticos (ESC) - componentes especializados que fixam wafers de silício durante o processo de fabricação de chips. E a TOTO não está sozinha. O ecossistema industrial do Japão tem pelo menos dois outros players ocultos de semicondutores: Ajinomoto (sim, a empresa de temperos), que fabrica filmes isolantes para chips, e a gigante de cosméticos Kao, que produz agentes de limpeza de wafers.
🔢 IA em números
![]() |
|
AI_TOOLKIT
🛠️Ferramentas
Devin Review é uma ferramenta para revisão de código que combina IA com recursos UX.
Todoist Ramble é um recurso de voz movido por IA que converte fala natural em tarefas estruturadas usando o microfone do telefone, sem hardware extra.
FinRobot é uma plataforma de agentes de IA de código aberto para aplicações e análise financeira avançadas que usa grandes modelos de linguagem.
📚 Miscelânea
A ferramenta de programação Cursor agora conta com subagentes que, por default, processam tarefas em paralelos. Também possui Skills personalizáveis para agentes, além de geração de imagens integrada.
AI_FLASH_NEWS
Sam Altman declarou que a OpenAI somou mais de US$ 1 bilhão em receita recorrente anual em dezembro apenas nos negócios de API.
Google adquiriu a Common Sense Machines, startup de IA cuja tecnologia converte imagens 2D em ativos digitais 3D.
World Labs, startup da renomada pesquisadora Fei-Fei Li, busca um aporte de US$ 500 milhões para assim atingir um valor de mercado de US$ 5 bilhões.
Importante pesquisador deixou a OpenAI porque métricas de crescimento de usuários são priorizadas em detrimento da pesquisa de base.
Coreia do Sul promulgou arcabouço regulatório paraA que exige supervisão de modelos de alto impacto e identificação de conteúdo gerado por IA.
Meta testará assinaturas premium no Instagram, Facebook e WhatsApp, oferecendo recursos exclusivos de IA (agentes da Manus e Vibes)
OpenAI está pedindo cerca de US$ 60 por 1.000 visualizações de anúncios no ChatGPT, de acordo com The Information. 📢📰💵
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊
