• IA Express
  • Posts
  • Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200

Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai saber que a Microsoft está entrando de vez na guerra dos chips com um processador que promete inferência 30% mais barata e três vezes mais rápida do que a da concorrência. 🏿💲✂

Porém isso não é tudo na IA Express de hoje:
- YouTube vai permitir criar clones dos usuários para produzir Shorts
- Ferramenta de código aberto identifica áudio manipulado
- Fabricante de vasos sanitários está se beneficiando do boom da IA
- OpenAI soma mais de US$ 1 bilhão em receita recorrente anual com API

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

CONCORRÊNCIA ACIRRADA

Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200

A corrida pela supremacia no campo da inferência de IA ganhou um novo protagonista de peso. Com o Maia 200, a Microsoft se posiciona agressivamente no mercado de chips proprietários, apostando que a vantagem competitiva já não está mais em quem treina os maiores modelos, mas em quem consegue operá-los com eficiência de custo em escala.

Crédito: Microsoft

A Microsoft afirma que o chip Maia 200 oferece performance 30% melhor por dólar do que o hardware que hoje compõe os servidores de IA do Azure.

Fabricado usando o processo de 3nm da TSMC, o Maia 200 é composto por mais de 140 bilhões de transistores, 216 GB de memória HBM3E com velocidade de 7 TB/s e 272 MB de SRAM on-chip. Na prática, isso significa que o Maia 200 mantém grandes volumes de dados residentes em memória de alta velocidade, acelerando a taxa de transferência de tokens.

Por isso, a Microsoft não se intimida com comparações. Garante que o chip Maia 200 supera com folga seus principais rivais: é três vezes mais rápido que o Trainium3 da Amazon (em FP4) e bate a TPU de sétima geração do Google em operações de precisão FP8.

E não se trata apenas de uma promessa de laboratório. O Maia já é uma realidade operacional atualmente no datacenter da Microsoft em Iowa, com expansão prevista para as unidades no Arizona.

Por que isso importa? A chegada do Maia 200 sinaliza uma queda significativa nos custos de inferência. A Microsoft usará o novo chip na infraestrutura de IA que serve de base para vários modelos de IA, o Microsoft Foundry e o Microsoft 365 Copilot.

AI_TRENDS

  • ChatGPT Atlas ganhou modo "Auto" que alterna entre respostas do ChatGPT e resultados da Pesquisa do Google dependendo da natureza da consulta.

  • YouTube vai permitir que usuários criem seus clones movidos por IA para produzir Shorts sem precisar gravar vídeos.

  • Personal Intelligence no Modo IA de pesquisa do Google pode se conectar ao Gmail e Google Fotos para apresentar resultados personalizados (por enquanto, para planos Pro e Ultra).

  • Ernie 5.0, da Baidu, ficou em primeiro lugar no LMArena entre todos os modelos chineses e em oitava posição em nível global.

  • VibeVoice-ASR é um modelo da Microsoft do tipo Speech-to-Text que processa áudios de longa duração, com até 60 minutos, em uma única passagem.

  • LightonOCR 2.1B é um novo modelo OCR que supera vários concorrentes em velocidade, entre eles DeepSeek OCR.

  • Kona 1.0 é um modelo da Logical Intelligence projetado como sistema de raciocínio para aplicações críticas, para as quais a falha não é uma opção.

  • Questie.ai é uma plataforma de IA com assistentes de IA que acompanham partidas de jogos na tela em tempo real. 🕹️🎮💻

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Essa voz parece familiar, não é? Vozes sintéticas se tornaram praticamente indistinguíveis das reais, gerando uma crise de confiança em tudo, desde chamadas telefônicas de negócios a debates políticos. O WeDefense, novo kit de ferramentas de código aberto, chega para restaurar a confiança no que ouvimos. Mais do que apenas sinalizar um áudio falso, o WeDefense aponta exatamente quais trechos da gravação foram manipulados. Isso é essencial para identificar "falsificações parciais", aquelas em que a voz real de alguém é editada de forma quase imperceptível.

🌍 IA Global

🇯🇵 De bidês a semicondutores para IA A fabricante japonesa TOTO, famosa por seus bidês de luxo Washlet e vasos sanitários, está se tornando uma improvável beneficiária do boom da IA. Como? A TOTO vem fabricando silenciosamente componentes críticos para semicondutores desde 1988. Usando a mesma expertise em cerâmica que cria peças avançadas para banheiros, a empresa produz mandris eletrostáticos (ESC) - componentes especializados que fixam wafers de silício durante o processo de fabricação de chips. E a TOTO não está sozinha. O ecossistema industrial do Japão tem pelo menos dois outros players ocultos de semicondutores: Ajinomoto (sim, a empresa de temperos), que fabrica filmes isolantes para chips, e a gigante de cosméticos Kao, que produz agentes de limpeza de wafers.

🔢 IA em números


Uma pesquisa com artistas de mangá, ilustradores e outros profissionais de criação japoneses revelou que 12% relataram perdas de renda devido à IA Generativa, com 9,3% observando uma queda de 10% a 50% nos ganhos e 2,7% sofrendo quedas superiores a 50%.

 AI_TOOLKIT

🛠️Ferramentas

  • Devin Review é uma ferramenta para revisão de código que combina IA com recursos UX.

  • Todoist Ramble é um recurso de voz movido por IA que converte fala natural em tarefas estruturadas usando o microfone do telefone, sem hardware extra.

  • FinRobot é uma plataforma de agentes de IA de código aberto para aplicações e análise financeira avançadas que usa grandes modelos de linguagem.

📚 Miscelânea

  • A ferramenta de programação Cursor agora conta com subagentes que, por default, processam tarefas em paralelos. Também possui Skills personalizáveis para agentes, além de geração de imagens integrada.

 AI_FLASH_NEWS

  • Sam Altman declarou que a OpenAI somou mais de US$ 1 bilhão em receita recorrente anual em dezembro apenas nos negócios de API.

  • Google adquiriu a Common Sense Machines, startup de IA cuja tecnologia converte imagens 2D em ativos digitais 3D.

  • World Labs, startup da renomada pesquisadora Fei-Fei Li, busca um aporte de US$ 500 milhões para assim atingir um valor de mercado de US$ 5 bilhões.

  • Importante pesquisador deixou a OpenAI porque métricas de crescimento de usuários são priorizadas em detrimento da pesquisa de base.

  • Coreia do Sul promulgou arcabouço regulatório paraA que exige supervisão de modelos de alto impacto e identificação de conteúdo gerado por IA.

  • Meta testará assinaturas premium no Instagram, Facebook e WhatsApp, oferecendo recursos exclusivos de IA (agentes da Manus e Vibes)

  • OpenAI está pedindo cerca de US$ 60 por 1.000 visualizações de anúncios no ChatGPT, de acordo com The Information. 📢📰💵

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊