IA Express
Posts
Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200

Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200

Sheila Zabeu
30 jan

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai saber que a Microsoft está entrando de vez na guerra dos chips com um processador que promete inferência 30% mais barata e três vezes mais rápida do que a da concorrência. 🏿💲✂

Porém isso não é tudo na IA Express de hoje:
- YouTube vai permitir criar clones dos usuários para produzir Shorts
- Ferramenta de código aberto identifica áudio manipulado
- Fabricante de vasos sanitários está se beneficiando do boom da IA
- OpenAI soma mais de US$ 1 bilhão em receita recorrente anual com API

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

CONCORRÊNCIA ACIRRADA

Quem vai dominar a inferência? Microsoft aposta alto com o novo Maia 200

A corrida pela supremacia no campo da inferência de IA ganhou um novo protagonista de peso. Com o Maia 200, a Microsoft se posiciona agressivamente no mercado de chips proprietários, apostando que a vantagem competitiva já não está mais em quem treina os maiores modelos, mas em quem consegue operá-los com eficiência de custo em escala.

Crédito: Microsoft

A Microsoft afirma que o chip Maia 200 oferece performance 30% melhor por dólar do que o hardware que hoje compõe os servidores de IA do Azure.

Fabricado usando o processo de 3nm da TSMC, o Maia 200 é composto por mais de 140 bilhões de transistores, 216 GB de memória HBM3E com velocidade de 7 TB/s e 272 MB de SRAM on-chip. Na prática, isso significa que o Maia 200 mantém grandes volumes de dados residentes em memória de alta velocidade, acelerando a taxa de transferência de tokens.

Por isso, a Microsoft não se intimida com comparações. Garante que o chip Maia 200 supera com folga seus principais rivais: é três vezes mais rápido que o Trainium3 da Amazon (em FP4) e bate a TPU de sétima geração do Google em operações de precisão FP8.

E não se trata apenas de uma promessa de laboratório. O Maia já é uma realidade operacional atualmente no datacenter da Microsoft em Iowa, com expansão prevista para as unidades no Arizona.

Por que isso importa? A chegada do Maia 200 sinaliza uma queda significativa nos custos de inferência. A Microsoft usará o novo chip na infraestrutura de IA que serve de base para vários modelos de IA, o Microsoft Foundry e o Microsoft 365 Copilot.

AI_TRENDS

ChatGPT Atlas ganhou modo "Auto" que alterna entre respostas do ChatGPT e resultados da Pesquisa do Google dependendo da natureza da consulta.
YouTube vai permitir que usuários criem seus clones movidos por IA para produzir Shorts sem precisar gravar vídeos.
Personal Intelligence no Modo IA de pesquisa do Google pode se conectar ao Gmail e Google Fotos para apresentar resultados personalizados (por enquanto, para planos Pro e Ultra).
Ernie 5.0, da Baidu, ficou em primeiro lugar no LMArena entre todos os modelos chineses e em oitava posição em nível global.
VibeVoice-ASR é um modelo da Microsoft do tipo Speech-to-Text que processa áudios de longa duração, com até 60 minutos, em uma única passagem.
LightonOCR 2.1B é um novo modelo OCR que supera vários concorrentes em velocidade, entre eles DeepSeek OCR.
Kona 1.0 é um modelo da Logical Intelligence projetado como sistema de raciocínio para aplicações críticas, para as quais a falha não é uma opção.
Questie.ai é uma plataforma de IA com assistentes de IA que acompanham partidas de jogos na tela em tempo real. 🕹️🎮💻

AI_SNAPSHOT

💡 Inovação & Inspiração

Essa voz parece familiar, não é? Vozes sintéticas se tornaram praticamente indistinguíveis das reais, gerando uma crise de confiança em tudo, desde chamadas telefônicas de negócios a debates políticos. O WeDefense, novo kit de ferramentas de código aberto, chega para restaurar a confiança no que ouvimos. Mais do que apenas sinalizar um áudio falso, o WeDefense aponta exatamente quais trechos da gravação foram manipulados. Isso é essencial para identificar "falsificações parciais", aquelas em que a voz real de alguém é editada de forma quase imperceptível.

🌍 IA Global

🇯🇵 De bidês a semicondutores para IA A fabricante japonesa TOTO, famosa por seus bidês de luxo Washlet e vasos sanitários, está se tornando uma improvável beneficiária do boom da IA. Como? A TOTO vem fabricando silenciosamente componentes críticos para semicondutores desde 1988. Usando a mesma expertise em cerâmica que cria peças avançadas para banheiros, a empresa produz mandris eletrostáticos (ESC) - componentes especializados que fixam wafers de silício durante o processo de fabricação de chips. E a TOTO não está sozinha. O ecossistema industrial do Japão tem pelo menos dois outros players ocultos de semicondutores: Ajinomoto (sim, a empresa de temperos), que fabrica filmes isolantes para chips, e a gigante de cosméticos Kao, que produz agentes de limpeza de wafers.

🔢 IA em números

Uma pesquisa com artistas de mangá, ilustradores e outros profissionais de criação japoneses revelou que 12% relataram perdas de renda devido à IA Generativa, com 9,3% observando uma queda de 10% a 50% nos ganhos e 2,7% sofrendo quedas superiores a 50%.

AI_TOOLKIT

🛠️Ferramentas

Devin Review é uma ferramenta para revisão de código que combina IA com recursos UX.
Todoist Ramble é um recurso de voz movido por IA que converte fala natural em tarefas estruturadas usando o microfone do telefone, sem hardware extra.
FinRobot é uma plataforma de agentes de IA de código aberto para aplicações e análise financeira avançadas que usa grandes modelos de linguagem.

📚 Miscelânea

A ferramenta de programação Cursor agora conta com subagentes que, por default, processam tarefas em paralelos. Também possui Skills personalizáveis para agentes, além de geração de imagens integrada.

AI_FLASH_NEWS

Sam Altman declarou que a OpenAI somou mais de US$ 1 bilhão em receita recorrente anual em dezembro apenas nos negócios de API.
Google adquiriu a Common Sense Machines, startup de IA cuja tecnologia converte imagens 2D em ativos digitais 3D.
World Labs, startup da renomada pesquisadora Fei-Fei Li, busca um aporte de US$ 500 milhões para assim atingir um valor de mercado de US$ 5 bilhões.
Importante pesquisador deixou a OpenAI porque métricas de crescimento de usuários são priorizadas em detrimento da pesquisa de base.
Coreia do Sul promulgou arcabouço regulatório paraA que exige supervisão de modelos de alto impacto e identificação de conteúdo gerado por IA.
Meta testará assinaturas premium no Instagram, Facebook e WhatsApp, oferecendo recursos exclusivos de IA (agentes da Manus e Vibes)
OpenAI está pedindo cerca de US$ 60 por 1.000 visualizações de anúncios no ChatGPT, de acordo com The Information. 📢📰💵

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊