- IA Express
- Posts
- Microsoft cria linguagem para engenharia de prompts
Microsoft cria linguagem para engenharia de prompts
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Na edição de hoje, você verá como a Microsoft está trazendo ordem para a arte caótica da engenharia de prompts e como um modelo de IA de código aberto pioneiro está ensinando robôs a pensarem em 3D. 🧊🦾
Porém isso não é tudo na IA Express de hoje:
- Atualizações da OpenAI depois das reações negativas ao GPT-5
- Banco usa IA e as próprias táticas dos scammers contra eles
- Perplexity fez oferta para comprar o navegador Chrome
- Experimento do Google DeepMind faz agente de IA operar modelo de mundo
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
PROGRAMAÇÃO
Microsoft cria linguagem para engenharia de prompts
A engenharia de prompts, disciplina de elaboração de entradas (prompts) para orientar modelos de IA a produzir a saída desejada, tem sido um pouco como escrever um documento de texto de forma livre e não estruturada. Ainda que funcione para tarefas básicas, essa abordagem pode facilmente gerar erros em caso de aplicações mais complexas.
O que a Microsoft fez para resolver isso? Criou a Prompt Orchestration Markup Language (POML), nova linguagem de marcação (markup) para trazer ordem ao processo muitas vezes caótico de criar prompts, garantindo estrutura e meios de manutenção, sem abrir mão da versatilidade.

O que você precisa saber?
A POML usa uma sintaxe semelhante à HTML, com componentes semânticos que dividem um prompt em partes modulares, de forma parecida com o modo como são construídas as páginas Web. Assim, os prompts passam a ser reutilizáveis e fáceis de ler, além de poder integrar com facilidade diversos tipos de dados, como texto, imagens e tabelas.
Com um recurso que funciona como CSS para sites, a POML permite separar o conteúdo do prompt e de sua apresentação. Isso permite modificar o estilo (por exemplo, verbosidade e formato da saída) sem alterar a lógica. Também trabalha com variáveis, loops e instruções condicionais para a geração dinâmica de prompts complexos.
Por fim, a POML não se limita a ser apenas uma linguagem em si; vem acompanhada de uma extensão IDE para Visual Studio Code e SDKs para Node.js e Python. 👨🏻💻</> 🛠️
AI_TRENDS
Depois das reações negativas ao GPT-5, vêm os updates: modos Auto/Rápido/Raciocínio no lugar do roteador; GPT4o como default para planos pagos, que também ganharam mais opções de modelos; GPT-4.5 apenas para plano Pro; e novo limite semanal de 3 mil mensagens para GPT-5 modo Raciocínio. 😠
Perplexity está oferecendo a assinantes dos planos Pro e Max recursos para geração de vídeo por IA nas plataformas web, iOS e Android.
Copilot 3D da Microsoft transforma imagens em modelos 3D prontos para serem renderizados, impressos ou incorporados aos seus projetos.
Claude Sonnet 4 da Anthropic agora lida com uma janela de contexto de um milhão de tokens, o que permite carregar no prompt bases de código inteiras.
Matrix-Game 2.0 é um modelo de mundo interativo que promete concorrer com o Genie 3 da DeepMind, com a diferença de ser de código aberto. Gera em tempo real longas sequências de vídeo interativo a 25 quadros por segundo.
Novo Medium 3.1 apresenta melhorias de desempenho geral e pesquisas mais inteligentes na Web, garante a Mistral.
LLMs enfrentam dificuldades com inferência lógica, particularmente diante de problemas fora de seus dados de treinamento, efeito chamado de miragem.
A equipe da Meta FAIR conquistou o 1º lugar na competição de modelagem cerebral Algonauts 2025 com o modelo TRIBE que prevê respostas cerebrais a diversas classes de estímulos. 🏆🧠
AI_VENTURES
ROBÓTICA
Nova classe de modelos de IA ajuda robôs a raciocinar em 3D
O Allen Institute for AI (Ai2) liberou o MolmoAct 7B, modelo de IA de código aberto que dá aos robôs a capacidade de “raciocinar” em espaços 3D. Junto com o MolmoAct 7B, a Ai2 também tornou disponível o conjunto de dados de treinamento do modelo.
Qual é a novidade? A maioria dos atuais modelos de IA usados para controle de robôs traduz instruções em linguagem natural em movimento. Em vez de simplesmente dar comandos, o novo MolmoAct usa raciocínio visual para entender o ambiente, incluindo a complexa interação entre espaço, movimento e tempo. Trata-se de uma nova categoria chamada de Modelos de Raciocínio de Ação (ARM, na sigla em inglês).
Como funciona? O MolmoAct gera tokens de raciocínio visual que transformam entradas de imagens 2D em planos espaciais 3D, com uma sequência de ações, permitindo que robôs naveguem no mundo físico com mais inteligência e controle.
Modelos do tipo ARMs, como o MolmoAct, interpretam instruções de alto nível e as dividem em uma cadeia de decisões espacialmente fundamentadas, usando as seguintes capacidades:
Percepção 3D: MolmoAct usa profundidade e contexto espacial para entender o ambiente e transforma imagens 2D em planos espaciais 3D.
Planejamento visual: O modelo esboça uma trajetória, traçando cada movimento antes de agir.
Decodificação em ações: Finalmente, traduz os planos em comandos precisos e inteligíveis para o robô.
O treinamento do MolmoAct usou 256 GPUs NVIDIA H100 por 24 horas, com uma rápida sessão de ajuste de duas horas em 64 GPUs. Foi usado um conjunto de dados com curadoria de cerca de 12.000 episódios de robôs em ambientes do cotidiano, como cozinhas e quartos.
E os resultados? O MolmoAct superou muitos modelos comerciais em sistemas de benchmarking, entre eles SimplerEnv, no qual obteve taxa de sucesso de 72,1%.
E tem mais. Ao contrário de muitos sistemas robóticos que usam arquiteturas fechadas e conjuntos de dados proprietários, o MolmoAct foi treinado usando dados abertos e foi projetado para ser reproduzível. O modelo também apresenta os traços de raciocínio visual, como uma prévia dos movimentos pretendidos, oferecendo um meio de corrigir erros ou prevenir comportamentos indesejados.
AI_GOVERNANCE & ETHICS
▶️ YouTube sob protesto
O sistema de verificação de idade baseado em IA do YouTube provocou uma reação de usuários no Estados Unidos, que abriram uma petição no Change.org que já se aproxima de 50.000 assinaturas se opondo à implementação. A ferramenta de IA estima a idade dos Youtubers analisando hábitos de visualização e outros sinais e restringe contas que são sinalizadas como sendo de menores de 18 anos. Críticos argumentam que isso ameaça a privacidade ao possivelmente expor identidades, especialmente para usuários que dependem do anonimato. A falta de transparência do sistema em relação ao uso e ao armazenamento de dados também é criticada. Além disso, alguns criadores de conteúdo também sugerem que os motivos do YouTube podem envolver mineração de dados.
⛔ Acesso bloqueado
A Reddit, popular plataforma de mídia social onde milhões de usuários se envolvem em discussões em comunidades temáticas, restringiu o acesso do Wayback Machine da Internet Archive, arquivo digital que preserva imagens de sites ao longo do tempo, para rastrear suas páginas. A medida limita o acesso do Wayback Machine à página inicial do Reddit, reduzindo efetivamente a capacidade de terceiros, particularmente empresas de IA, de fazer scrapping (extração) de dados gratuitamente. O Wayback Machine, operado pela organização sem fins lucrativos Internet Archive, é amplamente utilizado para visualizar versões antigas de sites, preservando o conteúdo digital para pesquisa e posteridade. No entanto, o Reddit descobriu que algumas empresas de IA estavam explorando essa ferramenta para contornar suas políticas de acesso a dados.
AI_SNAPSHOT
💡 Inovação & Inspiração
Experimentando do próprio veneno O banco australiano Commonwealth Bank (CommBank) se uniu à empresa de inteligência cibernética Apate.ai para usar as próprias táticas dos scammers contra eles: um engenhoso sistema de "honeypot". Foram criados milhares de perfis de bots com IA que agem como potenciais vítimas de golpes. O trabalho desses bots é ocupar o tempo do golpista, reunir informações cruciais sobre seus métodos e interromper suas operações. A inteligência recolhida alimenta diretamente os sistemas de controle de fraude do CommBank, ajudando a identificar novas tendências de golpe. 🏦🤬
Tratamento para câncer Uma equipe de pesquisadores da KAIST revelou um modelo de IA que pode ajudar no desenvolvimento de tratamentos contra o câncer. O novo BInD (Bond and Interaction-generating Diffusion) projeta, do zero, moléculas da possível nova droga, dada a estrutura de uma proteína-alvo. A chave para o sucesso é uma abordagem de "design simultâneo" que, ao contrário de outros modelos que primeiro geram moléculas e depois verificam se são capazes de se ligar à proteína-alvo, o BInD considera o mecanismo de ligação e o design da molécula ao mesmo tempo. Isso garante que as moléculas geradas não sejam apenas eficazes, mas também quimicamente estáveis. 🧪🔬👨🏻🔬
🌍 IA Global
🇨🇳 Potência em biotecnologia Startups chinesas da área de descoberta de medicamentos guiado por IA, entre elas XtalPi, Helixon e CSPC Zhongqi, estão estabelecendo parcerias multibilionárias com gigantes farmacêuticas como Pfizer, Sanofi e AstraZeneca. Explorando ferramentas avançadas de IA e biologia computacional, essas empresas estão acelerando o desenvolvimento de medicamentos, otimizando processos e reduzindo custos e, de quebra, posicionando a China como uma potência em biotecnologia.
🇨🇳 Cautela com chips vindos dos EUA A China pediu recentemente que empresas locais, estatais e privadas evitem usar os chips de IA da AMD e os modelos H20 da NVIDIA, particularmente para projetos relacionados ao governo e fins de segurança nacional. A decisão ocorreu após as duas empresas terem concordado em repassar ao governo dos Estados Unidos 15% das receitas geradas por processadores vendidos à China em troca das licenças de exportação.
🔢 IA em números
![]() | A Perplexity fez uma oferta de US$ 34,5 bilhões em cash pelo navegador Chrome do Google. A iniciativa ocorre em meio ao caso antitruste no qual a decisão estabeleceu que o Google havia monopolizado o mercado de buscas e que uma possível remediação seria o Google se desfazer do Chrome. |
AI_TOOLKIT
🛠️Ferramentas
Pixpal é um assistente de IA que integra recursos do GPT-5, análise e ferramentas FLUX para transformar ou gerar imagens.
Google Fotos ganhou nova guia Criar no app para smartphone que reúne ferramentas de edição movidas por IA.
📚 Miscelânea
Demis Hassabis, CEO do Google DeepMind, descreve um experimento em que o agente SIMA (Scalable Instructable Multiworld Agent), capaz de operar em vários ambientes virtuais, realiza ações em um mundo gerado pelo modelo Genie 3 em tempo real. Segundo Hassabis, esse cenário tem potencial produzir dados de treinamento ilimitados para robótica e IA.
Mais um guia da OpenAI mostra alguns exemplos e lições de desenvolvimento de aplicações frontend usando GPT-5.
AI_FLASH_NEWS
Elon Musk ameaçou processar a Apple por manipular ranking da App Store e favorecer ChatGPT em detrimento do Grok. Apple nega acusação.
Também não demorou para que Sam Altman, da OpenAI, acusasse a plataforma X de Elon Musk de práticas semelhantes.
A disputa Musk x Altman não para por aí. OpenAI está considerando investir na startup Merge Labs para competir com a Neuralink de Elon Musk.
Igor Babuschkin, cofundador da xAI, deixou a empresa para criar um fundo de apoia à pesquisa em segurança de IA e humanidade.
Periodic Labs, startup que aplica IA na área de ciência dos materiais, tem apenas alguns meses de existência e já está avaliada em US$ 1 bilhão.
Apple planeja incorporar IA em um novo conjunto de hardware doméstico, incluindo desde câmeras de segurança a um robô de mesa à la Siri, com lançamento previsto para 2027.
Tufan Erginbilgic, CEO da Rolls-Royce, afirma que a empresa pode se tornar a mais valiosa do Reino Unido fornecendo reatores nucleares para IA.
Geoffrey Hinton, considerado “padrinho da Inteligência Artificiial”, propõe programar IA com “instintos maternos” para garantir que leve em conta questões humanas usando a relação mãe-bebê como exemplo. 🤱🏻👶💗
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.
