- IA Express
- Posts
- Modelo de IA cria mundos 3D interativos com um simples prompt
Modelo de IA cria mundos 3D interativos com um simples prompt
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você conhecerá um novo modelo de IA capaz de transformar simples descrições em um mundo inteiro interativo. Também saberá como a IA ganhou uma memória visual realmente ilimitada. ✨🫧🎞️
Porém isso não é tudo no IA Express de hoje:
- Depois de Kimi-K2 e Qwen3, GLM-4.5 quer entrar para o trio de primeira linha
- Chatbot Grok foi mais uma vez alvo de controvérsia
- Selo independente vai lançar música gerada por IA
- Publicidade com IA será motor das áreas de entretenimento e mídia
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
CÓDIGO ABERTO
Modelo de IA cria mundos 3D interativos com um simples prompt
Criar mundos 3D ricos e interativos a partir de texto ou simples imagens sempre foi um sonho não realizado para profissionais que trabalham nas áreas de visão computacional, realidade virtual, simulação e desenvolvimento de jogos.
Os métodos atuais muitas vezes sacrificam a consistência 3D, a explorabilidade e a interatividade no nível dos objetos em nome da diversidade visual - são os métodos baseados em vídeo. Por outro lado, métodos 3D produzem ativos tridimensionais genuínos, mas pecam em diversidade, coerência e qualidade visual.
Pode ser que agora esse cenário mude literalmente, com o novo HunyuanWorld 1.0 da Tecent, primeiro modelo de IA de código aberto do mundo a gerar ambientes 3D exploráveis, combinando riqueza visual com consistência 3D, em vez de tratar a geração 2D e 3D como paradigmas separados.
| ![]() Crédito: Tecent |
Como funciona?
O HunyuanWorld 1.0 emprega um pipeline que inteligentemente desconstrói e reconstrói as cenas.
Em vez de gerar diretamente uma malha 3D, o processo começa criando uma imagem panorâmica de alta qualidade que serve como um "proxy do universo em questão", ou seja, uma representação 2D com uma visão de 360º completa. Não é o cenário em si, mas contém todas as informações visuais para construí-lo.
Na segunda etapa, entra em jogo o "entendimento" da cena. Um modelo de linguagem visual (VLM) atua como agente para analisar o panorama gerado e fazer uma segmentação semântica, decompondo cenas complexas em camadas distintas e relevantes. Essa decomposição automatizada é crucial para permitir a reconstrução estruturada e a interatividade dos objetos.
Com a cena dividida em camadas semânticas, o HunyuanWorld realiza a reconstrução 3D. Cada camada é convertida em uma malha 3D, e os objetos são modelados como representações.
Essa abordagem de malha em camadas não só garante um mundo 3D coerente e estruturado, mas é essencial para permitir a interação entre objetos individuais, independentemente do cenário de fundo.
Por que isso importa? Segundo a Tecent, vários experimentos demonstraram que esse novo método alcança melhor desempenho em relação às abordagens existentes.
Além disso, ao criar uma ponte entre o geradores de modelos 2D e exigências estruturais dos ambientes 3D, o HunyuanWorld 1.0 abre novas possibilidades para prototipagem rápida nos setores de desenvolvimento de jogos, simulações dinâmicas e conteúdo interativo para realidade virtual e muito mais.
AI_TRENDS
Web Guide é um experimento do Google Search Labs que usa IA para organizar os resultados de buscas em categorias temáticas.
Microsoft introduziu o modo Copilot (experimental) no navegador Edge que integra pesquisa, bate-papo e navegação em um único campo de entrada.
Google Chrome agora oferece resumos gerados por IA para simplificar as compras on-line para usuários nos Estados Unidos.
Seed LiveInterpret 2.0 é um modelo de interpretação simultânea da ByteDance que replica vozes em alta qualidade com latência ultrabaixa.
Qwen3-235B-A22B-Thinking-2507 é uma atualização do modelo de raciocínio da Alibaba que compete com Gemini 2.5 Pro, o4-mini e DeepSeek R1.
Alibaba também lançou o modelo Wan2.2 para geração de vídeos com melhores recursos cinematográficos usando arquitetura Mixture-of-Experts (MoE).
Aleph é um modelo da Runway que gera e edita vídeos com base em prompts de texto para, por exemplo, remover objetos ou usar novos ângulos de câmera.
Mistral AI propõe como avaliar o ciclo de vida dos modelos de IA e assim estabelecer padrões de sustentabilidade para o setor.
Depois do Kimi-K2 e do Qwen3, agora é o GLM-4.5, da também chinesa Z.ai, que quer entrar para o trio dos modelos de IA de código aberto de primeira linha. 🥇🥈🏅
AI_VENTURES
PROCESSAMENTO DE VÍDEOS
IA ganha memória visual à la Google
A startup Memories AI apresentou o primeiro grande modelo de memória visual (LVMM) que pretende abordar diretamente a limitação que impede os modelos de IA de construir uma compreensão abrangente do mundo visual ao longo do tempo.
A tecnologia inovadora dá aos modelos de IA “memória visual ilimitada” ao redefinir o processamento de vídeos usando recursos de memória semelhantes aos humanos. Como? Ao contrário dos modelos tradicionais de IA que priorizam texto, o LVMM se destaca em analisar e recuperar informações visuais em vastos conjuntos de vídeo.
Inspirado em como o Google revolucionou a pesquisa na web, o LVMM:
Compacta os vídeos em representações detalhadas da memória;
Indexa essas representações em estruturas pesquisáveis;
Agrega informações de diversas fontes gráficas; e
Apresenta memórias relevantes, recuperando-as instantaneamente.
O resultado? Pela primeira vez, você poderá perguntar a um chatbot quantas vezes LeBron James fez arremessos de três pontos em toda a sua carreira e ter uma resposta com base na análise de décadas de imagens. 🏀⛹️🙌
A Memories AI pretende integrar seus sistemas de memória visual em dispositivos móveis para que, por exemplo, usuários possam lembrar de fotos, não apenas armazená-las. Também está estabelecendo parcerias com empresas de hardware para expandir sua base de clientes em vários setores.
AI_GOVERNANCE & ETHICS
😮 Caras e bocas do Grok
O chatbot Grok da xAI foi mais uma vez alvo de controvérsia por conta de um projeto chamado Skippy. A iniciativa envolveu mais de 200 funcionários da xAI gravando suas expressões faciais e conversas para treinar o Grok na interpretação de emoções humanas. As gravações, com duração de até 30 minutos, incluíam expressões faciais exageradas e discussões sobre temas pessoais, com o objetivo de “dar um rosto ao Grok” e, potencialmente, desenvolver avatares. No entanto, o projeto gerou preocupações com a privacidade dos funcionários, que foram obrigados a assinar formulários concedendo direitos “perpétuos” à xAI sobre as imagens para treinamento e promoção comercial de produtos.
⚠️ Quase fake
Relatórios “slop” gerados por IA estão sobrecarregando programas de recompensas de bugs ao produzir falsas alegações de vulnerabilidade que desperdiçam tempo e recursos. Esses documentos parecem convincentes, mas descrevem problemas de segurança inexistentes, frustrando plataformas como HackerOne e Bugcrowd, bem como projetos de código aberto, entre eles Curl e CycloneDX. A consequêcia? Esse movimento abala a confiança e desvia a atenção das vulnerabilidades reais. A propósito, no universo da IA, “slop” é termo usado para se referir a conteúdo de baixa qualidade gerado por IA, seja texto ou imagens, que parece superficialmente válido, mas é impreciso, irrelevante ou absurdo após uma inspeção mais cuidadosa.
AI_SNAPSHOT
💡 Inovação & Inspiração
Perseguindo a cura do câncer Uma plataforma baseada em IA, desenvolvida por pesquisadores da Universidade Técnica da Dinamarca (DTU) e do Instituto Americano de Pesquisa Scripps, projeta proteínas personalizadas chamadas “mísseis moleculares” para ajudar células T do organismo a atingir e destruir células cancerígenas. O método inovador reduz significativamente o tempo necessário para encontrar moléculas eficazes de tratamento do câncer de anos para quatro a seis semanas. 🩺💊
Quebrando barreiras na música O selo independente Hallwood Media assinou um contrato com o músico Imoliver (humano!), apontado como o “designer de música usando IA” mais ouvido na plataforma Suno. Essa é a primeira vez que uma gravadora tradicional contrata um criador de canções via AI. A canção Stone de Imoliver, que já acumulou mais de 3 milhões de reproduções no Suno, será o primeiro hit lançado em todas as principais plataformas de streaming em 8 de agosto de 2025, com o lançamento do álbum completo previsto para 24 de outubro.
🌍 IA Global
🇨🇳 Cooperação mundial Durante a Conferência Mundial de Inteligência Artificial de 2025, realizada em Xangai, o premiê chinês Li Qiang propôs uma cooperação mundial para IA a fim de aprimorar a governança internacional e combater riscos de monopólios tecnológicos. A proposta surge em um cenário em que os Estados Unidos reforçaram os controles de exportação de chips avançados de IA e anunciaram sua própria estratégia de IA para manter a liderança global. Li enfatizou o apoio da China à IA de código aberto e ao compartilhamento de tecnologia, especialmente com países em desenvolvimento, para reduzir a exclusão digital.
🇺🇸 IA usada em desregulamentação O Departamento de Eficiência Governamental (DOGE) dos Estados Unidos, originalmente liderado por Elon Musk, está usando uma ferramenta de IA para identificar e propor a eliminação de até 50% das regulamentações federais. O alvo é cerca da metade das 200 mil existentes, e o objetivo é reduzir os custos de conformidade e os gastos federais avaliado em trilhões de dólares, de acordo com documentos internos obtidos pelo The Washington Post. A Casa Branca afirma que nenhum plano específico foi aprovado.
🔢 IA em números
![]() |
|
AI_TOOLKIT
🛠️Ferramentas
Huhu é um agente para e-commerce que ajuda a criar páginas Web de produtos.
Mintly transforma imagens do seus produtos em anúncios usando IA.
AI Crawlability Checker verifica se rastreadores de IA são capazes de ler suas páginas Web. Se não puderem, significa que seu site não será citado nas respostas dos chatbots. 😔
📚 Miscelânea
IBM Prompt Engineering Guide ajuda desenvolvedores e entusiastas da IA a dominar a arte e a ciência da criação de prompts eficazes para interagir com modelos de IA. Abrange conceitos fundamentais, técnicas avançadas e aplicações práticas dos modelos IBM Granite, GPT-4 da OpenAI, Anthropic Claude e outros.
Em uma entrevista no podcast This Past Weekend, Sam Altman, CEO da OpenAI, abordou a rápida evolução da IA e suas implicações para a humanidade.
AI_FLASH_NEWS
Samsung fechou um acordo de US$ 16,5 bilhões para produzir e fornecer seus chips AI6 para processamento de cargas de IA da Tesla.
Meta apontou Shengjia Zhao, figura-chave na criação do ChatGPT e do GPT-4 da OpenAI, como cientista-chefe de seu laboratório de superinteligência.
As referências geradas por IA aos mil principais sites do mundo cresceram 357% em junho de 2025 na relação ano a ano, segundo a Similarweb.
Pela primeira vez, a edição impressa da revista Vogue incluiu um anúncio com uma modelo criada por IA, com um aviso indicando que ela não é real.
Huawei apresentou o CloudMatrix 384 AI como concorrente para a principal plataforma de infraestrutura de IA da NVIDIA, a GB200 NVL72.
Geoffrey Hinton, considerado padrinho da IA, criticou a maioria dos líderes de grandes empresas de tecnologia por minimizar os riscos associados à IA.
Pesquisadores chineses criaram o ASI-Arch, metassistema de IA que descobriu de forma autônoma mais de 100 novas arquiteturas de redes neurais, acelerando os passo na direção da Inteligência Artificial Geral (AGI). 😲😲😲
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊

