IA Express
Posts
Hunyuan-GameCraft transforma imagens em cenas para jogos

Hunyuan-GameCraft transforma imagens em cenas para jogos

Sheila Zabeu
22 ago

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você verá como a IA transforma apenas uma imagem em um universo inteiro para jogos interativos. E saberá que a Microsoft está ensinando agentes de IA a pensar em 3D, de modo parecido como fazemos. 🧠🎲↔️

Porém isso não é tudo na IA Express de hoje:
- Microsoft introduz função COPILOT no Excel
- O perigo real não está na IA alcançar consciência, diz CEO da Microsoft da AI
- Reels no Instagram e no Facebook ganham tradução de voz por IA
- Ferramenta de IA automatiza processo de marketing de influenciadores

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

GERAÇÃO DE VÍDEO

Hunyuan-GameCraft transforma imagens em cenas para jogos

Contando com a Inteligência Artificial para superar as atuais limitações impostas à criatividade e à interatividade, a Tencent Hunyuan apresentou o Hunyuan-GameCraft, estrutura que gera cenas para jogos interativos e altamente dinâmicos a partir de apenas uma única imagem estática e entradas fornecidas pelos usuários por teclado ou mouse.

A promessa do Hunyuan-GameCraft é eliminar os principais pontos problemáticos das tecnologias atuais para geração de vídeos, entre eles inconsistência, ineficiência e falta de controle dinâmico.

Crédito: Tencent

Como funciona? Imagine fazer o upload de uma foto de paisagem serena ou de uma rua movimentada na cidade e depois, usando o teclado ou o mouse, orientar a IA a estender a cena para gerar um vídeo coerente e dinâmico que responde aos controles do usuário em tempo real. É justamente assim que o Hunyuan-GameCraft funciona: um modo interativo com controle refinado das ações que imitam uma jogabilidade real.

O modelo de IA usado pela Tencent foi treinado usando um conjunto de dados com mais de um milhão de gravações de jogabilidade de mais de 100 jogos de classe AAA, para garantir ampla cobertura e diversidade. Em seguida, foi refinado a partir de dados sintéticos cuidadosamente criados para melhorar a precisão e o controle sobre os vídeos.

A Tencent comparou o Hunyuan-GameCraft com outros métodos de vídeo interativo em vários cenários de jogos e estilos de arte para avaliar a precisão do controle, a consistência das imagens, a preservação do histórico e o desempenho dinâmico em vários cenários e estilos e assim revelar o poder da Hunyuan-GameCraft.

Em termos gerais, a Tencent assegura que o Hunyuan-GameCraft supera os modelos existentes em termos de realismo e jogabilidade. Quer conferir você mesmo? Veja o Hunyuan-GameCraftem em ação e os resultados aqui.

AI_TRENDS

Paradigm é uma plataforma de planilhas com tecnologia de IA que incorpora agentes de IA diretamente nas células.
E, por falar em planilhas, a Microsoft introduziu a função COPILOT no Excel para executar tarefas de IA Generativa diretamente nas células usando prompts.
Nemotron Nano 2 é a nova família de modelos de IA da NVIDIA indicada para tarefas de raciocínio de alto desempenho.
M3-Agent é uma estrutura multimodal que processa entradas de áudio e vídeo em tempo real para criar e atualizar uma memória de longo prazo.
Qwen-Image-Edit, da Alibaba, é um modelo de IA que trabalha com dois tipos de edição de imagens (pixels ou para áreas específicas) e transformação de estilos.
Eleven Music, que gera músicas personalizadas a partir de prompts de texto, agora está disponível via API.
Atlas anunciou uma parceria com Google Cloud para incrementar sua infraestrutura de agentes de IA e acelerar a criação de jogos nativos em IA.
Acrobat Studio integra Adobe Acrobat, Adobe Express e agentes de AI para impulsionar a produtividade e a criatividade.
Grammarly adicionou oito agentes à nova plataforma nativa em IA chamada Grammarly Docs para ajudar em tarefas de escrita direcionada.
Grok Imagine ganhará uma versão para Web em breve. ✨🪄🔜

AI_VENTURES

ESPAÇOS 3D

MindJourney faz raciocínio espacial imitando cognição humana

A Microsoft Research apresentou uma estrutura que dá a agentes de IA a capacidade de interpretar e navegar por ambientes 3D com precisão. Trata-se do novo MindJourney, que aborda uma limitação crítica em modelos de linguagem visual (VLMs), oferecendo um modo de raciocínio para relações espaciais que imita a cognição humana.

O que você precisa saber:

Modelos de linguagem visual são bons em identificar objetos em imagens 2D estáticas, mas muitas vezes pecam ao interpretar mundos 3D dinâmicos e interativo. Por exemplo, responder perguntas espaciais como: “Se eu sentar no sofá à frente, a cozinha estará à minha direita ou esquerda?” requer uma compreensão espacial com que os VLMs tradicionalmente não contam.
Já nós simulamos mentalmente os movimentos no espaço, combinando instantâneos para deduzir as posições dos objetos. O MindJourney replica justamente esse processo, usando um modelo de mundo – sistema de geração de vídeos que gera imagens fotorrealistas com base em possíveis movimentos dos agentes.
Ao combinar isso com um VLM, o MindJourney explora iterativamente um espaço 3D, selecionando as visões mais informativas para responder com precisão perguntas espaciais. Essas perspectivas promissoras são mantidas e expandidas na próxima iteração.

Por que isso importa? A capacidade do MindJourney de raciocinar em 3D tem implicações relevantes para agentes de IA em áreas como robótica, casas inteligentes e acessibilidade. Ao simular ambientes tridimensionais, a IA pode antecipar como as cenas mudam com os movimentos, melhorando as tarefas de navegação e manipulação.

AI_GOVERNANCE & ETHICS

🪬 Consciência aparente

A Inteligência Artificial está prestes a se tornar consciente? De acordo com Mustafa Suleyman, CEO da Microsoft da AI, o perigo real não é alcançar consciência, mas se tornar tão convincente em imitá-la que passaremos a acreditar que a IA é consciente. Suleyman chama esse conceito de Seemingly Conscious AI, em inglês, ou IA aparentemente consciente. O executivo destaca a necessidade de realizarmos um debate público para estabelecer normas e padrões claros sobre como desenvolver e interagir com esses sistemas inteligentes. O foco, ele insiste, deve estar no desenvolvimento da IA como uma companheira útil em vez de buscar a criação de uma entidade artificial consciente. Essa mudança de mentalidade é fundamental para garantir que a IA continue sendo uma ferramenta a serviço da humanidade e não um ente percebido como algo que a divide.

🫂 Empatia problemática

Modelos de linguagem otimizados para serem empáticos e afetuosos se tornam menos confiáveis. Experimentos da Universidade de Oxford com cinco modelos diferentes revelaram que aqueles mais "calorosos" apresentam taxas de erro bem maiores (10 a 30 pontos percentuais) em tarefas críticas em termos de segurança. São mais propensos a fornecer desinformação, promover teorias da conspiração e dar recomendações médicas problemáticas. Também costumam validar crenças incorretas, especialmente quando a mensagem do usuário expressa tristeza. Esse efeito foi consistente em diferentes arquiteturas e tamanhos de modelos, sugerindo um problema sistemático quando se tenta equilibrar empatia e confiabilidade dos modelos de IA.

AI_SNAPSHOT

💡 Inovação & Inspiração

Sem barreiras de idioma A Meta liberou um recurso de tradução de voz usando Inteligência Artificial para Reels no Instagram e no Facebook. A ferramenta permite, por exemplo, traduzir conteúdo de voz de modo automático usando o tom de voz original. Também há a opção de sincronização labial para que o conteúdo dublado fique mais natural. A tradução está disponível inicialmente entre os idiomas inglês e espanhol, sendo que mais línguas devem ser adicionadas futuramente. Criadores de conteúdo no Facebook com mil ou mais seguidores, mas todas as contas públicas do Instagram podem acessar o recurso. 😄💬𝗘𝗡G-SPA
Vida mais fácil Uma nova ferramenta da Higgsfield chamada Product-to-Video vai facilitar a vida de anunciantes on-line. Parte da plataforma Draw-to-Video, a novidade vai além dos métodos tradicionais que transformam texto ou imagem em vídeos usando prompts complexos e permite simplesmente arrastar e soltar a imagem do produto a ser anunciado em uma cena de vídeo. Com alguns cliques para redimensionar a imagem e indicar a ação desejada, a IA integrará perfeitamente o produto em um vídeo com qualidade de cinema. 📣📽️⋆✴︎˚｡⋆

🌍 IA Global

🇨🇳 Novo chip de IA para China A NVIDIA pode estar desenvolvendo um novo chip de IA para a China, com base na avançada arquitetura Blackwell, que deve superar o atual modelo H20. Com nome provisório B30A, o processador oferece cerca de metade do poder computacional do principal acelerador B300 da NVIDIA. Incluirá memória com alta largura de banda e tecnologia NVLink para proporcionar melhor transferência de dados entre processadores. A novidade deve cumprir as restrições de exportação impostas pelo governo dos Estados Unidos, mas ainda assim atender à demanda chinesa por chips de IA.

🇬🇧 Soberania em design de chips de IA O Conselho de Ciência e Tecnologia (CST) do Reino Unido enfatizou a importância estratégica do desenvolvimento de uma indústria soberana de design de chips de IA no país. A instituição descreveu seis recomendações para atingir tal soberania, com foco no aprimoramento de habilidades por meio de um currículo nacional de design de chips e no treinamento de profissionais, além de investimentos e a criação de uma infraestrutura robusta.

📢 IA em uma frase

“As pessoas querem memória, querem recursos nos produtos que sejam capazes de entendê-las.”

Mal o GPT-5 foi lançado, e Sam Altman, CEO da OpenAI, já está falando do GPT-6. O executivo revelou que o foco será em oferecer mais memória para tornar as interações mais pessoais e adaptadas às preferências dos usuários.

AI_TOOLKIT

🛠️Ferramentas

Stormy é uma solução baseada em IA que automatiza todo o processo de marketing de influenciadores, da busca à negociação de contratos.
Moviefloai transforma ideias em scripts, personagens e storyboards para criar filmes de diversos estilos.
Y2doc transforma conteúdo do Youtube em documentos estruturados usando IA.

📚 Miscelânea

O novo MoNaCo do Allen Institute for AI é um sistema de benchmarking para avaliar grandes modelos de linguagem (LLMs) em consultas altamente desafiadoras e específicas, que exigem raciocínio sobre centenas de fatos. Mesmo os modelos mais robustos enfrentaram dificuldades. O melhor resultado foi conquistado pelo o3, que respondeu perfeitamente apenas 38,7% das perguntas do MoNaCo.

AI_FLASH_NEWS

xAI publicou milhares de conversas do chatbot Grok, tornando-as pesquisáveis no Google, em muitos casos, sem permissão dos usuários.
Relatório aponta que 95% dos programas-piloto de IA Generativa não geram retorno financeiro relevante. Principal problema? Falta de aprendizagem.
Google lançou a série Pixel 10 de smartphones, com processador Tensor G5 para acelerar a experiência com IA.
OpenAI lançou um plano chamado ChatGPT Go na Índia por cerca de US$ 4,60, bem mais barato que o ChatGPT Plus disponível até então no país.
Agora é oficial: a unidade de IA da Meta será reorganizada em quatro novos grupos, de acordo com memorando interno.
Bill Gates lançou uma competição de IA com premiação de US$ 1 milhão destinada a acelerar a pesquisa da doença de Alzheimer.
Startup lançou Halo X, óculos inteligentes que ouvem, gravam e transcrevem conversas continuamente, exibindo informações relevantes em tempo real.
Big techs, como Meta e Google, estão contratando os melhores talentos de IA de startups, muitas vezes fazendo delas “empresas zumbis”. 🤹🏽💡🧟

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.