IA Express
Posts
Modelos de vídeo: próximos generalistas em inteligência visual

Modelos de vídeo: próximos generalistas em inteligência visual

Sheila Zabeu
1 out

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você descobrirá como modelos de geração de vídeos como Veo 3 do Google podem revolucionar a inteligência visual com versatilidade baseada em prompts. Também saberá que menos dados – mas estrategicamente selecionados – podem levar mais autonomia a sistemas de IA. 🎥🎯

Porém isso não é tudo na IA Express de hoje:
- Vibes do app Meta AI cria e remixa vídeos curtos gerados por IA
- GDPval avalia modelos de IA em tarefas com valor econômico do mundo real
- Atriz totalmente gerada por IA já é cobiçada por agências de talentos
- Você já ouviu falar de workslop?

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

PRÓXIMA FRONTEIRA

Modelos de vídeo: próximos generalistas em inteligência visual

Será que modelos de geração de vídeo, como o Veo 3 do Google, podem espelhar o sucesso do ChatGPT e dos demais grandes modelos de linguagem (LLMs), tornando-se uma ferramenta de propósito geral? Pesquisadores do Google DeepMind se fizeram essa pergunta e buscaram um possível resposta.

Essa classe de modelos de IA, que cria vídeos a partir de descrições em prompts, está começando a exibir capacidade de percepção, modelagem, manipulação e até raciocínio. Para testar essas habilidades, os pesquisadores colocaram o Veo 3 à prova aplicando 62 tarefas qualitativas e 7 sistemas de benchmarking quantitativos, tentando revelar seu potencial para enfrentar desafios como segmentação de objetos, detecção de bordas, edição de imagens, simulações físicas e lógica visual.

Os resultados? Ao contrário dos modelos de visão tradicionais que exigem ajuste fino para realizar tarefas específicas, o Veo 3 as executou contando apenas com prompts. Como nem tudo é perfeito, o Veo 3, às vezes, viola leis da física ou tem dificuldade com trabalhos complexos envolvendo raciocínio.

Por que isso importa? Essa flexibilidade do Veo reflete a maneira como LLMs lidam com diversas tarefas em linguagem natural, sugerindo que modelos de geração de vídeo podem unificar a paisagem fragmentada da visão computacional sob uma única interface baseada em prompts – sem necessidade de treinamento especializado.

Isso ajudará a simplificar a vida de setores como cinema, jogos e sistemas autônomos, além de acelerar a pesquisa de IA, reduzindo dependência de modelos específicos para diferentes tarefas.

AI_TRENDS

Microsoft 365 Copilot agora oferece como opção Claude Sonnet 4 e Claude Opus 4.1 da Anthropic, além dos modelos da OpenAI.
Vibes é o novo recurso no app da Meta AI para criar, remixar ou apenas assistir a vídeos curtos gerados por IA para inspirar a criatividade.
ChatGPT Pulse gera resumos matinais personalizados com base em bate-papos e aplicativos como caixa de e-mails e agenda; disponível para planos Pro.
Adobe Firefly Boards é um espaço de criação para explorar os principais modelos do IA, como Firefly, Google, Luma AI, Moonvalley, Pika e Runway.
Nova Perplexity Search API dá acesso à mesma infraestrutura global que alimenta o mecanismo de respostas na página Web do Perplexity.
Google atualiza Gemini 2.5 Flash e 2.5 Flash-Lite para oferecer mais qualidade e eficiência.
Wan 2.5, da Alibaba, cria clipes com som sincronizado nativamente, integrando vídeo e áudio em um único processo.
Também da Alibaba, Qwen3-VL é um novo modelo visual com versões Instruct e Thinking, esta última com excelente desempenho em raciocínio multimodal.
Kling 2.5 Turbo é a nova versão do modelo de geração de vídeo com avanços em adesão aos prompts, controle da câmera e realismo.
Microsoft integrou agentes de IA ao GitHub Copilot que modernizam aplicações Java desatualizadas, automatizando tarefas como refatoração de código, resolução de dependências e correção de vulnerabilidades.</>👩🏻‍💻

AI_VENTURES

TREINAMENTO

Quando menos é mais para sistemas de IA

Um estudo recente está desafiando a noção de que treinamento com grandes conjuntos de dados sempre leva a sistemas de IA melhores. A pesquisa apresenta uma estrutura chamada LIMI (Less Is More for Intelligent Agency) projetada para estimular a capacidade de autonomamente identificar problemas, criar hipóteses e executar soluções a partir de poucas demonstrações.

Ao contrário das abordagens tradicionais que dependem de volumes de dados em massa, a LIMI usa apenas 78 amostras de treinamento cuidadosamente selecionadas com foco em desenvolvimento colaborativo de software e pesquisa científica. Essa abordagem minimalista produz resultados impressionantes, alcançando precisão de 73,5% no AgencyBench, ferramenta de benchmarking que avalia LLMs como agentes autônomos, superando em muito Qwen3-235B-A22B-Instruct (27.5%), Kimi-K2-Instruct (24,1%) e DeepSeek-V3.1 (11.9%) e mesmo modelos treinados com 10 mil amostras.

O resultado? O estudo estabeleceu um princípio: a autonomia não emerge da abundância de dados, mas da curadoria estratégica de demonstrações de comportamento de alta qualidade.

Por que isso importa? Ao priorizar amostras qualificadas, a LIMI transforma a forma como se desenvolvem sistemas de IA autônomos para tarefas práticas, desde programação até pesquisa, tornando o processo mais rápido e eficaz.

AI_GOVERNANCE & ETHICS

💼 Mostrando resultados no trabalho

O GDPval da OpenAI é uma nova estrutura de avaliação dos modelos de IA em tarefas com valor econômico do mundo real. A ferramenta abrange 44 ocupações em nove setores que contribuem para o PIB dos Estados Unidos e veio preencher a lacuna entre sistemas de benchmarking acadêmicos e aplicações práticas no ambiente de trabalho - concentra-se em funções baseadas em conhecimento nas quais a IA tem potencial para poupar tempo e reduzir custos. Os resultados? Claude Opus 4.1 foi o modelo com melhor desempenho no conjunto, destacando-se particularmente em estética (por exemplo, formatação de documentos, layout de slides). Já o GPT-5 se destacou em precisão (por exemplo, encontrar dados específicos em algum domínio).

🩺 IA guiando autorização prévia

Um novo programa-piloto do sistema de saúde Medicare dos Estados Unidos em 2026 usará IA para avaliar a autorização prévia de procedimentos médicos e assim ajudar a reduzir desperdícios. O programa segue a prática já comum em seguradoras particulares e será conduzido até 2031 em seis estados. No entanto, a iniciativa gerou preocupações entre legisladores, médicos e pesquisadores sobre os impacto no acesso e na qualidade dos cuidados de saúde. Críticos argumentam que a autorização prévia guiada pela IA tem elevado as taxas de negação, muitas vezes por pouca supervisão humana, o que pode minar o julgamento médico e atrasar tratamentos necessários, em particular entre idosos.

AI_SNAPSHOT

💡 Inovação & Inspiração

Nova candidata ao estrelato Tilly Norwood, atriz totalmente gerada por IA, está emergindo como a mais nova estrela em ascensão. Criada pelo estúdio Xicoia, Tilly foi apresentada ao mundo no início deste ano e já conseguiu seu primeiro papel na esquete de comédia AI Commissioner. A pretensão de Tilly, segundo seus criadores? Alcançar o mesmo status icônico de Scarlett Johansson ou Natalie Portman. E, acredite, várias agências de talentos já querem representar Tilly. 🌟🎬
Interface old fashion ou da era da IA? Anthropic está testando um novo recurso batizado de Imagine que pode ser um sinal de mudança na forma como interagimos com a IA. Escondido no canto inferior direito da tela, Imagine lança um ambiente de desktop de estilo retrô com ícones, janelas e um prompt perguntando: “O que você quer construir com sua imaginação?” O cenário sugere que Imagine funcionará como um agente de IA para criar aplicativos e outros artefatos digitais diretamente no ambiente do modelo Claude. Será um movimento em direção a interfaces criadas por agentes de IA que se adaptam às demandas de quem as usa?🖼️🖥️

🌍 IA Global

🇬🇧 Regras para uso de IA na saúde O governo do Reino Unido lançou uma comissão para regulamentar o uso da IA em seu serviço nacional de saúde (NHS), fazendo dele o mais habilitado do mundo para trabalhar com Inteligência Artificial. A principal missão do grupo será revisar regulamentos para acelerar a adoção segura de tecnologias de IA. A comissão vai explorar ferramentas inteligentes para assistência médica, diagnósticos e monitoramento remoto de pacientes. Com base em contribuições de partes interessadas e grupos de trabalho especializados, um novo "livro de normas" para IA deverá ser lançado em 2026.
🇩🇪 Trio no setor público OpenAI e SAP SE anunciara a iniciativa OpenAI for Germany para integrar soluções avançadas de IA no setor público da Alemanha. Com lançamento previsto para 2026, o projeto vai reunir as tecnologias de IA da OpenAI, a expertise em soluções empresarias da SAP e a infraestrutura de computação em nuvem Microsoft Azure. O pacote será entregue pela Delos Cloud, subsidiária da SAP, e garantirá total conformidade com as rigorosas regras de soberania e segurança de dados e com os requisitos regulatórios alemães.

📢 IA em uma frase

“Eles estão nanossegundos atrás de nós.”

A frase é de Jensen Huang, CEO da NVIDIA, referindo-se à China e ressaltando que os Estados Unidos estão enfrentando um formidável, inovador, faminto, rápido e pouco regulado competidor.

AI_TOOLKIT

🛠️Ferramentas

OK Computer é o novo modo agente do Kimi K2 para criar sites, slides editáveis, designs para dispositivos móveis e painéis interativos a partir de prompts.
HiClip transforma vídeos longos em clipes para Shorts, Reels e TikTok, encontrando neles momentos de alto engajamento.
MySQL AI, da Oracle, integra recursos de IA ao MySQL para ajudar no desenvolvimento e na operação de banco de dados.

📚 Miscelânea

Você já ouviu falar de workslop? É o termo que pesquisadores do BetterUp Labs e do Stanford Social Media Lab cunharam para definir conteúdo de baixa qualidade gerado por IA no ambiente de trabalho. O termo foi criado depois de identificarem em uma pesquisa com 1.150 profissionais que 40% dos entrevistados se depararam com “worklop” no período de um mês.

AI_FLASH_NEWS

xAI acusa OpenAI de lançar uma “campanha ilegal” para roubar funcionários e tecnologia proprietária por trás de seu chatbot.
IA tem um futuro promissor na América Latina, mas limitado pela enorme escassez de treinamento, disse Adriana Noreña, VP do Google para a região.
Apple criou o chatbot interno Veritas para que funcionários testem recursos de IA previstos para a próxima grande atualização da Siri.
Anthropic deve triplicar sua força de trabalho fora dos Estados Unidos e quintuplicar sua equipe de IA Aplicada em 2025.
De outro lado, Anthropic pagará US$ 1,5 bilhão em ação judicial por violação de direitos autorais de 500 mil livros; acordo preliminar foi aprovado.
Investimentos insustentáveis em IA estão suportando artificialmente a economia dos Estados Unidos, diz nota do Deutsche Bank aos clientes.
Morgan Stanley emitiu um aviso de que a IA pode ser uma ameaça para gigantes de software como a Adobe, conhecida pelo Photoshop e Illustrator.
Enter, empresa brasileira especializada em automação e otimização do ciclo de vida dos processos judiciais usando agentes de IA, recebeu o maior valor de investimentos em IA na América Latina até hoje (US$ 35 mi). 💚💛

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊