• IA Express
  • Posts
  • Google serve PASTA: modo colaborativo de gerar imagens

Google serve PASTA: modo colaborativo de gerar imagens

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você conhecerá PASTA, a nova receita do Google para criar imagens impressionantes usando IA e colaboração em tempo real. E saberá como Claude Sonnet 4.5 da Anthropic pode ser um aliado da cibersegurança na era da IA. 🍝👩🏻‍🍳🤌🏻

Porém isso não é tudo na IA Express de hoje:
- Google pode reformulando o aplicativo Gemini móvel
- OpenAI está repensando postura em relação aos direitos autorais para Sora 2
- Maior supercomputador de IA dos EUA ostenta 2 exaflops de capacidade
- Netflix busca gerente remoto para ferramentas de IA; salário: até US$ 700k

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

AO GOSTO DO FREGUÊS

Google serve PASTA: modo colaborativo de gerar imagens

Imagine digitar um prompt tão simples quanto “um gol de placa” e, em vez de parar no primeiro resultado, entrar em um diálogo dinâmico com um modelo de geração de imagens. A cada resposta, o modelo mostra opções mais refinadas, aprende com suas escolhas e gradualmente cria a imagem que você imaginava – talvez seu time fazendo um um gol fantástico em final de campeonato em um estádio lotado.

Esse é o futuro dos modelos de geração de imagens baseados em prompts, de acordo com a mais recente invenção do Google Research: Preference Adaptive and Sequential Text-to-image Agent ou PASTA para os íntimos. Em poucas palavras, PASTA reimagina a criação de imagens pela IA não como um jogo de prompts de tiro único, mas como um diálogo colaborativo entre usuário e modelo de IA.



Como funciona?

  • O usuário começa com um prompt para que PASTA proponha diversas versões de imagens usando, por exemplo, o modelo Gemini Flash. Então, o usuário seleciona a que mais se aproxima da sua ideia. Com base nesse feedback, PASTA passa a conhecer as preferências do usuário em tempo real e aprimora iterativamente as futuras sugestões de imagem.

  • PASTA usa um agente baseado em aprendizado por reforço (RL, na sigla em inglês) que se adapta às preferências demonstradas ao longo das interações.

  • O treinamento desse tipo de agente exigiria grandes volumes de dados de interações sequenciais. Então, Google desenvolveu uma abordagem de dois estágios que combina feedback real do usuário com simulação em larga escala. Para isso, (1) coletou um conjunto de dados reais de mais de 7.000 interações de avaliadores, com prompts e imagens correspondentes; (2) usando esses dados, treinou um modelo para simulação de usuários que reproduz escolhas pessoais.

Essa abordagem fez mais do que criar dados. Deu ao Google Research um ambiente controlado para explorar o comportamento de usuários e treinar o agente PASTA para colaborar na geração de imagens.

Por que isso importa? Google Research adverte que PASTA foi desenvolvido particularmente para simular escolha de usuários, mas pode ser aplicado em outras tarefas de IA Generativa que se alinhem melhor ao gosto do freguês.

AI_TRENDS

  • Nano Banana, modelo de geração e edição de imagens do Google, está disponível para uso em ambientes de produção, trabalhando com mais formatos, do cinematográfico 21:9 ao vertical 9:16. 🍌🖼️

  • Jules, agente de IA do Google para codificação, agora tem uma interface de linha de comando (CLI) chamada Jules Tools e uma API pública.

  • Google anunciou uma nova linha de equipamentos domésticos integrados ao Gemini, com câmeras, campainhas e alto-falantes (concorrentes para Alexa?).

  • Octave 2, é a nova versão do modelo da Hume AI que transforma texto em fala (TTS), com melhor compreensão emocional e desempenho otimizado.

  • Qwen3-VL-30B-A3B-Instruct & Thinking veio para competir com GPT-5-Mini e Claude4-Sonnet em tarefas de STEM, agentes, inteligência visual, vídeos e OCR.

  • Think in Games (TiG) dá aos LLMs capacidade de desenvolver compreensão procedural usando jogos, sem perder habilidades de raciocínio e explicação.

  • Lançamento do primeiro dispositivo resultante da parceria entre OpenAI e o designer Jony Ive (ex-Apple) pode ser adiado devido a “problemas técnicos”.

  • Google estaria preparando uma reformulação para o aplicativo Gemini móvel, dando a ele um feed mais envolvente semelhante ao de apps de mídia social. Será um rival para o recém-lançado app Sora da OpenAI? 🇬💫📲 

AI_VENTURES

SEGURANÇA

Claude Sonnet 4.5 coloca ciberdefesa em primeiro lugar

A corrida entre mocinhos e bandidos no cibermundo se intensificou com a evolução da Inteligência Artificial. Por isso, a Anthropic deixa claro que o futuro da IA na cibersegurança deve priorizar a defesa e demonstra na prática como seu modelo Claude pode ser um aliado na identificação, na análise e na correção de vulnerabilidades em grande escala.

Para a Anthropic, Claude Sonnet 4.5 marca um ponto de inflexão na segurança cibernética, superando até mesmo o poderoso Opus 4.1 em importantes tarefas de defesa, como descobrir vulnerabilidades em código, além de ser mais rápido e econômico.

Crédito: Anthropic

Os números falam por si:

  • No benchmarking Cybench, o Sonnet 4.5 alcançou uma taxa de sucesso de 76,5% em 10 tentativas, dobrando o desempenho de seu antecessor.

  • No CyberGym, que avalia a capacidade de encontrar vulnerabilidades (previamente descobertas) em projetos reais de código aberto, o Sonnet 4.5 identificou falhas conhecidas em 66,7% dos casos e descobriu novas vulnerabilidades em mais de 33% em 30 tentativas.

  • Testes preliminares se mostram promissores na automação de patches, com muitas correções geradas por IA demonstrando ser semanticamente equivalentes às criadas por profissionais em pessoa.

E esse avanço não é acidental. Enquanto versões anteriores do Claude desenvolveram habilidades de cibersegurança por meio de treinamento geral, a Anthropic agora direcionou pesquisas com foco no aprimoramento da defesa, sem otimizar casos de uso de ciberataque, como malware ou outro código mal-intencionado.

AI_GOVERNANCE & ETHICS

©️Recalibrando a postura

Poucos dias após o lançamento do Sora2, a OpenAI já está recalibrando sua postura em relação aos direitos autorais. Com a capacidade do Sora 2 de gerar clipes de alta fidelidade, como episódios completos do South Park, a plataforma rapidamente se tornou um campo minado jurídico. Agora, está pisando no freio, com o bloqueio de prompts envolvendo material protegido por direitos autorais. Mais ainda, em seu blog, Sam Altman, CEO da OpenAI, relatou que serão lançadas ferramentas para dar aos detentores de direitos mais controle sobre como seus personagens podem ser usados na geração dos vídeos - algo parecido com a padrão opt-in, porém mais granular. A OpenAI também planeja monetizar a geração de vídeos e compartilhar a receita com os detentores dos direitos. A partir de quando? Muito em breve, disse Altman.

💃Atriz real X virtual

Hollywood está testemunhando uma onda de preocupação após o surgimento de Tilly Norwood, atriz gerada por IA pelas mãos da comediante e atriz holandesa Eline Van der Velden. A artista sintética rapidamente atraiu a indignação de poderosos sindicatos de atores e celebridades de primeira linha, entre elas Emily Blunt e Whoopi Goldberg, que afirmam que a criação da IA “não é uma atriz, é uma personagem gerada por um programa de computador treinada com o trabalho de inúmeros artistas profissionais”. Em meio à reação negativa, Van der Velden postou na página de Tilly no Instagram que a atriz de IA “não é um substituta do ser humano, mas uma obra criativa, uma obra de arte”. Argumentou que criar Tilly foi “um ato de imaginação e habilidade, não muito diferente de criar uma personagem, escrever um papel para um ator ou moldar uma performance” e sugeriu que tais criações devem ser julgadas “como parte de seu próprio gênero”, em vez de serem comparadas diretamente a atores em pessoa.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Sem professores tradicionais Em uma esquina de Austin, Texas (EUA), uma mudança radical está acontecendo na educação da Alpha School, com a IA não apenas apoiando o aprendizado, mas o conduzindo. Nessa escola particular que custa US$ 40.000 por ano, alunos da quarta e quinta séries passam as manhãs aprendendo matemática, ciências e leitura com a ajuda de um software de IA personalizado. Não há professores tradicionais dando aulas. Em vez disso, “guias” encorajam e motivam os alunos, oferecendo orientação individual e promovendo workshops em grupo todas as semanas. Esses guias, que ganham salários de seis dígitos, não ensinam conteúdo acadêmico — os algoritmos é que fazem isso. 🙋🏻‍♂️👩🏻‍💻🏫

  • Parceiro de pesquisa O MIT revelou uma plataforma de IA para atuar como parceiro de pesquisa, acelerando a experimentação científica. Ao contrário das ferramentas convencionais de IA, o CREST (Copilot for Real-world Experimental Scientists) integra dados multimodais – literatura científica, imagens e resultados experimentais – em tempo real para planejar, executar e refinar experimentos de forma autônoma, criando um ciclo dinâmico de testes e melhorias de hipóteses. Em um estudo recente, pesquisadores usaram o CREST para acelerar o desenvolvimento de catalisadores de células de combustível – CREST avaliou mais de 900 produtos químicos e realizou 3.500 testes eletroquímicos. O resultado? Um catalisador de alto desempenho que reduz a dependência do paládio e alcança eficiência recorde. ⚗️🧪👩🏻‍🔬

🌍 IA Global

🇺🇸 Supercomputador de IA O Laboratório Lincoln do MIT revelou o supercomputador de IA mais poderoso entre os alojados em universidades dos Estados Unidos. Listado entre os sistemas de elite TOP500, o TX-Generative AI Next (TX-GAIN) ostenta impressionantes 2 exaflops de capacidade computacional (dois quintilhões de operações de ponto flutuante por segundo) garantidos por mais de 600 GPUs NVIDIA otimizadas para cargas de trabalho de IA juntamente com hardware tradicional de computação de alto desempenho (HPC). Uma aplicação particularmente promissora está na biodefesa biológica, com o TX-GAIN ajudando a transformar a análise de proteínas.

🇯🇵 Serviços públicos (ainda) melhores OpenAI fechou uma parceria estratégica com a Agência Digital do Japão para explorar o uso seguro da IA Generativa em serviços governamentais. Como parte do acordo, a instituição lançará o Gennai, ferramenta baseada na tecnologia da OpenAI para uso dos funcionários públicos em todo o país. O objetivo é otimizar os fluxos de trabalho e apoiar o desenvolvimento de soluções de IA que melhorem os serviços prestados aos cidadãos. OpenAI já colabora com Japão em outra iniciativa envolvendo o Hiroshima AI Process Comprehensive Policy Framework, que promove a adoção segura e confiável da IA em todo o mundo.

📢 IA em uma frase

“Sentimos alguma apreensão. Estamos cientes de como um serviço como Sora pode ser viciante e das muitas maneiras em que pode ser usado para bullying.”

A frase é de Sam Altman, CEO da OpenAI, sobre o novo app para criar e compartilhar vídeos curtos gerados por IA, que se tornou uma febre. Reconhecendo o risco de comportamento viciante para os usuários, afirmou que vai monitorar o aplicativo de perto e, em caso de piora do cenário, poderá até desativar o aplicativo.

 AI_TOOLKIT

🛠️Ferramentas

  • AgentKit é um conjunto de ferramentas da OpenAI para desenvolver, implantar e otimizar agentes de IA.

  • GeoInfer analisa pistas visuais para geolocalizar imagens; indicado para investigadores, pesquisadores e profissionais de segurança.

  • Sound Effect Generator transforma ideias em efeitos sonoros de alta qualidade gratuitamente.

📚 Miscelânea

  • Artigo da Anthropic descreve a importância da gestão de contexto ( e não mais de prompts) dos grandes modelos de linguagem (LLMs) para agentes de IA que lidam com tarefas mais complexas e de várias etapas. LLMs têm limites inerentes, como "orçamentos de atenção" finitos (capacidade computacional de processar relações entre tokens) e "deterioração de contexto" (recuperação degradada de informação à medida que o contexto cresce mais). O estudo traça paralelos com a cognição humana.

  • O caso de um canadense que desenvolveu delírios ao longo de 21 dias de interação com ChatGPT fez com que Steven Adler, ex-pesquisador da OpenAI, realizasse uma análise independente do incidente. Veja os resultados aqui.

 AI_FLASH_NEWS

  • OpenAI atinge a avaliação recorde de US$ 500 bilhões e se consolida como a maior empresa de capital fechado do mundo, superando a SpaceX.

  • Mais da OpenAI: no X, declara que não precisa de segredos comerciais de ninguém (em referência a Elon Musk) e não aceitará intimidação.

  • Uber compra a startup belga de rotulagem de dados Segments.ai como parte dos esforços de treinamento de IA.

  • Perplexity adquire a startup Visual Electric cujos profissionais vão compor o novo grupo com foco em experiências com produtos de consumo.

  • Granite 4.0, da IBM, é uma nova família de grandes modelos de linguagem (LLMs) para empresas com foco em alto desempenho.

  • Universal Music e Warner Music estão a poucos passos de fechar acordos de licenciamento para IA com Google, Spotify e outras startups de IA

  • Banco Central Europeu escolhe a startup portuguesa Feedzai de IA para proteger o futuro euro digital contra fraudes.

  • xAI está contratando um tutor para treinar Grok em conceitos de videogame, mecânica, design e jogabilidade.

  • Médicos apontam maneiras adequadas de contar com ChatGPT para aconselhamento de saúde.

  • Já a Netflix está buscando um gerente remoto para administrar ferramentas de IA destinadas a elevar a eficiência dos funcionários. Salário: até US$ 700k anuais. Vai se candidatar? 🇳👔📡

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊