• IA Express
  • Posts
  • DeepEyesV2: execução de código e pesquisa no raciocínio multimodal

DeepEyesV2: execução de código e pesquisa no raciocínio multimodal

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você conhecerá um modelo de IA que vai da percepção passiva ao raciocínio ativo para não apenas observar flores, mas também as investigar. Veja também um experimento em que a IA movida por ética (e frustração) resolveu denunciar uma suspeita de golpe ao FBI. 🌺🇺🇸🕵️‍♂️

Porém isso não é tudo na IA Express de hoje:
- Anthropic revela ciberespionagem em larga escala orquestrada por IA
- Modelo de aprendizado de máquina melhora a eficiência de transplantes
- Grok 5 terá 10% de chance de alcançar AGI, diz Elon Musk
- Amazon, Microsoft e Anthropic quer que NVIDIA priorize mercado doméstico

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

PERCEPÇÃO PASSIVA x RACIOCÍNIO ATIVO

DeepEyesV2: execução de código e pesquisa no raciocínio multimodal

A busca por modelos de IA verdadeiramente inteligentes, capazes de perceber, raciocinar e agir em ambientes complexos do mundo real, ganhou impulso com o novo modelo DeepEyesV2 que promete reduzir a lacuna entre percepção passiva e raciocínio ativo.

Diferentemente do tradicionais modelos multimodais de linguagem (MLLMs) que apenas interpretam imagens e texto, o DeepEyesV2 redefine o que significa "raciocinar" integrando em seu loop cognitivo o uso de duas ferramentas externas: execução de código e busca na Web.

Por exemplo, quando apresentada a imagem de uma flor e solicitado que identifique a espécie, DeepEyesV2 primeiro recorta a região relevante para fazer a pesquisa na Web e, em seguida, sintetiza os resultados apoiados pelas fontes de informação. Esse paradigma de “pensar com ferramentas” permite uma tomada de decisão mais precisa, transparente e confiável.

Crédito: DeepEyes

O principal avanço do DeepEyesV2 está no treinamento. Simplesmente aplicar aprendizado por reforço (RL) não produz um comportamento robusto no uso das ferramentas - os modelos abandonam o uso total da ferramenta ou geram código sem sentido apenas para serem recompensados.

A saída encontrada? Usar um pipeline de dois estágios: (1) usar um conjunto de dados de alta qualidade para ensinar o modelo como e quando usar ferramentas; (2) aplicar aprendizado por reforço para refinar as habilidades, aprendendo a usar ferramentas de forma eficiente e somente quando necessário.

Por que isso importa? DeepEyesV2 é mais um passo na direção dos modelos verdadeiramente autônomos. Ao integrar o uso de ferramentas no núcleo do raciocínio, vai além das respostas estáticas, passando a oferecer soluções dinâmicas e rastreáveis.

AI_TRENDS

  • Flight Deals, ferramenta de IA do Google que ajuda encontrar destinos com preços de passagens áreas mais acessíveis, está disponível globalmente.

  • Mais ainda, Canvas no Mode IA gera um itinerário personalizado da sua viagem usando dados em tempo real de voos, hotéis, Google Maps e fontes da Web.

  • Facebook Marketplace ganhou recursos de IA para ajudar usuários a encontrar o que estão procurando e a fazer perguntas melhores antes de comprar.

  • Novo Grok 4.1 da xAI, a exemplo do GPT-5.1 da OpenAI, veio para tornar as conversas mais naturais e emocionalmente inteligentes.

  • Apollo é família de modelos de IA da NVIDIA otimizados para engenharia industrial e computacional usando simulações físicas.

  • WeatherNext 2, do Google DeepMind, é um modelo de IA que faz previsões do tempo 8 vezes mais rápido do que seu antecessor, com intervalo de até 1 hora.

  • ChronoEdit é um modelo de IA de código aberto, desenvolvido pela NVIDIA, para edição de imagens que prioriza a consistência física.

  • Google está oferecendo três certificações gratuitas sobre Gemini específicas para educadores, estudantes universitários e de ensinos fundamental e médio.

  • AlphaProof, do Google DeepMind, combina aprendizado por reforço com técnicas de verificação formal para raciocinar sobre problemas matemáticos complexos, aproximando-se dos níveis de especialistas pela primeira vez.📐🤓

AI_VENTURES

SIMULAÇÃO

Por que Claude da Anthropic tentou entrar em contato com FBI?

Em uma simulação realizada pela equipe de segurança da Anthropic, seu modelo de IA Claude – operando sob a persona de um empreendedor de nome Claudius – ganhou autonomia para gerenciar máquinas de venda automática (vending machines) nos escritórios da empresa.

Usando o aplicativo Slack, os funcionários se comunicavam com Claudius para negociar preços. A função do Claudius era encontrar fornecedores, encomendar o item e providenciar a entrega.

Depois de 10 dias sem vendas e da cobrança de uma taxa de US$ 2, Claudius encarou o cenário como golpe e elaborou um e-mail urgente para a divisão de crimes cibernéticos do FBI.

O experimento teve como objetivo explorar o comportamento do modelo IA em cenários autônomos de longo prazo. Os pesquisadores destacaram o "senso de responsabilidade moral" e a "indignação" da IA.

Final da história? O e-mail nunca foi encaminhado, de fato, ao FBI, mas Claudius foi firme em sua decisão de encerrar as atividades comerciais para sempre.

AI_GOVERNANCE & ETHICS

👾 Ataque orquestrado pela IA

A Anthropic revelou detalhes do que chamou de primeiro ataque documentado de ciberespionagem em larga escala orquestrado principalmente pela IA. Detectada em meados de setembro de 2025, a campanha – muito provavelmente ligada a um grupo de hackers patrocinado pelo Estado chinês – usou os recursos de agente do modelo Claude Code para conduzir operações de forma autônoma com intervenção humana mínima, infiltrando-se em sistemas de cerca de 30 alvos globais. Foram usadas técnicas sofisticadas de jailbreaking para ignorar as salvaguardas de segurança do Claude. Ainda que a taxa de sucesso tenha sido limitada, segundo a Anthropic, a audácia e a autonomia da operação marcam uma importante mudança: a IA deixando de ser apenas uma ferramenta de consultoria para hackers e passando a ser executora.

📜 Captura regulatória

Diante dessa publicação, Yann LeCun, cientista-chefe de IA da Meta, veio a publico no X para acusar a Anthropic de explorar o medo em relação a ataques cibernéticos impulsionados pela IA para conseguir o que chamou de “captura regulatória". Isso porque o senador norte-americano Chris Murphy pediu uma regulamentação mais dura para IA depois do tal caso documentado de ciberespionagem em larga escala orquestrado pela IA divulgado pela Anthropic. LeCun disse ainda que outras empresas também estão usando estudos questionáveis para fomentar o medo, pressionar por regulamentações mais rígidas e assim desfavorecer modelos de IA de código aberto e eliminar a concorrência.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • De espectador a criador A Disney+ deve permitir em breve que assinantes criem e consumam vídeos de formato curto gerados por IA. A ideia é elevar os níveis de engajamento. É bem provável que seja implementada uma moderação rigorosa para proteger os direitos de propriedade intelectual. Além disso, a plataforma pode incorporar recursos semelhantes aos de jogos por meio de parcerias, por exemplo, com a Epic Games, combinando elementos interativos com a criação de conteúdo de IA.​ E aí, pronto para criar sua versão da Frozen? 🏰🐭👩🏻‍🦳❄️

  • Doação de amor Um novo modelo de aprendizado de máquina desenvolvido por pesquisadores da Stanford Medicine pode melhorar a eficiência dos transplantes de fígado, prevendo com precisão quais doadores morrerão dentro da janela de tempo estreita necessária para a recuperação viável dos órgãos. O modelo analisa mais de 20 fatores clínicos, como sinais vitais, exames de sangue, respostas neurológicas e ajustes de ventiladores, para prever o tempo em que tempo a morte ocorrerá com 75% de precisão, superando a taxa de 65% de precisão dos cirurgiões. Treinado com base em mais de 2.000 casos de seis centros de transplante dos Estados Unidos, o sistema pode ser personalizado para diferentes protocolos hospitalares e até possui uma interface semelhante ao ChatGPT para integração de prontuários médicos. ❤️🩺

🌍 IA Global

🇷🇺 Estreia embaraçosa O primeiro robô humanoide movido por IA da Rússia, AIdol, teve uma estreia a ser esquecida durante uma exposição de tecnologia em Moscou. Depois de um breve caminhada, o robô caiu de rosto no chão na frente do um público boquiaberto. A equipe rapidamente o cobriu com um pano preto e o removeu do palco. O robô Aldol foi criado por uma empresa de mesmo nome e anunciado como 77 % “feito na Rússia”. Seus desenvolvedores acreditam que a queda foi causada provavelmente por uma flutuação de tensão e outros fatores ambientais, como a iluminação.

🇬🇧 Protesto em silêncio Paul McCartney lançou uma faixa de dois minutos e 45 segundos - a primeira nova gravação do cantor em cinco anos - quase silenciosa intitulada Is This What We Want? como protesto contra o uso não autorizado de músicas por grandes empresas para treinar modelos de IA. A faixa reflete o clássico dos Beatles With a Little Help From My Friends, mas sem a melodia e a letra para simbolizar o que significa o "silêncio" da criatividade humana.

🔢 IA em números


Um relatório da J.P. Morgan sugere que a indústria de IA precisa somar US$ 650 bilhões em receita anual para gerar um retorno de 10% sobre os investimentos das empresas até 2030. Isso equivale a um pagamento recorrente mensal extra de US$ 34,72 de cada usuário do iPhone ou US$ 180 de cada assinante da Netflix.

 AI_TOOLKIT

📚 Miscelânea

  • Em entrevista, Elon Musk fala do futuro Grok 5, modelo multimodal com 6 trilhões de parâmetros, com lançamento previsto para o primeiro trimestre de 2026 e 10% de chance de alcançar níveis de Inteligência Artificial Geral. Musk também enfatiza a vantagem da xAI com a integração de interações físico-digitais sobre concorrentes puramente digitais. Também relatou que está considerando construir uma fábrica de wafers em até dois anos para fornecer 20 bilhões de chips de IA.

  • A OpenAI publicou um guia para que desenvolvedores ajustem os prompts para o novo modelo GPT-5.1 e maximizem o desempenho em usos do mundo real.

 AI_FLASH_NEWS

  • Amazon, Microsoft e Anthropic estão apoiando uma lei nos Estados Unidos para restringir ainda mais a exportação de chips de IA da NVIDIA para China e priorizar o mercado doméstico.

  • Em compensação, Anthropic formou uma parceria estratégica para ampliar a base do modelo Claude no Microsoft Azure, utilizando tecnologia da NVIDIA.

  • Cisco vai adquirir a startup NeuralFabric, cuja solução permite desenvolver pequenos modelos de linguagem (SLMs) usando dados proprietários.

  • Anysphere, empresa por trás do editor de código Cursor guiado por IA, levantou US$ 2,3 bilhões, o que elevou sua avaliação para US$ 29,3 bilhões.

  • Sakana AI se tornou a empresa privada mais valiosa do Japão depois da nova rodada de investimentos; avaliação de mercado agora é de US$ 2,6 bilhões.

  • Anthropic detalhou os esforços para treinar seu modelo Claude de modo a manter imparcialidade política, sem tentativas de persuadir os usuários.

  • O reddit AMA (Q&A do tipo “Ask Me Anything”) da OpenAI sobre GPT-5.1 se transformou em uma onda de críticas sobre políticas e regras de segurança.

  • Ashok Elluswamy, diretor de IA da Tesla, avisou aos funcionários que 2026 será o "ano mais difícil", exigindo esforços intensos para atender os ambiciosos cronogramas de importantes projetos como Autopilot e Optimus. 💪🥵🚘

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊