- IA Express
- Posts
- Agentes de IA x Especialistas em cibersegurança - Quem vence a batalha de hackers?
Agentes de IA x Especialistas em cibersegurança - Quem vence a batalha de hackers?
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai saber mais sobre uma batalha no mundo da cibersegurança com agentes de IA enfrentando especialistas em uma caçada real por vulnerabilidades. E adivinha quem quase levou o troféu? 🏆👨🏻💻👾
Porém isso não é tudo na IA Express de hoje:
- Google Translate agora reproduz traduções em tempo real nos fones de ouvido
- Cofundador do Google reconhece que abordagem inicial para IA foi equivocada
- Projeto da IBM automatiza a identificação de bugs em infraestruturas de nuvem
- Robô movido por IA controla tráfego em cidade chinesa
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
SEGURANÇA
Agentes de IA x Especialistas em cibersegurança? Quem vence a batalha de hackers
Pesquisadores das Universidades de Stanford e Carnegie Mellon colocaram frente a frente agentes de IA e profissionais de cibersegurança em uma competição consistindo de testes de invasão de uma rede corporativa.
Qual foi o resultado? Uma nova estrutura de IA chamada ARTEMIS conquistou o segundo lugar geral, não apenas superando nove em cada 10 especialistas em pessoa, como também operando a um um terço do custo do grupo adversário.
Participaram da disputa 10 profissionais experientes, muitos com certificações e sucesso comprovado em programas de recompensa para caça de bugs (bug bounty). O lado da IA foi representado por seis agentes de IA e ARTEMIS - um novo sistema multiagentes que conta com geração dinâmica de prompts, subagentes arbitrários e triagem automática de vulnerabilidades.
Durante um período de 10 horas, todos os participantes varreram uma rede universitária com cerca de 8.000 dispositivos para descobrir brechas de segurança.

Mais descobertas do desafio:
O ARTEMIS ficou em segundo lugar geral, descobrindo 9 vulnerabilidades com uma taxa de envio válida de 82%.
A maioria dos agentes de IA terminou a tarefa bem antes do prazo final. Essa rapidez pode ter sido um ponto fraco, pois o tempo disponível para buscas mais aprofundadas não foi totalmente utilizado.
Outros pontos a serem melhorados no ARTEMIS são a taxa mais alta de falsos positivos e a dificuldade em lidar com interfaces gráficas ou ambientes altamente dinâmicos.
Por que isso importa? O estudo mostra que agentes avançados de IA já conseguem se igualar ou até superar especialistas em cibersegurança no que diz respeito à escalabilidade e eficiência na descoberta de vulnerabilidades.
AI_TRENDS
Google Translate agora com um recurso em versão beta que usa Gemini para reproduzir traduções em tempo real nos fones de ouvido.
Visual Editor da Cursor integra mudanças de design com atualizações de código, permitindo melhor colaboração entre designers e desenvolvedores.
Anthropic levou recursos do Claude Code a seu aplicativo Android, incluindo assistência e conectividade com GitHub.
Google está testando dois novos modelos na LM Arena de nomes Fierce Falcon e Ghost Falcon, que podem os próximos integrantes da família Gemini 3.
Também na LM Arena, OpenAI plantou o novo modelo Robin High, como candidato a superar referencias de benchmarking em tarefas de matemática.
Abordagem federada da Zoom alcançou a pontuação de 48,1% no benchmarking HLE ao orquestrar modelos de IA e superou modelos rivais.
Aumentar o número de agentes nem sempre segue a regra do “quanto mais, melhor”; os benefícios dependem da separação das tarefas, do uso de ferramentas e da robustez do modelo de base, diz estudo. 📈🙁
AI_GOVERNANCE & ETHICS
💬 Declaração sincera
Em uma participação sincera na comemoração do centenário da Escola de Engenharia da Universidade de Stanford, Sergey Brin, cofundador do Google, reconheceu que a abordagem inicial da empresa para IA Generativa foi equivocada. Refletindo sobre o importante artigo Transformer de 2017 do Google - a pesquisa fundamental por trás dos grandes modelos de linguagem -, Brin afirmou que a empresa investiu pouco e não o levou tão a sério com receio de levar às pessoas coisas sem sentido gerados por chatbots. Essa cautela permitiu que a OpenAI, liderada em parte por ex-talentos do Google, aproveitasse a oportunidade e transformasse a tecnologia em produto rapidamente.
AI_SNAPSHOT
💡 Inovação & Inspiração
Atrás dos bugs O Projeto ALICE (Agentic Logic for Incident and Codebug Elimination) da IBM Research é um sistema multiagentes projetado para automatizar o complexo processo de identificar e eliminar bugs de software em infraestruturas de nuvem. ALICE orquestra vários agentes especializados que trabalham em sequência. Primeiro, um agente de análise de incidentes reúne dados de observabilidade, seguido por um agente de contexto de código que mapeia dependências e identifica microsserviços relevantes. Por fim, um agente de análise de código identifica os bugs e gera relatórios detalhados de problemas para que engenheiros de software em pessoa entre em ação. Os agentes se comunicam usando o Model Context Protocol (MCP) que também garante a integração com modelos externos. Testes iniciais da IBM mostraram resultados com ganhos entre 10% e 25% na identificação de causas contado com a ajuda da ALICE. 👾🧑💻
🌍 IA Global
🇨🇳 Atenção, pare! A cidade chinesa de Hangzhou apresentou recentemente um robô para controle de tráfego guiado por IA. A novidade é fruto de uma colaboração entre a polícia de trânsito local e empresas de tecnologia. O robô faz sinais com as mãos (para seguir em frente ou parar), apita, emite avisos de voz educados e até detecta infrações como motociclistas sem capacete, paradas irregulares e pedestres atravessando fora da faixa. Os movimentos do robô foram minuciosamente treinados com base nas ações reais de policiais humanos. Seu modelo de IA já está sendo aprimorado por meio de aprendizado contínuo e há planos para que o robô seja atualizado com recursos de linguagem natural. Atualmente, o robô opera ao lado de policiais humanos, mas Hangzhou já está planejando implantar uma frota completa desses robôs no futuro.
📢 IA em uma frase
“Musk parece ter capacidade sobre-humana para dobrar a realidade à sua vontade e tem um histórico incrível. De alguma forma, consegue fazer o que parece ser impossível.” | A frase é de Mustafa Suleyman, CEO da Microsoft AI, ao compartilhar sua opinião sobre Elon Musk. Também elogiou Sam Altman, da OpenAI, por sua coragem em construir datacenter em uma velocidade sem precedentes. E descreveu Demis Hassabis, da Google DeepMind, como polímata e cientista excepcionais que nos deu enormes contribuições inúmeras vezes. |
AI_TOOLKIT
🛠️Ferramentas
📚 Miscelânea
Aprenda como aprimorar seus vídeos usando recursos avançados de edição do modelo Veo. As técnicas apresentadas são interpolação para garantir transições suaves entre cenas; extensão de clipes; e orientação de imagens para manter consistência visual.
AI_FLASH_NEWS
OpenAI planeja lançar "modo adulto" no ChatGPT no primeiro trimestre de 2026, com acesso a conteúdo erótico, mantendo salvaguardas para menores.
Starcloud treinou e agora usa LLMs no espaço usando seu satélite Starcloud-1 que carrega uma GPU NVIDIA H100 lançado no mês passado via SpaceX.
ElevenLabs anunciou uma parceria com Meta para integrar seus modelos de áudio nas plataformas Instagram e Horizon Worlds.
SoftBank e NVIDIA poderão investir mais de US$ 1 bilhão na Skild AI, startup cujos modelos ajudam robôs a compreender ambientes e tomar decisões.
China deve limitar o acesso aos chips H200 da NVIDIA, apesar da recente aprovação dos Estados Unidos para exportação; objetivo é fortalecer a indústria doméstica de semicondutores.
Oracle adiou a conclusão de alguns datacenters planejados para OpenAI de 2027 para 2028. Anúncio fez ações da Oracle caírem 5%.
Mais da metade das interações com agentes de IA se concentra em tarefas de produtividade (36%) e aprendizado (21%), principalmente para fins pessoais.
Pesquisa revela que 93% dos líderes de negócios e 80% dos investidores veem a IA como benéfica para a sociedade nos próximos cinco anos, mas apenas 58% do público em geral compartilha desse otimismo. ✨👍👎
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊