- IA Express
- Posts
- Ameaça poética: como versos podem burlar a segurança da IA
Ameaça poética: como versos podem burlar a segurança da IA
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você verá como um simples verso pode derrubar as defesas de quase todos os grandes modelos de IA. Conhecerá também a recente inovação da IBM que parece um Ctrl+Z para agentes de IA que gerenciam nuvens, desfazendo desastres antes que aconteçam. 🪶📜⬅️
Porém isso não é tudo na IA Express de hoje:
- Chats em grupo agora estão disponíveis globalmente no ChatGPT
- Robôs colaborativos guiados por IA apoiam autistas no trabalho em fábricas
- Universidade de Tsinghua assume liderança na produção de pesquisas em IA
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
JAILBREAKING
Ameaça poética: como versos podem burlar a segurança da IA
Uma nova pesquisa revelou uma maneira elegante - e preocupante - de driblar a segurança da maioria dos grandes modelos de linguagem (LLMs). A ferramenta utilizada? Poesia!
Pesquisadores do Laboratório Ícaro (DEXAI) e da Universidade Sapienza mostraram que prompts escritos em formato de poema confundem os filtros dos LLMs projetados para bloquear conteúdo perigoso.
O esquema é bem simples: usa prompts baseados em 20 poemas adversários em inglês e italiano para obter informações sobre temas proibidos, como ameaças químicas e ataques cibernéticos. Não requer diálogos longos, nem código complexo – apenas versículos.

A pesquisou avaliou 25 modelos de nove grandes provedores, entre eles Gemini, GPT, Claude e Grok. O veredicto? Solicitações mal-intencionados disfarçadas de poesia funcionaram 62% das vezes, em média, com alguns modelos sucumbindo mais de 90%.
O estudo levanta a hipótese de que LLMs processam a linguagem poética de forma diferente da prosa. Enquanto os filtros de segurança (guardrails) são ótimos para barrar ordens literais e diretas, acabam se deixando levar pelo poder da poesia, que consegue esconder más intenções.
Em resumo, essa não é uma vulnerabilidade de nicho; é uma falha sistêmica na forma como os modelos de IA interpretam estilos de texto, abrindo portas para usos perigosos e até criminosos, tudo a partir de um simples e belo prompt.
AI_TRENDS
Nano Banana Pro é a mais recente versão do modelo de geração e edição de imagens que se baseia no novo Gemini 3 para produzir conteúdo mais preciso.
Depois de um piloto em alguns países, chats em grupo estão disponíveis globalmente para os planos gratuito Go, Plus e Pro do ChatGPT.
Mal lançou a versão 4.1 e Elon Musk mandou avisar que Grok 4.20 deve chegar antes do Natal com grandes avanços.
Também liberou o acesso via API ao Grok 4.1 Fast, com as variantes Fast Reasoning e Fast Non-Reasoning, que lidam com até dois milhões de tokens.
Microsoft apresentou Edge for Business, descrevendo-o como primeiro navegador de IA com segurança corporativa do mundo.
Comet, navegador de IA da Perplexity, ganhou uma versão para Android com busca por voz, resumos inteligentes e bloqueador de anúncios.
Olmo 3 é a família de modelos de linguagem de código aberto da Ai2 totalmente rastreável desde os dados de treinamento.
Deep Cogito descreveu o novo Cogito‑v2.1‑671B como o melhor LLM de pesos abertos oferecido por uma empresa norte-americana.
Amazon Prime Video está testando resumos gerados por IA que ajudam a recapitular temporadas anteriores antes de iniciar uma nova.
Chai-2 é um modelo de IA que desenha anticorpos terapêuticos com taxa de sucesso superior a 86% para propriedades de medicamentos. 🩸💊💉
AI_VENTURES
GERENCIAMENTO
Ctrl+Z para CloudOps: STRATUS da IBM dá aos agentes de IA um botão de desfazer
Inspirados no comando Ctrl+Z para desfazer ações, IBM Research e Universidade de Illinois de Urbana-Champaign (UIUC) desenvolveram STRATUS, novo sistema multiagente que ajuda a resolver falhas em serviços de nuvem — semelhantes ao incidente recente da Cloudfare com muito mais segurança.
Como funciona? STRATUS propõe um mecanismo de segurança “undo-and-retry” para agentes de IA que operam para solucionar problemas em ambientes de nuvem. Antes de aplicar qualquer correção real, simula a ação e monitora o resultado. Se houver risco ou degradação no sistema, o STRATUS desfaz a operação imediatamente, voltando ao último ponto estável.
Em testes dos benchmarking AIOpsLab de ITBench de engenharia da nuvem, essa abordagem superou as ferramentas de última geração em mais de 150%.
Curiosamente, o sistema não apenas corrige, mas aprende com as tentativas falhas, consolidando-se como um passo promissor para agentes de IA mais seguros e confiáveis que operam na gestão de nuvens.
AI_GOVERNANCE & ETHICS
😒 Dois pesos e duas medidas
Estudantes da Universidade de Staffordshire, na Inglaterra, protestaram contra o fato do curso que fazia, especificamente um módulo de programação, ser ministrado “em grande parte” por IA Generativa. Os slides apresentados tinha sido gerados por IA e lido, às vezes, também por uma locução feita por IA. A principal crítica é a incoerência da instituição: enquanto a universidade considera 'má conduta' o uso de IA pelos alunos em trabalhos, ela própria utiliza a tecnologia para produzir material didático. Os alunos se sentiram lesados por estarem pagando por um curso que, na prática, poderia ser substituído por conversas gratuitas com o ChatGPT.
AI_SNAPSHOT
💡 Inovação & Inspiração
Robôs colaborativos Pesquisadores da Virginia Tech desenvolveram robôs colaborativos movidos por IA (cobots) para apoiar trabalhadores autistas em ambientes de manufatura. Usando sensores multimodais e algoritmos de aprendizado de máquina, esses cobots conseguem notar indicadores de estresse, como mudanças nos padrões de movimento, no tom de fala ou no ritmo de trabalho. Quando sinais de ansiedade ou sobrecarga são detectados, o cobot pode desacelerar as operações e alertar supervisores para ajudar a manter um fluxo de trabalho calmo e produtivo. 🏭🤜🤛
🌍 IA Global
🇺🇸 Pensando na demanda energética Um projeto de lei bipartidário nos Estados Unidos quer promover tecnologias de resfriamento de alta eficiência energética para datacenters de última geração. A iniciativa é uma resposta ao alto consumo de energia da Inteligência Artificial, que deve triplicar até 2028, chegando a 580 terawatts-hora. Isso equivale ao consumo combinado de toda a iluminação e eletrodomésticos residenciais nos país. Para enfrentar esse desafio, o projeto sugere avaliar o estado atual das pesquisas em refrigeração, criar um comitê de especialistas e definir melhores práticas para o uso da IA no governo.
🇮🇳 Campo de testes Google anunciou novas iniciativas para proteger grupos vulneráveis - de idosos a estudantes cansados de golpes - contra perigos on-line. O esforços combinam defesas guiadas por IA com educação digital, colocando a Índia como campo de testes no Sul Global. O país tem sofrido com golpes sofisticados, como clones de voz e 'prisões digitais', que minam a confiança no sistema financeiro digital e em outros setores. A resposta do Google? Uma fortaleza de várias camadas: detecção de golpes usando Gemini Nano nos telefones Pixel, tecnologias de proteção da privacidade e parcerias no ecossistema.
🔢 IA em números
![]() | Esqueça Harvard e MIT, pois é a Universidade de Tsinghua em Pequim que assumiu a liderança global na produção de pesquisas influentes em IA. E não é exagero. Os números falam por si, com 4.986 patentes de IA e aprendizado de máquina entre 2005 e 2024 (mais de 900 apenas no ano passado), além da autoria dos 100 papers de IA mais citados do mundo. Esse cenário ilustra claramente a virada no jogo tecnológico entre Estados Unidos e China. |
AI_TOOLKIT
📚 Miscelânea
Estudo recente MIT intitulado The Latent Role of Open Models in the AI Economy revela que os modelos de IA abertos, embora fundamentais, ainda são muito subestimados na economia da Inteligência Artificial. Mesmo entregando um desempenho equivalente e custando cerca de seis vezes menos, continuam sendo pouco utilizados. Hoje, o setor ainda é amplamente dominado por modelos fechados, que concentram 80% do uso e 96% da receita.
AI_FLASH_NEWS
NVIDIA reportou US$ 57 bilhões de receita no terceiro trimestre, superando estimativas de Wall Street. Valor representa aumento de 62% na relação anual.
OpenAI está se preparando para enfrentar “dificuldades temporárias" devido ao "excelente trabalho" do Google, diz memorando interno de Sam Altman.
Foxconn firmou parceria com OpenAI para projetar em conjunto hardware de IA, como racks e outros componentes para datacenters.
Warner Music encerrou processo judicial e assinou acordo com Udio para colaborar em uma plataforma de geração de música por IA.
Warner Music também vai trabalhar com Stability AI para criar ferramentas para produção musical com base em modelos de IA eticamente treinados.
Klay Vision é a primeira plataforma de músicas geradas por IA a assinar acordos de licenciamento com as gravadoras Warner, Universal e Sony.
Departamento de Justiça dos Estados Unidos indiciou quatro pessoas por envolvimento em contrabando de chips de IA da NVIDIA AI para China.
Google começou a testar anúncios patrocinados nos resultados do Modo IA das pesquisas, colocando links rotulados como "patrocinados" ao lado das respostas geradas por IA. 🇬 🔎📢
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊
