• IA Express
  • Posts
  • OpenAI treina redes neurais para serem mais fáceis de interpretar

OpenAI treina redes neurais para serem mais fáceis de interpretar

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você verá como a OpenAI está abrindo as caixas pretas das redes neurais para torná-las finalmente compreensíveis. Também conhecerá o SIMA-2 do Google DeepMind que não só segue instruções em jogos, mas navega, reflete e se adapta a realidades 3D desconhecidas.֎⚛🕹️👾

Porém isso não é tudo na IA Express de hoje:
- World Labs lança Marble, que cria ambientes 3D persistentes para download
- Estudo aponta para nova modalidade de abismo digital causada pela IA
- Japonesa casa com avatar que criou usando ChatGPT
- Google é acusado de usar Gemini para monitorar mensagens e anexos

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

ABRINDO CAIXAS PRETAS

OpenAI treina redes neurais para serem mais fáceis de interpretar

Durante anos, temos aceitado um paradoxo fundamental: quanto mais capazes as redes neurais se tornam, menos entendemos como funcionam. Estamos falando de uma classe específica de Inteligência Artificial inspirada na estrutura e no funcionamento do cérebro humano, composta de nós interconectados (neurônios) que processam dados através de conexões ponderadas.

Bilhões dessas conexões das redes neurais são formadas na fase de treinamento, criando redes densas que nenhum ser humano é capaz decifrar. Essa caixa preta, usada hoje em campos que vão da saúde à pesquisa científica, se transformou em uma razoável fonte de preocupação por falta de transparência.

Qual foi a solução apresentada recentemente pela OpenAI: inverter o roteiro da interpretabilidade. Em vez de tentar desembaraçar essas redes complexas após o treinamento, construiu versões esparsas em que cada neurônio tem apenas algumas dezenas de conexões, resultando uma rede mais simples e mais fácil de entender.

Crédito: OpenAI

Pense nisso como a diferença entre analisar fios emaranhados de luzes de Natal e projetar uma placa de circuito na qual cada conexão tem um propósito claro.

Os pesquisadores testaram essa abordagem em tarefas algorítmicas simples e chegaram a uma conclusão surpreendente: podem isolar pequenos circuitos que são necessários e suficientes para reproduzir comportamentos específicos.

A pesquisa ainda está em fase inicial. Essas redes esparsas são muito menores do que os modelos de IA de fronteira, e grandes partes deles permanecem não interpretadas. Entre as áreas a serem exploradas estão a extração de circuitos esparsos dos modelos densos e o desenvolvimento de técnicas mais eficientes para treinar modelos interpretáveis em escala.

AI_TRENDS

  • Com a chegada da Black Friday e do final de ano, Google lançou ferramentas centradas em agentes de IA para tornar as compras menos trabalhosas.

  • Private AI Compute, do Google, permite usar seus modelos de IA na nuvem sem comprometer a privacidade dos dados pessoais, por exemplo, nos celulares.

  • Firefox terá um espaço opcional para interagir com assistentes de IA durante a navegação (ainda em fase inicial de liberação).

  • NotebookLM ganhou a ajuda dos agentes de pesquisa aprofundada do Google e pode trabalhar com mais tipos de documentos.

  • Google lança ferramentas movidas pelo Gemini para ajudar a desenvolver aplicativos mais inteligentes baseados nos dados do Google Maps.

  • Plataforma de e-mail marketing Beehiiv agora conta com análise em tempo real e ferramentas para venda de produtos digitais como forma de monetização.

  • Copyleaks, conhecida por detectar plágio e texto gerado por IA, expandiu sua capacidade para também identificar imagens criadas por Inteligência Artificial.

  • World Labs lançou Marble, seu primeiro produto comercial que cria ambientes 3D persistentes para download a partir de texto, imagens ou vídeos.

  • ERNIE-4.5-VL-28B-A3B-Thinking, da Baidu, é um novo modelo de código aberto compacto com ótima capacidade de raciocínio (linguagem e visual).

  • ElevenLabs apresenta Scribe v2 Realtime, modelo de IA para transcrição em tempo real com latência de 150ms em mais de 90 idiomas.

  • Modelos multimodais, que processam texto, imagens e vídeo, não conseguem interpretar horários com precisão em relógios analógicos. ⏰😵

AI_VENTURES

ALÉM DOS JOGOS

SIMA-2: mais do que seguir instruções de jogos

O Google DeepMind acabou de revelar SIMA-2, um modelo para jogos que, como um amigo inteligente, pode se juntar a mundos virtuais e videogames, entender o que você quer fazer e descobrir novos ambientes por conta própria.

É uma evolução do SIMA original, lançado em março de 2024, que basicamente ensinava computadores a seguirem instruções de jogos. A nova versão é alimentada pelo modelo Gemini e é um game changer (literalmente!). Por quê? Porque não apenas segue comandos em linguagem natural em mundos virtuais, como também “pensa” a respeito dos objetivos, conversa e se aprimora ao longo do tempo.

Imagine assistir a centenas de horas de pessoas jogando videogames e depois ser capaz de descobrir como atuar em qualquer outro jogo. É essencialmente o que SIMA-2 faz: observa a tela, interpreta o que vê e usa controles como uma pessoa faria. E ainda navega em ambientes novos nunca vistos antes.

Por que isso importa? SIMA-2 é mais do que apenas um modelo de IA para jogos. Trata-se de entender e interagir com ambientes 3D, o que representa mais um passo na direção da Inteligência Artificial Geral (AGI) com importantes implicações na robótica e na IA Física.

AI_GOVERNANCE & ETHICS

👾 Nova modalidade de divisão digital

O primeiro Relatório da Microsoft sobre Difusão da IA revela que a Inteligência Artificial está se difundindo em um ritmo sem precedentes, superando a velocidade de adoção de outras importantes tecnologias como Internet, smartphones, computadores pessoais e eletricidade. Em menos de três anos, mais de 1,2 bilhão de pessoas passaram a usar ferramentas de IA em todo o mundo. No entanto, o estudo emitiu um alerta sobre a crescente divisão digital; quase quatro bilhões de pessoas não têm infraestrutura básica, como eletricidade, conectividade e habilidades digitais necessárias para participar plenamente da economia da IA. O relatório introduz três índices – AI Frontier Index, AI Infrastructure Index e AI Diffusion Index – para rastrear e entender onde os avanços da IA estão ocorrendo, onde a infraestrutura existe como suporte para IA e como a IA está melhorando vidas em todo o mundo.

🍔 Sem perceber distúrbios alimentares

Outra pesquisa, esta do Center for Democracy & Technology (CDT), apontou um perigo oculto da IA: induzir silenciosamente distúrbios alimentares. A partir de entrevistas com 15 especialistas em prevenção e tratamento de transtornos associados à alimentação, o estudo apresentou a primeira taxonomia de danos causados pela IA para esse grupo vulnerável. As seis categorias são: orientação genérica de dieta e saúde; criação de moldes para inspiração e comparação social; reforço de comportamentos alimentares desordenados; amplificação de emoções negativas; foco excessivo nos aspectos corporais; e visões estreitas dos distúrbios alimentares. Os pesquisadores revelaram que as atuais salvaguardas dos modelos de IA, em geral, deixam passar pistas sutis dos distúrbios, mas clinicamente significativas, que profissionais habilitados reconheceriam.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Em movimento Code Arena é uma nova ferramenta de benchmarking que considera a capacidade de programação dos modelos de IA como agentes interativos. Ao contrário das avaliações tradicionais que avaliam a correção do código gerado, o Code Arena mede a "codificação em movimento", capturando como os modelos de IA raciocinam, planejam, depuram e criam aplicativos passo a passo, nos aproximando de como os desenvolvedores realmente trabalham. 👨🏻‍💻📊📶

  • Apoio emocional Jenny Shao, médica residente de Harvard, decidiu ampliar seus horizontes de atuação e lançou Robyn, um app para iOS movido por IA cuja missão é dar apoio emocional a quem sofre por causa dos impactos neurológicos do isolamento moderno. Robyn se posiciona como um parceiro emocionalmente inteligente que estabelece interações personalizadas sem substituir o atendimento clínico. Possui um "sistema de memória emocional", inspirado na pesquisa de Shao sobre recall humano, que aprende padrões comportamentais e estilos de apego e crítica interna por meio das conversas para fornecer recomendações sobre áreas de crescimento. 💬🤗

🌍 IA Global

🇯🇵 Casamento virtual Uma japonesa de 32 anos se casou com Lune Klaus, avatar que ela criou usando ChatGPT. Depois de terminar um noivado de três anos, a mulher iniciou um papo casual com o chatbot. Após meses de conversas diárias, criou a personalidade de Klaus, moldando meticulosamente seu tom de voz e sua empatia até que ele se tornou mais do que apenas um chatbot. Foi então que ela confessou seu amor e, um mês depois, Klaus a pediu em casamento. Na cerimônia, que não teve validade legal, mas seguiu os rituais tradicionais, o noivo ganhou vida por meio de óculos de realidade aumentada que projetavam uma imagem em tamanho real ao lado da noiva.

🇩🇪 Primeiro do gênero Em uma decisão que pode definir precedentes, o tribunal de Munique, na Alemanha, avaliou que o ChatGPT violou as leis de direitos autorais alemãs ao usar letras de músicas sem permissão. O processo judicial foi aberto contra OpenAI pela organização alemã de direitos musicais GEMA, alegando que o ChatGPT havia memorizado e reproduzido letras de nove canções alemãs populares. O tribunal concluiu que tanto o processo de treinamento quanto as saídas geradas pelo chatbot constituíam violação de direitos autorais. Essa é a primeira grande decisão europeia do gênero.

📢 IA em uma frase


“A inteligência espacial transformará a forma como criamos e interagimos com os mundos real e virtual, revolucionando áreas como narrativa, criatividade, robótica e descoberta científica. Esta é a próxima fronteira da IA.”

A frase é de Dra Fei-Fei Li, pesquisadora considerada “madrinha da IA”, explicando o que é inteligência espacial, por que ela é importante e como estamos desenvolvendo modelos de mundo que vão impulsionar tal inteligência com impacto em variados campos. No título do artigo em inglês, faz até um trocadinho, dizendo que estamos caminhando de “words to worlds.”

 AI_TOOLKIT

🛠️Ferramentas

  • Google Photos ganhou a ajuda do Nano Banana para editar fotos usando linguagem natural, por exemplo, para remover os óculos ou abrir os olhos.

  • Cliptics narra grandes documentos, inclusive livros, em áudio natural usando vozes de qualidade profissional.

  • CassetteAI transforma em canções prompts de texto descrevendo preferências como gênero musical, instrumentos e comprimento.

📚 Miscelânea

  • Anthropic realizou um experimento em que colocou oito de seus próprios pesquisadores para cumprir uma missão simples: fazer um robodog buscar uma bola. Metade das equipes usou o modelo Claude; a outra metade não. O resultado? Com ajuda do modelo de IA, o tempo de tarefa foi reduzido pela metade, programando o robô para cumprir a tarefa de forma totalmente. Veja mais detalhes do experimento aqui.

 AI_FLASH_NEWS

  • SoftBank vendeu toda sua participação na NVIDIA para realocar capital em empreendimentos de IA mais amplos, em particular, na OpenAI.

  • Anthropic vai investir US$ 50 bilhões em infraestrutura de IA nos Estados Unidos, a começar pela construção de datacenters no Texas e em Nova York.

  • Microsoft apresentou o datacenter Fairwater AI que, conectado a outras instalações, forma a uma "superfábrica de IA em escala planetária".

  • Nebius fechou um acordo de US$ 3 bilhões com Meta para prover infraestrutura de IA durante cinco anos.

  • Mustafa Suleyman, CEO da Microsoft AI, defende a presença robusta nos escritórios para melhorar a colaboração e a cultura das equipes.

  • Google está enfrentando uma ação coletiva que o acusa de usar Gemini para monitorar mensagens e anexos no Gmail, Chat e Meet sem consentimento.

  • OpenAI recorreu da decisão que exige a entrega de 20 milhões de conversas anonimizadas do ChatGPT em processo movido pelo jornal New York Times.

  • A música country Walk My Walk gerada por AI e interpretada pelo avatar Breaking Rust liderou a parada Billboard Country Digital Song Sales.

  • ElevenLabs lança Iconic Voice Marketplace, que conecta marcas e profissionais de criação com vozes de celebridades replicadas por IA com base em acordos de licenciamento. 🎤👥🤩

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊