IA Express
Posts
Tecnologia espanhola compacta LLMs em até 95%

Tecnologia espanhola compacta LLMs em até 95%

Sheila Zabeu
18 ago

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Na edição de hoje, você conhecerá a startup espanhola que reduz grandes LLMs, transformando-os em prodígios pesos-leves. Saberá também como a NVIDIA está tornando a IA multilíngue mais acessível com um novo conjunto de dados e modelos de código aberto. 🌐🗣️💬

Porém isso não é tudo na IA Express de hoje:
- Imagen 4 do Google ganha modo Fast para geração rápida de imagens
- Políticas da Meta permitiam interações inadequadas dos chatbots com menores
- Estudo analisa qualidade e segurança do código gerado por modelos de IA
- AWS vai treinar 1 milhão de brasileiros em IA

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

SEM PREJUDICAR O DESEMPENHO

Tecnologia espanhola compacta LLMs em até 95%

A startup espanhola Multiverse Computing desenvolveu uma tecnologia de compressão chamada CompactifAI, de inspiração quântica, capaz de reduzir o tamanho dos grandes modelos de linguagem (LLMs) em até 95%, sem prejuízo do desempenho.

Os resultados já foram apresentados na prática com dois dos menores modelos de IA de alto desempenho já vistos, apelidados de “Model Zoo” por seus tamanhos minúsculos, comparados ao cérebro de uma galinha e de uma mosca.

Como funciona? A CompactifAI foi criada usando Tensor Networks, uma abordagem inspirada na física quântica para simplificar as redes neurais. O resultado? Modelos desenvolvidos usando CompactifAI são versões altamente compactadas dos principais LLMs de código aberto, mas com as vantagens de manter a precisão original, ser de 4 a 12 vezes mais rápidos e reduzir de 50% a 80% os custos de inferência, segundo a Multiverse Computing.

“Pela primeira vez na história, somos capazes de traçar o funcionamento interno de uma rede neural para eliminar bilhões de correlações ilegítimas e realmente otimizar os modelos de IA.”

Román Orús, cofundador e diretor científico da Multiverse Computing

Os integrantes da série Model Zoo podem ser usados localmente em dispositivos como smartphones, wearables, laptops e dispositivos IoT ou mesmo off-line, reduzindo significativamente os custos de processamento na nuvem:

🐔 ChickenBrain: Modelo compactado de 32 bilhões de parâmetros baseado no Llama 3.1-8B da Meta, que supera o original em importantes sistemas de benchmarking, podendo inclusive realizar tarefas de raciocínio.

🪰 SuperFly: Modelo compactado de 94 milhões de parâmetros baseado no SmolLM2 135M do Hugging Face. É otimizado para implantação em dispositivos leves, com o mínimo de hardware, como eletrodomésticos operados por comando de voz.

Para quem estiver interessado em usar modelos de IA compactados, a Mulltiverse Computing oferece algumas opções via API no AWS Marketplace.

AI_TRENDS

Novo recurso do Gemini permite lembrar e aprender com interações anteriores do usuário para melhorar as respostas. Recurso é ativado por padrão, mas pode ser desativado na configuração de Contexto Pessoal.
Outra novidade do Gemini é manter conversas temporárias que não são salvas no histórico de bate-papo nem usadas para personalização ou treinamento de IA.
Jan-v1 é um modelo para pesquisas na Web, construído sobre o Qwen3-4B-Thinking e lançado como alternativa de código aberto ao serviço Perplexity Pro.
Higgsfield Draw-to-Video transforma esboços e imagens em cenas de vídeo cinematográficas, sem precisar de prompts. Experimente aqui.
Hunyuan-Large-Vision é um modelo da Tencent com compreensão multilíngue e multimodal de imagens, vídeos e 3D.
LFM2-VL é a primeira série de modelos de linguagem visual da Liquid voltada para uso em dispositivos portáteis e cenários de baixa latência.
Gemma 3 270M é um modelo compacto do Google, com baixo consumo de energia, para ajustes finos em domínios e idiomas específicos.
Imagen 4 do Google, antes em versão preview, agora tem ampla disponibilidade com novo modo Fast para geração rápida de imagens.
HTC lançou em Taiwan os óculos VIVE Eagle, com assistente inteligente ativado por voz para tirar fotos, tocar música, fazer traduções e mais.
Lançamento do DeepSeek R2 atrasará devido a problemas técnicos persistentes ao tentar treiná-lo usando processadores Ascend da Huawei. 🏻⏳⚠️

AI_VENTURES

IDIOMAS

NVIDIA libera conjuntos de dados e modelos para IA multilíngue

A NVIDIA liberou um enorme conjunto de dados de código aberto, o Granary, juntamente com dois novos modelos de IA, Canary-1b-v2 e Parakeet-tdt-0.6b-v3, para acelerar o desenvolvimento de tecnologias de reconhecimento de fala e tradução de alta qualidade, particularmente para linguagens com dados limitados.

Com cerca de um milhão de horas de áudio, sendo 650 mil horas para reconhecimento de fala e 350 mil horas para tradução, o Granary foi criado usando um pipeline de processamento movido pelo kit de ferramentas NVIDIA NeMo Speech Data Processor, que converte áudio sem rótulos em dados limpos e de alta qualidade sem a necessidade de anotação humana intensiva em recursos.

Para demonstrar o potencial do conjunto de dados Granary, a NVIDIA treinou dois novos modelos: Canary-1b-v2 para transcrição e tradução de alta qualidade; e Parakeet-tdt-0.6b-v3 para transcrição em tempo real de alto desempenho.

Por que isso importa? Com o Granary, os modelos Canary and Parakeet e a metodologia usada para criá-los, a NVIDIA está dando à comunidade de desenvolvedores ricas ferramentas para inovar no campo da IA com recursos de fala, em aplicações que vão desde chatbots multilíngues e agentes de voz de atendimento ao cliente a serviços de tradução em tempo real.

AI_GOVERNANCE & ETHICS

🔞 Meta inadequada para menores

Uma investigação da Reuters revelou que políticas internas para o chatbot de IA da Meta permitiam interações inadequadas com menores, como conversas de teor romântico ou sensual com crianças, além de darem respostas racistas e informações médicas falsas. As revelações foram extraídas de um documento obtido pela Reuters, com diretrizes para o assistente Meta AI e também para o chatbot no Facebook, WhatsApp e Instagram, que teve a autenticidade confirmada pela própria Meta. Após contato com a Reuters, as seções do documento que permitiam de flerte com menores foram removidas pela Meta. Senadores norte-americanos já pediram uma investigação sobre o tema.

💪 Modelos mais resistentes

Pesquisadores da Universidade de Oxford, da EleutherAI e do Instituto de Segurança da IA do Reino Unido desenvolveram um método para melhorar a segurança dos modelos de linguagem de IA de peso aberto. Ao filtrar conhecimento potencialmente danoso, como conteúdo relacionado a ameaças biológicas, durante o processo de treinamento, foi possível criar modelos resistentes a atualizações mal-intencionadas. A abordagem chegou a remover até 9% dos dados de risco, preservando o desempenho geral. Além disso, os modelos filtrados provaram ser cerca de 10 vezes mais eficazes do que os métodos anteriores, resistindo a tentativas de ajuste fino.

AI_SNAPSHOT

💡 Inovação & Inspiração

IA solar Cientistas do Laboratório Nacional Argonne dos Estados Unidos, junto com uma equipe global de 89 pesquisadores, utilizaram IA para acelerar a descoberta de materiais mais eficientes e sustentáveis para uso em sistemas de energia solar. O que eles fizeram? Concentrado-se especificamente em células solares orgânicas sensibilizadas por corantes, o grupo se valeu de uma combinação de IA e computação de alto desempenho para avaliar quase 10 mil corantes orgânicos e identificar os cinco candidatos mais promissores em tempo recorde. Esses corantes foram então validados em experimentos de laboratório e protótipos. ☀️⚡🔋
IA contra superbactérias Médicos têm lutado por anos contra superbactérias, aquelas que se tornaram resistentes aos antibióticos mais poderosos. Agora, pesquisadores do MIT estão usando uma nova arma nesta batalha: IA Generativa, semelhante à usada para responder perguntas em chatbots. Cientistas estão projetando novos compostos que podem matar bactérias resistentes, em vez de testar milhares de moléculas existentes. Foram usados dois métodos distintos: um direcionou algoritmos de IA Generativa para projetar moléculas com base em um fragmento químico com atividade antimicrobiana; outro deixou os algoritmos gerarem moléculas livremente, sem usar nenhum fragmento como base. Os resultados foram promissores. Veja aqui.🧪🔬👨🏻‍🔬

🌍 IA Global

🇬🇧 IA não inventa A Suprema Corte do Reino Unido decidiu que Inteligência Artificial não pode ser apontada como inventora em patentes, pois apenas pessoas podem ter direito à propriedade intelectual. A decisão veio depois de uma solicitação legal do Dr. Stephen Thaler, que buscou listar seu sistema inteligente DABUS como detentor de duas patentes. O tribunal confirmou por unanimidade decisões anteriores, afirmando que um inventor deve ser uma "pessoa natural" sob a lei do Reino Unido. Thaler argumentou que a IA deveria ser reconhecida por sua produção criativa, mas o tribunal não encontrou base legal para o argumento, enfatizando que a lei de patentes requer participação humana. A Suprema Corte também rejeitou outro argumento de Thaler de que teria o direito de solicitar patentes para DABUS com base no fato de que ele era o proprietário do DABUS.

🇩🇪 IA no dia a dia A Deutsche Telekom lançou um smartphone e um tablet - T Phone 3 e T Tablet 2 - para democratizar o uso da IA no cotidiano das pessoas. Vendidos na Alemanha por € 149 e € 199, respectivamente, mas também comercializados em outros nove países europeus, os equipamentos vêm com uma assinatura Perplexity Pro de 18 meses e uma licença Picsart Pro de 3 meses, além de recursos como síntese de voz e edição de imagens.

📢 IA em uma frase

“Fora do mundo real da IA, Google tem a maior vantagem em termos de computação (e dados) no momento, portanto mais chance de ser líder. Isso pode mudar em alguns anos.”

A frase, por incrível que pareça, é de Elon Musk, durante uma conversa no X e também em meio a uma discussão pública com o arquirrival Sam Altman, da OpenAI, e com a Apple.

AI_TOOLKIT

🛠️Ferramentas

Open Lovable, da Firecrawl, de código aberto e movido por IA, gera um clone funcional e editável a partir de qualquer URL.
Rendera reimagina qualquer interior doméstico, exterior ou jardim usando IA.
Menuexplain dá detalhes de qualquer prato, em qualquer idioma, fotografado em menus. Ferramenta indicada para viajantes e gastrônomos.

📚 Miscelânea

Estudo da empresa Sonar analisou a qualidade e a segurança do código gerado por cinco modelos de IA: Claude Soneto 4 e 3.7 da Anthropic, GPT-4o da OpenAI, Meta Llama-3.2-visão: 90b e OpenCoder-8B. Veja aqui os pontos fortes e fracos, bem como a "personalidade de codificação" de cada um.

AI_FLASH_NEWS

Parag Agrawal, ex-CEO do Twitter, fundou a startup Parallel para criar uma infraestrutura otimizada para agentes de IA usarem a Web de forma eficaz.
Anthropic trouxe para casa fundadores e membros das equipes de engenharia e pesquisa da Humanloop, startup de IA do Reino Unido.
Falando dela, Anthropic também detalhou as medidas de segurança que implementa para garantir o uso responsável do modelo Claude.
Oracle e Google Cloud ampliaram parceria para integrar os modelos Gemini ao serviço de IA Generativa da Oracle Cloud Infrastructure (OCI).
Em três anos, um em cada quatro perfis de vagas de emprego poderá ser falso por conta do uso da IA na criação de currículos convincentes.
Brasil está entre os três países com a maior parcela de pessoas que têm visão “muito positiva” da Inteligência Artificial, aponta pesquisa.
AWS assumiu o compromisso de treinar gratuitamente 1 milhão de brasileiros em IA e nuvem até 2028. Clique aqui para se inscrever. 📚🎓🇧🇷

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.