- IA Express
- Posts
- Gemma 3: IA no seu quarto, escritório doméstico ou garagem
Gemma 3: IA no seu quarto, escritório doméstico ou garagem
Bem-vindos, humanos: Seu download diário com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai conhecer o Gemma 3 do Google, que leva o potencial da IA para dentro do seu quarto. Já com o MAGI-1 da Sand AI, você poderá transformar uma única imagem em maravilhas cinematográficas sem fim! 🎬
Porém isso não é tudo no IA Express de hoje:
- LLMs permitem interagir com perfis de expressão gênica em linguagem natural
- Seriam os modelos de IA daltônicos?
- Quais países estão fazendo as maiores apostas em IA
- Emirados Árabes Unidos lançam ecossistema de inteligência regulatória
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
IA LOCAL
Gemma 3: IA no seu quarto, escritório doméstico ou garagem
Lançada em março pelo Google como modelos abertos de IA Generativa com ótimo desempenho, a família Gemma 3 agora deu um passo a mais com a otimização Quantization-Aware Training (QAT) que permite usar os modelos em hardware comum, tornando-os acessíveis a simples mortais. Então surge a pergunta: será o futuro da IA local, não remoto?
O que você precisa saber? O treinamento com consciência de quantização é uma técnica que reduz o consumo de memória dos modelos sem sacrificar a inteligência. Por exemplo, o modelo Gemma 3 27B (com 27 bilhões de parâmetros!) agora cabe em uma única GPU indicada para simples consumidores graças ao QAT, que baixa a demanda de memória em até quatro vezes.
Como funciona? De modo semelhante ao que acontece com imagens compactadas para economizar espaço, o QAT reduz a precisão dos parâmetros dos modelos, usando dados de 4 bits em vez de 16 bits para torná-los menores e mais rápidos. No entanto, diferentemente de uma compressão rudimentar que pode prejudicar a qualidade das imagens, o QAT trabalha como como um maestro que rege os modelos mantendo a precisão mesmo em sua forma reduzida.
O pulo do gato: Em vez de apenas quantizar o modelo após o treinamento completo, o QAT incorpora o processo de quantização durante o treinamento, simulando operações de baixa precisão para reduzir a degradação e manter a precisão. Veja o gráfico a seguir baixo para ter uma noção do que isso significa em termos de redução de demanda de memória.

Crédito: Google
Por que isso importa? Para usar os modelos Gemma3, não é necessário alugar servidores na nuvem nem investir em hardware pesado. Se tiver uma GPU decente (como uma NVIDIA RTX 3090 ou similar), você está pronto para começar.
Com essa iniciativa de levar a Gemma 3 para GPUs de consumo, o Google está contribuindo para a democratização da IA, tornando modelos poderosos acessíveis a todos, seja em quartos, escritórios domésticos ou garagens - localmente, não remotamente, caso você queira.
Os modelos QAT oficiais do Google estão disponíveis no Hugging Face e no Kaggle.
GERAÇÃO DE VÍDEOS
Quadro a quadro: a inovação do MAGI-1 para gerar vídeos guiado por IA
Haja imaginação para criar vídeos realistas e infinitamente longos a partir de uma única imagem. Pois saiba que o MAGI-1, novo modelo chinês de código aberto está chamando a atenção por fazer justamente isso e ainda superar gigantes do setor, como Sora da OpenAI e Gemini do Google, segundo a Sand AI, desenvolvedora do sistema.
Como funciona?
Ao contrário dos modelos de difusão tradicionais, o MAGI-1 usa uma abordagem autorregressiva, gerando vídeos em blocos fixos de 24 quadros Prevê o próximo bloco com base no anterior para gerar transições de cena mais suaves e coerência temporal.
O usuário também pode fornecer prompts diferentes para cada segmento de vídeo e assim ter um controle detalhado sobre a composição e a progressão da cena. Com isso, pode criar narrativas complexas com ótimas transições visuais.
O design modelo é capaz de processar até quatro blocos simultaneamente para acelerar a geração do vídeo.
Quais são os resultados? Em comparações diretas, o MAGI-1 demonstrou desempenho superior em qualidade de movimento, aderência às instruções do usuário e consistência semântica.
Uma característica de destaque do MAGI-1 é precisão na previsão de comportamentos físicos e movimentos realistas, como evidenciada pelas pontuações máximas no benchmark Physics-IQ.
A Sand AI garante que o MAGI-1 supera concorrentes de código aberto como Wan-2.1 e HunyuanVideo e se compara a modelos proprietários como Hailuo, Kling e Sora.
Quer testar a novidade? Vá até o playground da Sand AI.
AI_TRENDS
A Meta está usando ferramentas de IA para identificar usuários menores no Instagram que possam ter informado a idade incorretamente. Em caso afirmativo, a conta ganhará segurança e privacidade mais rígidas.
Google Research desenvolveu a família C2S-Scale de LLMs que converte perfis de expressão gênica em texto para que pesquisadores interajam com dados em linguagem natural.
O novo Open Deep Research da Together AI, de código aberto, gera relatórios estruturados com citações com base em perguntas complexas.
O Orpheus é um novo conjunto de modelos TTS, que transforma texto em fala, e, segundo a desenvolvedora Canopy Labs, se destaca pela precisão, expressividade e capacidade de personalização.
A ElevenLabs agora tem um recurso de transferência de agentes para melhorar a comunicação corporativa por meio da IA. A ferramenta permite que agentes de IA transfiram conversas a terceiros quando condições específicas forem atendidas.
A plataforma Character AI lançou o AvatarFX, seu primeiro modelo de geração de vídeo capaz de criar personagens animados 2D e 3D.
O modelo o3 não se saiu tão bem no benchmarking FrontierMath quanto a OpenAI havia sugerido inicialmente. A OpenAI se junta à Meta em mais um caso de discrepância em torno de dados de desempenho dos modelos de IA.
Rumores na Internet sugerem que a DeepSeek lançará um novo modelo em breve (R2) totalmente treinado usando chips da Huawei. Os custos unitários por token devem ser muito inferiores aos do GPT-4.
AI_VENTURES
VISÃO E LINGUAGEM
Seriam os modelos de IA daltônicos?
As cores são uma parte importante da nossa compreensão do mundo, mas será que a IA, especificamente, os modelos de visão e linguagem (VLMs, na sigla em inglês), consegue lidar bem com elas?
É essa questão que o ColorBench, nova ferramenta de benchmarking, desenvolvida por pesquisadores da Universidade de Marylan, pretende abordar, testando rapidamente as habilidades dos modelos de IA que combinam visão e linguagem e são usados em tudo, desde carros autônomos até compras online. É como um exame de vista colorido para VLMs.
Como funciona? Com suas 11 tarefas coloridas, mais de 1.400 casos de teste e quase 6.000 perguntas de imagem e texto, o ColorBench apresenta uma série de desafios para a IA, desde contar objetos coloridos até não cair em truques ópticos. Verifica três pontos importantes:
Percepção: Como consegue identificar um balão azul ou um limão verde em uma imagem?
Raciocínio: Reconhece que uma luz verde significa "siga"?
Robustez: Ainda funcionará se as cores forem manipuladas, por exemplo, com tons de cinza?
![]() |
|
Modelos maiores significam cores melhores (mas nem tanto) - Modelos maiores se saíram melhor em tarefas de cores, não por causa de sua competência "visual", mas por sua habilidade com linguagem.
Cores são um campo difícil para IA - Até mesmo os melhores VLMs tiveram dificuldades com certas tarefas, seja nomeando cores, estimando quanto azul há em uma imagem ou evitando ilusões ópticas.
Cores podem ajudar ou atrapalhar - São úteis para tarefas simples, como localizar um balão vermelho, mas podem atrapalhar modelos em casos mais complexos, como camuflagem ou ilusão de óptica.
Pensar bem - Quando usam "cadeias de pensamento", dividindo os problemas passo a passo, VLMs acertam em cheio nas tarefas de cores com mais frequência. A abordagem cuidadosa também ajuda em casos de manipulação de cores.
Enfim, cores não servem apenas para embelezar; são essenciais em aplicações no mundo real, como uso de imagens médicas, podendo diferenciar tecidos saudáveis de doentes. Para veículos autônomos, sinalizam semáforos ou placas de trânsito. Então, se a IA não conseguir lidar bem com as cores, isso poderá custar caro.
AI_GOVERNANCE & ETHICS
♨️⛽ Combustíveis fósseis para IA
Executivos da Amazon e da NVIDIA indicaram que todas as opções de fontes de energia, entre elas combustíveis fósseis e gás natural, estão sendo consideradas para atender à crescente demanda energética dos data centers para IA. Apesar dos investimentos em energia renovável, reconheceram a necessidade de fontes de energia confiáveis no curto prazo em função do atual cenário geopolítico. A ideia de usar carvão, no entanto, foi causa de preocupação.
📚🔎 Wikipedia sobrecarregada
A Wikipedia está dando a desenvolvedores de IA acesso a conjuntos de dados estruturados de seu conteúdo por meio de uma parceria com a Kaggle, plataforma de ciência de dados do Google. A iniciativa pretende reduzir a sobrecarga nos servidores da Wikipédia causada por robôs de IA que coletam dados do site para treinamento. A coleta de dados aumentou em 50% o uso da largura de banda da Wikipedia desde janeiro de 2024. Com esse caminho, a Wikipedia espera fornecer uma alternativa amigável ao scraping guiado por IA que costuma prejudicar a infraestrutura do site.
💰 Investimento em IA segura
Geoff Ralston, ex-presidente da Y Combinator, lançou um fundo chamado Safe Artificial Intelligence Fund (SAIF) que se concentrará em startups que buscam aprimorar a segurança, a proteção e a implantação responsável da IA. A ideia é investir US$ 100.000 em empreendimentos em estágio inicial, com um limite total de US$ 10 milhões. As áreas de investimento são alinhamento e interpretabilidade, infraestrutura de segurança para proteção da propriedade intelectual, ferramentas de governança e conformidade e sistemas para combater da desinformação gerada pela IA.
AI_SNAPSHOT
💡 Inovação & Inspiração
Cão guia virtual Um protótipo de sistema vestível que utiliza câmeras com inteligência artificial presta assistência a deficientes visuais em tempo real enquanto caminham por variados ambientes. A solução utiliza IA para interpretar imagens da câmera acoplada a um par de óculos e fornece informações sobre localização em tempo real por meio de alertas sonoros e vibração. 🦮
Reescrevendo a história do Sol Cientistas estão usando IA para analisar dados sobre o Sol com décadas de existência, facilitando a comparação com novas observações. Ao converter dados antigos para um formato moderno, a IA ajuda a revelar novos perspectivas sobre o comportamento do Sol, como campos magnéticos e atividade solar. Isso cria uma "linguagem científica" unificada para todos os dados solares, passados e futuros, ampliando a compreensão do clima espacial e seu impacto na Terra. 🌞
🌍 IA Global
🇦🇪 Justiça mais justa Os Emirados Árabes Unidos lançaram o primeiro ecossistema de inteligência regulatória do mundo para transformar a forma como o país desenvolve, atualiza e implementa leis. O sistema conecta toda a legislação federal e local por meio de IA, vinculando-a diretamente a serviços públicos, decisões judiciais e procedimentos executivos. O objetivo é tornar a legislação mais precisa, eficiente e atenta às necessidades dos cidadãos e da economia. A expectativa é tornar os processos legislativos até 70% mais ágeis.
🌐 Seleção de músicas personalizada O Spotify está expandindo o recurso de IA Playlist, ainda em versão beta, para quase 50 mercados, abrangendo países da África, Ásia, Europa e Caribe. A ferramenta personaliza a seleção de músicas usando prompts de texto.
🇪🇺 Crescimento europeu A busca do ChatGPT, recurso que permite ao chatbot acessar e incorporar informações atualizadas da Web nas respostas, teve um rápido crescimento na Europa, atingindo uma média de 41,3 milhões de usuários ativos mensais no semestre encerrado em 31 de março de 2025. No semestre anterior, eram 11,2 milhões de usuários. A OpenAI compartilhou esses número em cumprimento da Lei de Serviços Digitais (DSA) da Europa.
🔢 IA em números
Representação dos dados do Relatório do Índice de IA de 2025 da Stanford HAI que revelam quais países estão fazendo as maiores apostas em IA.
AI_TOOLKIT
🛠 Ferramentas
Photoflux cria provadores virtuais para roupas.
Omakase transforma sites em agentes de vendas por voz.
Whisk Animate torna imagens em clipes de oito segundos (para assinantes do Google One AI Premium).
📚 Mais recursos
Um ensaio do Instituto Knight Columbia argumenta que a Inteligência Artificial deve ser vista como uma tecnologia normal, a exemplo da eletricidade e Internet, e não como uma entidade separada. Os autores sugerem que os humanos podem e devem controlar a IA, sem medidas drásticas.
A Anthropic reúne dicas e truques para Claude Code, ferramenta de linha de comando para programação de agentes.
AI_FLASH_NEWS
A Huawei está se preparando para enviar remessas em massa do novo chip de IA 910C para clientes chineses já em maio, especialmente como alternativa às restrições dos Estados Unidos às vendas de chips da NVIDIA.
O Washington Post firmou parceria com a OpenAI para integrar o conteúdo jornalístico ao ChatGPT e permitir que o chatbot exiba resumos, citações e links para reportagens originais nas consultas dos usuários.
A Alphabet fez o spin-off do projeto Chorus cujo foco é aprimorar a eficiência das cadeias de suprimentos com rastreamento de mercadorias em tempo real usando ferramentas de IA.
O Allen Institute for AI (AI2), fundado por Paul Allen, lançou o DataDecide conjunto de modelos pré-treinados abrangendo 25 corpora e 14 tamanhos que variam entre 4 milhões e 1 bilhão de parâmetros.
A Infinite Reality, especializada em realidade estendida, IA e tecnologias imersivas, anunciou a aquisição da Touchcast, da área de agentes de IA, por US$ 500 milhões.
Robôs humanoides competiram ao lado de corredores humanos na meia maratona de Pequim. O robô mais rápido completou 21 km em 2 horas, 40 minutos e 42 segundos; o corredor, em cerca de 1 hora e 2 minutos.
A startup Mechanize quer criar réplicas digitais de ambientes de trabalho, nas quais agentes de IA podem aprender e ser testados em tarefas reais. Essa meta ambiciosa já está gerando controvérsias. 🤔🤔🤔
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊

