- IA Express
- Posts
- Nova técnica adapta LLMs com simples comandos de texto
Nova técnica adapta LLMs com simples comandos de texto
Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você saberá como simples comandos de texto estão esculpindo grandes modelos de linguagem. Também verá por que, paradoxalmente, a Inteligência Artificial que promete produtividade não está gerando impacto nos negócios.
Porém isso não é tudo no IA Express de hoje:
- Sistema de IA cria modelos 3D com textura a partir de imagens
- Avatares guiados por IA fazem transmissões ao vivo de e-commerce
- Inteligência Artificial traduz atividade cerebral em fala
- Veja como gerar imagens em bate-papos do WhatsApp usando ChatGPT
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
SEM TREINAMENTO
Nova técnica adapta LLMs com simples comandos de texto
Pesquisadores da Sakana AI desenvolveram um método chamado Text-to-LoRA (T2L) que permite a adaptação instantânea (on-the-fly) de grandes modelos de linguagem (LLMs) usando apenas instruções em linguagem natural. A inovação tem potencial para democratizar a personalização desses modelos de IA, tornando-a mais rápida, mais barata e mais acessível a um grupo mais amplo de usuários.
Como funciona? O Text-to-LoRA (Low-Rank Adapter) recebe uma descrição de texto de uma tarefa desejada, como um prompt, e gera um LoRA específico - modificações leves do LLM - para que o modelo-base (por exemplo, Mistral-7B-Instruct) execute tarefas especializadas sem “extensa reciclagem”.
| ![]() |
Em termos mais técnicos, o T2L foi treinado com um grande conjunto diversificado de tarefas para aprender traduzir descrições de tarefas em linguagem natural em adaptadores LoRA.
O novo método se inspirou em sistemas biológicos, que se adaptam rapidamente com base em pistas limitadas, para abordar a rigidez dos LLMs tradicionais quando usados em aplicações específicas.
Por que isso importa? A adaptação de modelos de propósito geral para tarefas personalizadas, em geral, é um processo caro e demorado de curadoria de conjuntos de dados e ajuste fino. O novo Text-to-LoRA (T2L) elimina a necessidade de treinamento extensivo e conhecimento técnico aprofundado, oferecendo um passo significativo para tornar a especialização dos chamados modelos-base, como os LLMs, mais acessível.
O código do Text-to-LoRA (T2L) está disponível aqui.
COPILOTOS X AGENTES DE IA
Paradoxo das soluções de IA horizontais nas empresas
Um relatório recente da McKinsey apontou que, apesar da adoção generalizada da IA Generativa - um classe de Inteligência Artificial que cria novos conteúdos com base em padrões -, a maioria das empresas não está relatando impactos financeiros significativos.
A esse efeito a McKinsey deu o nome de Paradoxo da IA Generativa - soluções de IA horizontais que crescem rapidamente, mas carecem de profundidade. Em contraposição, há os casos de uso verticais, mais especializados e com maior potencial para gerar impactos diretos nos negócios. No entanto, estes ainda permanecem presos em projetos-piloto.
O que você precisa saber:
A principal razão para esses retornos limitados é a ênfase excessiva nas ferramentas de IA horizontais, como chatbots e copilotos, e não em agentes de IA, que vão além e executam tarefas e fluxos de trabalho complexos.
Segundo a McKinsey, esses sistemas de IA autônomos e orientados por objetivos são a chave para gerar verdadeiro valor para as empresas, ao automatizar e otimizar processos de negócios inteiros, tornando-se colaboradores proativos em vez de assistentes passivos.
Além disso, é preciso reinventar os processos e não apenas “encaixar” a IA nos fluxos de trabalho existentes. Apenas adaptar limitaria os impactos positivos. A verdadeira transformação requer uma malha de agentes de IA, capaz de integrar versões personalizadas e prontas para uso.
Ainda assim, o maior desafio não será técnico, será humano: ganhar confiança dos usuários para impulsionar a adoção dos agentes de IA e também estabelecer os protocolos de governança adequados para o uso seguro desses colaboradores inteligentes.
AI_TRENDS
Google libera Veo 3 para assinantes AI Pro e Ultra em mais de 70 mercados.
Seaweed-APT2, da Bytedance, é um modelo para streaming de vídeo destinado a aplicações interativas em tempo real que gera quatro quadros de cada vez.
Startup chinesa MiniMax apresentou M1, modelo de raciocínio de código aberto que compete diretamente com modelos da DeepSeek e de empresas dos Estados Unidos em termos de desempenho e custo.
O novo Kimi-Dev-72B para tarefas de engenharia de software, superou o vice-campeão no SWE-bench Verified, estabelecendo outro patamar entre modelos de código aberto.
Anysphere lançou um plano de US$ 200 por mês para sua ferramenta de codificação Cursor que permite usar 20x mais os modelos de IA da OpenAI, Anthropic, Google e xAI em comparação com o plano Pro de US$ 20 mensais.
Hunyuan 3D 2.1 é um sistema aberto da Tencent que gera modelos 3D de alta fidelidade com textura a partir de imagens.
OpenAI atualizou os espaços de trabalho ChatGPT Projects com pesquisa aprofundada, modo de voz e mais memória.
Eleven v3 agora transforma texto em fala em 41 novos idiomas, totalizando 70.
Uma nova estrutura chamada Self-Adapting LLMs (SEAL) dá aos LLMs a capacidade de se aprimorem de forma autônoma, gerando seus próprios dados de treinamento e instruções de atualização. 😮
AI_VENTURES
COMÉRCIO ELETRÔNICO
Avatares guiados por IA transformam transmissões ao vivo
Em uma exibição impressionante, avatares movidos por IA ofuscaram sua própria contraparte humana em uma recente transmissão ao vivo de seis horas na plataforma de comércio eletrônico da Baidu.
![]() Crédito: Baidu |
|
Com base no modelo ERNIE da própria Baidu, a tecnologia de avatares digitais usada na transmissão foi além da coordenação do bate-papo para realizar o planejamento multimodal e a geração de scripts. Isso garantiu a coordenação sincronizada entre voz, recursos visuais, expressões e interação, resultando em avatares de IA altamente expressivos e interativos a ponto de tornar difícil para os espectadores distingui-los de pessoas reais.
Por que isso importa? A transmissão atraiu mais de 13 milhões de telespectadores e gerou US$ 7 milhões em valor bruto da mercadorias. De acordo com o Baidu, esse valor excedeu o arrecadado em uma transmissão do próprio Luo, de uma hora e em pessoa, no mês passado.
Esse tipo de evento ao vivo pode ser considerado um novo um marco no comércio eletrônico, mostrando o potencial dos avatares digitais para revolucionar a promoção de produtos e o engajamento dos consumidores.
AI_GOVERNANCE & ETHICS
👨🏫 Tutor, não substituto
Muitos podem pensar que o Claude Learning Mode da Anthropic foi criado ajudar professores a combater trapaças de alunos, mas foi desenvolvido, sim, em resposta às preocupações dos estudantes universitários com a deterioração do processo de aprendizado. Quem explica é Dreww Bent, profissional da educação que foi instrumental no lançamento do Claude for Education, versão especializada do assistente de IA da Anthropic para o ensino superior. De acordo com Bent, muitos alunos têm manifestado interesse no chatbot adaptado e revelado que outras ferramentas estavam dificultando a capacidade de se envolver profundamente com os materiais de ensino. Com o Learning Model, a expectativa é que os estudantes usam o assistente de IA como se estivessem interagindo como um tutor que estimule o pensamento crítico e evite o declínio intelectual.
AI_SNAPSHOT
💡 Inovação & Inspiração
IA traduz atividade cerebral em fala Uma nova interface cérebro-computador (BCI) guiada por IA está permitindo que um homem com esclerose lateral amiotrófica (ELA) se comunique em tempo real. No centro dessa inovação desenvolvida na Universidade da Califórnia, que traduz sinais cerebrais em fala sintetizada sem atrasos discerníveis, estão algoritmos avançados de IA que funcionam como um trato vocal digital, interpretando diretamente a fala pretendida do usuário a partir de sua atividade cerebral. Para conseguir isso, os pesquisadores treinaram a IA usando dados coletados enquanto o paciente tentava ler frases em uma tela de computador. Esse processo permite que a IA aprenda os padrões neurais associados a palavras e frases específicas, que podem decodificar e vocalizar instantaneamente. 🧠🗣️
Cinema combinado com IA O primeiro filme da parceria entre Google DeepMind e Primordial Soup, ANCESTRA, produzido usando ferramentas de IA, estreou no Festival de Tribeca dias atrás. A obra usou um modelo híbrido que combina elementos tradicionais do cinema, como atores e equipes de filmagem, com visuais gerados pelo modelo Veo do Google DeepMind. 🎬📽️📺
🌍 IA Global
🇺🇸 Defesa inteligente O OpenAI for Government é um novo programa para garantir às agências governamentais dos Estados Unidos soluções de IA personalizadas que aprimorem os serviços públicos. Ferramentas de IA seguras e ampliáveis, entre elas modelos personalizados e suporte, vão simplificar e elevar a eficiência das tarefas administrativas. O primeiro projeto no escopo desse programa será com o Departamento de Defesa sob um contrato de até US$ 200 milhões.
🇺🇸 Relatórios de segurança da IA O estado de Nova York, nos Estados Unidos, aprovou um projeto de lei denominado Responsible AI Safety and Education (RAISE) para impedir que modelos de IA de grandes empresas causem eventos catastróficos, definidos como incidentes que resultam em mais de 100 mortes ou ferimentos ou danos superiores a US $ 1 bilhão. A nova legislação exige que tais empresas divulguem relatórios de segurança sobre seus modelos IA e impõe penalidades em caso de não conformidade.
📰 How-to
Agora você pode gerar imagens diretamente nos bate-papos do WhatsApp. usando o ChatGPT. Quer saber como? Siga os passos abaixo.
Confira se o número do ChatGPT está salvo em seus contatos. Se não estiver, adicione 1-800-ChatGPT (+1-800-242-8478).
| ![]() |
AI_TOOLKIT
🛠️Ferramentas
Universal Streaming é uma API para transcrição de fala em tempo real projetada especificamente para agentes de voz com 300 ms de latência.
Adobe Firefly permite criar imagens e vídeos usando IA em smartphones com sistemas iOS e Android.
AI_FLASH_NEWS
Meta e Oakley devem anunciar uma nova linha de óculos inteligentes com recursos de IA nesta sexta. Em janeiro, uma matéria da Bloomberg adiantou que a Meta estaria preparando óculos inteligentes destinados a atletas.
Taiwan acrescentou Huawei e SMIC à sua lista de controle de exportação, alinhando-se aos esforços dos Estados Unidos contra as ambições chinesas em IA.
OpenAI considerou acusar a Microsoft de comportamento anticompetitivo em meio à discussão sobre os termos de sua conversão em uma empresa com fins lucrativos, segundo o Wall Street Journal.
Google planejar cortar relações com Scale AI, cuja fatia de 49% foi adquirida pela Meta recentemente. O receio é ter informações proprietárias compartilhadas com um grande concorrente.
TikTok integrou recursos de IA à sua plataforma Symphony para que anunciantes gerem vídeos a partir de texto e imagens.
AstraZeneca entrou em um acordo de pesquisa baseada em IA com o grupo farmacêutico chinês CSPC para desenvolver terapias indicadas a condições crônicas.
A fintech Revolut lançará seu assistente financeiro guiado por IA em um futuro próximo.
Usuários do Instagram relataram um aumento significativo nas proibições e suspensões de contas de forma equivocada. A possível causa? Moderação problemática da IA. ❗⚠️🤖
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊


