IA Express
Posts
Tokenizadores podem transformar a geração de imagens por IA

Tokenizadores podem transformar a geração de imagens por IA

Sheila Zabeu
25 jul

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você saberá como o MIT está fazendo mais com menos na geração de imagens por IA. Já a Casa Branca revela a estratégia para garantir a liderança americana no campo da Inteligência Artificial. 🇺🇸🗽🦅

Porém isso não é tudo no IA Express de hoje:
- Atualização do Qwen3 da AIibaba supera concorrentes em programação
- Táticas de persuasão também funcionam com IA
- Sam Altman alerta sobre a iminente crise de fraudes bancárias guiadas por IA
- Relatório detalha como modelos de IA da Apple foram treinados

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

IMAGEM

Tokenizadores podem transformar a geração de imagens por IA

Pesquisadores do MIT propuseram uma nova forma de criar e manipular imagens usando Inteligência Artificial. Tradicionalmente, a geração de imagens feita por IA é um processo de duas etapas que envolve um “tokenizador” para comprimir os dados da imagem e um “gerador” separado para produzir o resultado final. Embora eficaz, esse método exige muitos recursos computacionais, sem falar no tempo de treinamento.

No entanto, a equipe do MIT identificou uma capacidade inovadora dos tokenizadores unidimensionais (1D) - nesse caso, redes neurais especializadas, que transformam imagens de 256x256 pixels em apenas 32 tokens numéricos: também podem executar independentemente tarefas de geração e edição de imagens, eliminando a necessidade de um gerador separado.

A inovação não para por aí. Ao combinar um tokenizador 1D com um "destokenizador" e usar uma “rede neural de prateleira”, a equipe do MIT demonstrou recursos impressionantes, como converter uma imagem em outra e gerar imagens inteiramente novas a partir do zero. Os pesquisadores também aplicaram esse método com sucesso para preencher partes vazias das imagens.

Por que isso importa? Essa abordagem pioneira redefine fundamentalmente o papel dos tokenizadores no processamento de imagens de IA. Seu potencial para reduzir os custos computacionais associados à geração de imagens é imenso, abrindo portas para ferramentas de IA mais eficientes e acessíveis.

Além do reino da geração de imagens, esse avanço pode ter implicações de longo alcance em outros campos, como carros autônomos e robótica.

POLÍTICA

Governo Trump apresenta plano de ação para Inteligência Artificial

O governo de Donald Trump apresentou em 23 de julho um plano de ação específico para Inteligência Artificial nos Estados Unidos, que prioriza o rápido desenvolvimento tecnológico para competir com a China, afastando-se da abordagem do governo Biden cujo foco era os potenciais riscos trazidos pela tecnologia.

O objetivo central do plano é consolidar o país como líder global em IA para promover a competitividade econômica e garantir a segurança nacional. Para isso, defende a remoção de barreiras regulatórias, o estímulo à inovação e a garantia de que sistemas de IA sejam livres de viés ideológico, alinhando-se com os valores americanos de liberdade de expressão e verdade objetiva.

O que você precisa saber:

O documento divulgado pela Casa Branca descreve uma estratégia para garantir a liderança dos Estados Unidos em IA, estruturada em torno de três pilares: Acelerar a Inovação, Desenvolver a Infraestrutura e Liderar em Diplomacia e Segurança Internacionais.
Para acelerar a inovação, serão identificadas e removidas regulamentações federais que dificultem o desenvolvimento da IA. Também serão promovidos modelos de IA com código e parâmetros abertos.
Em termos de infraestrutura, a intenção é simplificar os processos de permissão para construção de uma infraestrutura de IA robusta, incluindo datacenters, fábricas de semicondutores e redes elétricas.
No terceiro pilar, as medidas serão, em resumo, exportar tecnologias de IA para aliados e fortalecer as restrições relacionadas a semicondutores e IA para países adversários.

AI_TRENDS

Atualização Qwen3-235B-A22B-Instruct-2507 da AIibaba supera Kimi-k2, DeepSeek V3-0324 e Claude em benchmarking de matemática e programação.
Gemini 2.5 Flash-Lite, que oferece equilíbrio entre desempenho e custo, sem comprometer a qualidade, agora está disponível como versão estável.
Sapient Intelligence apresentou um modelo hierárquico inspirado no cérebro humano que aborda desafios de raciocínio não superados pelos LLMs atuais.
A meta da @xAI é ter 50 milhões de unidades computacionais equivalentes a GPU H100 (mas com eficiência energética muito superior) em cinco anos.
Novo recurso do Gemini 2.5, disponível via API, permite segmentar imagens usando linguagem natural.
Browser Company criou uma "galeria de habilidades" para seu navegador Dia, com atalhos para prompts frequentemente usados por usuários. Parece que o Comet da Perplexity não vai ficar atrás.
Pika Labs está desenvolvendo uma rede social apenas para vídeos gerados por IA. O aplicativo já está disponível na Apple Store. 📹🤔

AI_GOVERNANCE & ETHICS

👉 Táticas de persuasão também funcionam com IA

Uma nova pesquisa do Wharton Generative AI Labs revelou um aspecto fascinante, mas também preocupante dos grandes modelos de linguagem (LLMs): são suscetíveis a técnicas de persuasão social. Esse fenômeno de “respostas parahumanas” sugere que princípios clássicos de influência, como autoridade, compromisso e reciprocidade, podem aumentar significativamente a disposição dos modelos de IA para atender a solicitações, mesma as questionáveis. Acredita-se que essa suscetibilidade decorra de pistas sociais incorporadas nos vastos volumes de texto com que são treinados, reforçados pelo feedback humano durante processos de ajuste fino. O estudo ressalta o papel fundamental de cientistas sociais na compreensão dos comportamentos dos modelos de IA em evolução e destaca como respostas humanas podem surgir mesmo na ausência de consciência ou de fundamentos biológicos.

🏦 Crise iminente no sistema bancário

Em uma conferência do Federal Reserve dos Estados Unidos com banqueiros e representantes de órgãos reguladores, Sam Altman, CEO da OpenAI, deu um aviso severo sobre uma iminente crise de fraudes alimentadas por IA. O executivo destacou que vozes geradas por IA e, em breve, deepfakes de vídeo serão muito convincentes e poderão burlar métodos comuns de autenticação que algumas instituições financeiras usam para autorizar transações. Altman descreveu essa confiança na atual autenticação por impressão de voz como “louca” e “aterrorizante”, enfatizando que a IA tem permitido que criminosos se passem por outras pessoas e contornem os sistemas de prevenção de fraudes com facilidade.

AI_SNAPSHOT

💡 Inovação & Inspiração

Roteador de modelos de IA Em dúvida sobre qual modelo escolher, entre GPT-4o, o3, o4-mini e outros, para realizar uma missão específica? Boas notícias podem estar no horizonte! Parece que a OpenAI está trabalhando em um "roteador de modelos" que seleciona automaticamente a opção mais adequada para a consulta do usuário, tornando a experiência com o ChatGPT mais tranquila. O tal roteador analisaria o prompt previamente para identificar, por exemplo, se a tarefa envolve a produção de relatórios, questões de raciocínio ou programação complexa, para então atribuí-la ao modelo mais adequado. 🤔🎯👌
Design de proteínas na Web O Latent-X, da Latent Labs, é um modelo de IA que promete transformar a forma como se projetam ligantes proteicos. E a melhor parte? Está acessível em uma plataforma Web! Com o Latent-X, será possível, com apenas alguns cliques, gerar e explorar designs de ligantes e selecionar os candidatos mais promissores para testes em laboratório. Em comparações experimentais lado a lado, o Latent-X superou outras ferramentas avançadas de IA Generativa tanto em avaliações computacionais quanto validação laboratorial. Por que isso importa? Pode acelerar a descoberta de medicamentos, por exemplo. 🧬💊

🌍 IA Global

🇦🇪 Em busca de investimento Um memorando vazado de Dario Amodeido, CEO da Anthropic, revelou o plano da empresa para buscar investimentos dos Emirados Árabes Unidos e Catar, apesar das preocupações éticas relacionadas a regimes autoritários. Amodei reconhece que não vê isso com bons olhos, mas argumenta que evitar todos os “maus atores” é impraticável para os negócios. A decisão marca uma mudança na posição da Anthropic, que foi contra os investimentos da Arábia Saudita em 2024 por conta do receio associado ao autoritarismo.

🇺🇸 Próximo do centro político A OpenAI planeja abrir no início de 2026 seu primeiro escritório em Washington, DC (EUA), que será chamado de "The Workshop". O local servirá como um centro de engajamento político, onde serão oferecidos treinamentos e apresentados produtos para formuladores de políticas, educadores e organizações sem fins lucrativos. A iniciativa reflete a estratégia da OpenAI de influenciar nas regulamentações e abordar preocupações sobre o impacto econômico da IA.

🔢 IA em números

O SoftBank implantou o maior NVIDIA DGX SuperPOD do mundo, com mais de 4.000 GPUs NVIDIA Blackwell e 13,7 exaflops de poder computacional.

SuperPOD é um supercomputador de IA pré-configurado, projetado para cargas de trabalho de treinamento e inferência de IA na escala de data centers.

🛠️Ferramentas

Mexty usa IA para criar conteúdo educacional interativo e personalizado compatível com as principais plataformas de e-learning.
Model Playground AI compara lado lado imagens, vídeos e elementos 3D gerados por vários modelos de IA.
Vibechart transforma dados em gráficos ou diagramas visualmente vibrantes.

📚 Miscelânea

Relatório técnico detalha como os modelos de IA da Apple foram treinados, otimizados e avaliados. O documento inclui vários aspectos, entre eles arquitetura, fontes de dados, pré-treinamento, pós-treinamento, desenvolvimento do uso de ferramentas, otimizações e sistemas de benchmarking.

AI_FLASH_NEWS

Oracle e OpenAI firmaram um acordo para construir 4,5 GW em capacidade para data centers nos Estados Unidos sob o projeto Stargate. A OpenAI vai pagar US$ 30 bilhões por ano à Oracle por serviços de data center.
Usuários do ChatGPT ao redor do mundo enviam mais de 2,5 bilhões de prompts por dia. Cerca de 330 milhões têm origem nos Estados Unidos.
Novo Grok 4 e seus avatares de IA contribuíram para um aumento relevante nos downloads e na receita gerada pelo app para iOS.
Amazon vai adquirir a startup Bee, criadora de uma pulseira que registra conversas e usa IA para fazer resumos diários, listas de tarefas, por exemplo.
FuriosaAI, startup que pretende desenvolver chips para concorrerem com os da NVIDIA, fecha seu primeiro grande contrato com a LG AI Research.
Em um podcast recente da a16z, a IA foi definida como quarto pilar crítico da infraestrutura, juntando-se ao trio computação, armazenamento e rede.
Google pode estar negociando acordos com sites de notícias para usar conteúdo em modelos de IA, como fazem OpenAI e Perplexity.
Microsoft contrata mais de 20 profissionais do Google DeepMind na corrida por talentos em IA.
Planilha interna vazada da Surge AI, empresa contratada pela Anthropic, revela mais de 120 sites permitidos e de lista negra são usados para ajustar o modelo Claude e torná-lo mais "útil, honesto e inofensivo". ⚫📝

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊