• IA Express
  • Posts
  • Tokenizadores podem transformar a geração de imagens por IA

Tokenizadores podem transformar a geração de imagens por IA

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você saberá como o MIT está fazendo mais com menos na geração de imagens por IA. Já a Casa Branca revela a estratégia para garantir a liderança americana no campo da Inteligência Artificial. 🇺🇸🗽🦅

Porém isso não é tudo no IA Express de hoje:
- Atualização do Qwen3 da AIibaba supera concorrentes em programação
- Táticas de persuasão também funcionam com IA
- Sam Altman alerta sobre a iminente crise de fraudes bancárias guiadas por IA
- Relatório detalha como modelos de IA da Apple foram treinados

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

AI_NEWS_CIRCUIT

IMAGEM

Tokenizadores podem transformar a geração de imagens por IA

Pesquisadores do MIT propuseram uma nova forma de criar e manipular imagens usando Inteligência Artificial. Tradicionalmente, a geração de imagens feita por IA é um processo de duas etapas que envolve um “tokenizador” para comprimir os dados da imagem e um “gerador” separado para produzir o resultado final. Embora eficaz, esse método exige muitos recursos computacionais, sem falar no tempo de treinamento.

No entanto, a equipe do MIT identificou uma capacidade inovadora dos tokenizadores unidimensionais (1D) - nesse caso, redes neurais especializadas, que transformam imagens de 256x256 pixels em apenas 32 tokens numéricos: também podem executar independentemente tarefas de geração e edição de imagens, eliminando a necessidade de um gerador separado.


A inovação não para por aí. Ao combinar um tokenizador 1D com um "destokenizador" e usar uma “rede neural de prateleira”, a equipe do MIT demonstrou recursos impressionantes, como converter uma imagem em outra e gerar imagens inteiramente novas a partir do zero. Os pesquisadores também aplicaram esse método com sucesso para preencher partes vazias das imagens.

Por que isso importa? Essa abordagem pioneira redefine fundamentalmente o papel dos tokenizadores no processamento de imagens de IA. Seu potencial para reduzir os custos computacionais associados à geração de imagens é imenso, abrindo portas para ferramentas de IA mais eficientes e acessíveis.

Além do reino da geração de imagens, esse avanço pode ter implicações de longo alcance em outros campos, como carros autônomos e robótica.

POLÍTICA

Governo Trump apresenta plano de ação para Inteligência Artificial

O governo de Donald Trump apresentou em 23 de julho um plano de ação específico para Inteligência Artificial nos Estados Unidos, que prioriza o rápido desenvolvimento tecnológico para competir com a China, afastando-se da abordagem do governo Biden cujo foco era os potenciais riscos trazidos pela tecnologia.

O objetivo central do plano é consolidar o país como líder global em IA para promover a competitividade econômica e garantir a segurança nacional. Para isso, defende a remoção de barreiras regulatórias, o estímulo à inovação e a garantia de que sistemas de IA sejam livres de viés ideológico, alinhando-se com os valores americanos de liberdade de expressão e verdade objetiva.

O que você precisa saber:

  • O documento divulgado pela Casa Branca descreve uma estratégia para garantir a liderança dos Estados Unidos em IA, estruturada em torno de três pilares: Acelerar a Inovação, Desenvolver a Infraestrutura e Liderar em Diplomacia e Segurança Internacionais. 

  • Para acelerar a inovação, serão identificadas e removidas regulamentações federais que dificultem o desenvolvimento da IA. Também serão promovidos modelos de IA com código e parâmetros abertos.

  • Em termos de infraestrutura, a intenção é simplificar os processos de permissão para construção de uma infraestrutura de IA robusta, incluindo datacenters, fábricas de semicondutores e redes elétricas.

  • No terceiro pilar, as medidas serão, em resumo, exportar tecnologias de IA para aliados e fortalecer as restrições relacionadas a semicondutores e IA para países adversários.

AI_TRENDS

AI_GOVERNANCE & ETHICS

👉 Táticas de persuasão também funcionam com IA

Uma nova pesquisa do Wharton Generative AI Labs revelou um aspecto fascinante, mas também preocupante dos grandes modelos de linguagem (LLMs): são suscetíveis a técnicas de persuasão social. Esse fenômeno de “respostas parahumanas” sugere que princípios clássicos de influência, como autoridade, compromisso e reciprocidade, podem aumentar significativamente a disposição dos modelos de IA para atender a solicitações, mesma as questionáveis. Acredita-se que essa suscetibilidade decorra de pistas sociais incorporadas nos vastos volumes de texto com que são treinados, reforçados pelo feedback humano durante processos de ajuste fino. O estudo ressalta o papel fundamental de cientistas sociais na compreensão dos comportamentos dos modelos de IA em evolução e destaca como respostas humanas podem surgir mesmo na ausência de consciência ou de fundamentos biológicos.

🏦 Crise iminente no sistema bancário

Em uma conferência do Federal Reserve dos Estados Unidos com banqueiros e representantes de órgãos reguladores, Sam Altman, CEO da OpenAI, deu um aviso severo sobre uma iminente crise de fraudes alimentadas por IA. O executivo destacou que vozes geradas por IA e, em breve, deepfakes de vídeo serão muito convincentes e poderão burlar métodos comuns de autenticação que algumas instituições financeiras usam para autorizar transações. Altman descreveu essa confiança na atual autenticação por impressão de voz como “louca” e “aterrorizante”, enfatizando que a IA tem permitido que criminosos se passem por outras pessoas e contornem os sistemas de prevenção de fraudes com facilidade.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Roteador de modelos de IA Em dúvida sobre qual modelo escolher, entre GPT-4o, o3, o4-mini e outros, para realizar uma missão específica? Boas notícias podem estar no horizonte! Parece que a OpenAI está trabalhando em um "roteador de modelos" que seleciona automaticamente a opção mais adequada para a consulta do usuário, tornando a experiência com o ChatGPT mais tranquila. O tal roteador analisaria o prompt previamente para identificar, por exemplo, se a tarefa envolve a produção de relatórios, questões de raciocínio ou programação complexa, para então atribuí-la ao modelo mais adequado. 🤔🎯👌

  • Design de proteínas na Web O Latent-X, da Latent Labs, é um modelo de IA que promete transformar a forma como se projetam ligantes proteicos. E a melhor parte? Está acessível em uma plataforma Web! Com o Latent-X, será possível, com apenas alguns cliques, gerar e explorar designs de ligantes e selecionar os candidatos mais promissores para testes em laboratório. Em comparações experimentais lado a lado, o Latent-X superou outras ferramentas avançadas de IA Generativa tanto em avaliações computacionais quanto validação laboratorial. Por que isso importa? Pode acelerar a descoberta de medicamentos, por exemplo. 🧬💊

🌍 IA Global

🇦🇪 Em busca de investimento Um memorando vazado de Dario Amodeido, CEO da Anthropic, revelou o plano da empresa para buscar investimentos dos Emirados Árabes Unidos e Catar, apesar das preocupações éticas relacionadas a regimes autoritários. Amodei reconhece que não vê isso com bons olhos, mas argumenta que evitar todos os “maus atores” é impraticável para os negócios. A decisão marca uma mudança na posição da Anthropic, que foi contra os investimentos da Arábia Saudita em 2024 por conta do receio associado ao autoritarismo.

🇺🇸 Próximo do centro político A OpenAI planeja abrir no início de 2026 seu primeiro escritório em Washington, DC (EUA), que será chamado de "The Workshop". O local servirá como um centro de engajamento político, onde serão oferecidos treinamentos e apresentados produtos para formuladores de políticas, educadores e organizações sem fins lucrativos. A iniciativa reflete a estratégia da OpenAI de influenciar nas regulamentações e abordar preocupações sobre o impacto econômico da IA.

🔢 IA em números


O SoftBank implantou o maior NVIDIA DGX SuperPOD do mundo, com mais de 4.000 GPUs NVIDIA Blackwell e 13,7 exaflops de poder computacional.

SuperPOD é um supercomputador de IA pré-configurado, projetado para cargas de trabalho de treinamento e inferência de IA na escala de data centers.

🛠️Ferramentas

  • Mexty usa IA para criar conteúdo educacional interativo e personalizado compatível com as principais plataformas de e-learning.

  • Model Playground AI compara lado lado imagens, vídeos e elementos 3D gerados por vários modelos de IA.

  • Vibechart transforma dados em gráficos ou diagramas visualmente vibrantes.

📚 Miscelânea

  • Relatório técnico detalha como os modelos de IA da Apple foram treinados, otimizados e avaliados. O documento inclui vários aspectos, entre eles arquitetura, fontes de dados, pré-treinamento, pós-treinamento, desenvolvimento do uso de ferramentas, otimizações e sistemas de benchmarking.

 AI_FLASH_NEWS

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊