• IA Express
  • Posts
  • Superassistente: como OpenAI quer redefinir a interação com IA

Superassistente: como OpenAI quer redefinir a interação com IA

Bem-vindos, humanos: Seu download com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai saberá um pouco mais sobre a estratégia da OpenAI que quer transformar o ChatGPT em um superassistente de IA. De outro lado, a Microsoft embarca no mundo da geração de vídeos curtos, com o novo Bing Video Creator, acessível gratuitamente. 🎥🆓

Porém isso não é tudo no IA Express de hoje:
- Gemini agora resume e-mails longos no Gmail (por default!)
- Populações de LLMs podem estabelecer normas compartilhadas
- Índia supera marca de 34.000 GPUs na infraestrutura de IA nacional
- Ferramenta cria vídeos de produtos com links clicáveis (shoppable videos)

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

 AI_NEWS_CIRCUIT

ESTRATÉGIA

Superassistente: como OpenAI quer redefinir a interação com IA

A OpenAI planeja redefinir o modo como interagimos com Inteligência Artificial e, para isso, vai transformar o ChatGPT em um superassistente de IA que servirá como interface integral com a Internet.

Esse plano estratégico da OpenAI está descrito em um documento interno intitulado “ChatGPT: H1 2025 Strategy”, revelado não à toa durante o julgamento antitruste do rival Google que acontece nos Estados Unidos. O material foi divulgado pelo site The Verge e cobre os primeiro e segundo semestres de 2025.

O documento descreve que a OpenAI pretende fazer do ChatGPT um chatbot inteligente com “habilidades em formato de T”, com amplos recursos para realizar tarefas diárias, como administrar agendas e planejar férias, e profundo conhecimento para uso profissional em áreas específicas, como programação. Quem executará tudo isso? Os modelos o3 e o4, que são capazes de executar tarefas como “agentes”, com capacidade de raciocínio, de tomar decisões e de interagir com sistemas externos.

Quem são os principais concorrentes nessa estratégia? No documento, a OpenAI reconhece o desafio de ter de competir com gigantes estabelecidos que também estão promovendo seus próprios assistentes de IA. No entanto, acredita que tem uma vantagem competitiva com sua base de usuários em rápido crescimento e por não depender de anúncios. Isso lhe dá flexibilidade para priorizar as demandas dos usuários em detrimento de interesses comerciais, ao contrário de muitos concorrentes.

Para buscar uma concorrência justa, a OpenAI pretende defender regulamentações que deem aos usuários a opção de definir o ChatGPT como assistente de IA padrão em várias plataformas. O mesmo vale para mecanismos de busca, ou seja, a OpenAI também apoia a liberdade de escolha para além do Google como ferramenta de pesquisa usada pelos assistentes de IA, entre eles o ChatGPT.

Embora o documento não mencione claramente, hardware também deverá fazer parte do futuro do ChatGPT. A ideia é transformá-lo em mais do que apenas uma ferramenta de software, mas também um companheiro tangível. Outro indício desse possível caminho estratégico é a recente transação histórica da OpenAI, envolvendo Jony Ive, ex-chefe de design da Apple, quem sabe, para desenvolver justamente nova geração de dispositivos alimentados por superassistentes de IA.

AI_TRENDS

  • O assistente Gemini do Google agora resumirá automaticamente e-mails longos no Gmail, a menos que você opte por desabilitá-lo. O recurso está disponível apenas para e-mails em inglês por enquanto.

  • FLUX.1 Kontext trabalha com entradas de texto e imagens para gerar novas renderizações coerentes em contexto. Veja demonstrações aqui.

  • HunyuanVideo-Avatar é um modelo de IA de código aberto que transforma imagens estáticas em vídeos curtos com áudio.

  • O novo Kling 2.1 pode gerar vídeos de até dois minutos em resolução de 1080p e pode ser um forte concorrente do modelo Veo 3 do Google.

  • Reemble AI abriu o código do modelo Chatterbox para clonagem de voz e afirma ter superado a solução equivalente da ElevenLabs.

  • Conversational AI 2.0 da ElevenLabs traz agentes de voz mais sofisticados e capazes de manter fluxos de interação mais naturais.

  • Anthropic liberou a ferramenta que rastreia os “pensamentos” dos grandes modelos de linguagem (LLMs) e revela parcialmente os passos dados pelos modelo até produzir as saídas.

  • Estudo recente revelou que o GPT-4o da OpenAI exibe de forma consistentes comportamentos semelhantes à dissonância cognitiva humana. 😲😲😲

AI_VENTURES

MICROSOFT

Bing agora gera vídeos gratuitamente

Transformar palavras em um vídeo curto vibrante é o que o novo Bing Video Creator da Microsoft promete fazer com a ajuda do modelo Sora da OpenAI. A ferramenta é gratuita e está disponível no aplicativo móvel do Bing (Android e iOS) e em breve terá uma versão para desktop.

Como usar? Para criar um vídeo vertical de cinco segundos no formato 9:16, basta abrir o aplicativo Bing e, no menu no canto inferior direito, selecionar Video Creator. Outra opção é digitar diretamente na barra de pesquisa do aplicativo móvel do Bing algo como "Criar um vídeo de...".

E, quando o Bing Video Creator estiver disponível na para desktops, você poderá usá-lo no endereço Bing.com/create. Futuramente, também será possível criar vídeos no formato 16:9. As produções ficarão armazenadas por até 90 dias.

Por que isso importa? Essa é a primeira vez que o modelos Sora, anteriormente exclusivo dos assinantes da versão paga do ChatGPT, está disponível de forma gratuita.

AI_GOVERNANCE & ETHICS

📘De volta ao passado nas faculdades

Os chamados blue books (livros azuis) estão de volta nas faculdades dos Estados Unidos como método para evitar a trapaça facilitada por ferramentas de IA como o ChatGPT. Blue books são livretos com páginas grampeadas e uma capa azul usadas por alunos da faculdade, pós-graduação e mesmo ensino médio para responder perguntas de provas presenciais. O ressurgimento desses livros é uma resposta direta ao aumento das artimanhas dos alunos que têm usado IA Generativa em tarefas que vão desde escrever ensaios até gerar código de programação. Ao exigir que os alunos escrevam respostas à mão sob supervisão, espera-se reduzir as chances de interferência da IA nas provas.

📝IA simulada

Enquanto isso, na China, autoridades estão intensificando esforços para combater golpes direcionados ao Exame Nacional de Ingresso no Ensino Superior, conhecido como gaokao, particularmente aqueles que afirmam falsamente que a Inteligência Artificial pode prever as perguntas dos exames. Houve um aumento nas vendas online de simulados, alegando falsamente que a IA foi usada nesses materiais para tornar a previsão das questões mais apurada. Tais simulados estão sendo vendidos a preços inflacionados na Internet.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Interação em população de LLMs Pesquisadores revelaram que populações de LLMs (Llama-2, Llama-3, Llama-3.1 e Claude-3.5-Sonnet) podem estabelecer normas compartilhadas sem programação explícita - algo como acontece com a vida social humana, com gírias, saudações ou normas linguísticas. O fato revela tanto o potencial quanto os desafios da coordenação social impulsionada pela IA. O risco são os vieses que podem surgir dessa interação descentralizada, fenômeno não facilmente detectado por estudos de comportamento individual dos LLMs. Por isso, a pesquisa destaca a necessidade de estudar o comportamento coletivo dos modelos de IA para identificar vieses, garantir o alinhamento com valores éticos e reduzir as chances de manipulação. 👩‍👩‍👧‍👦

  • Raciocínio longo O QwenLong-L1 do Alibaba Group é uma nova estrutura que aprimora a capacidade dos grandes modelos de raciocínio (LRMs) de processar e raciocinar a partir de entradas textuais excepcionalmente longas, como relatórios empresariais detalhados, demonstrações financeiras extensas ou contratos jurídicos complexos - um importante desafio na área de IA. O QwenLong-L1 facilita a transição de LRMs com proficiência em contextos curtos para uma generalização robusta de contexto longo. 📝📈📊

🌍 IA Global

🇩🇰 Efeitos mínimos Pesquisa na Dinamarca avaliou os efeitos dos chatbots no mercado de trabalho, cobrindo 11 ocupações e 25.000 trabalhadores no país. Ainda que a maioria dos empregadores tenha incentivado o uso dos assistentes de IA, que se tornou habitual, os impactos permaneceram mínimos, em termos de horas trabalhadas, níveis salariais e retenção de funcionários. O estudo afirma que esses resultados desafiam narrativas que falam de transformação do mercado de trabalho gerada pela IA Generativa.

🇮🇳  Capacidade extra A Índia superou a marca de 34.000 GPUs em sua infraestrutura de IA nacional, fato que ajuda a fortalecer a posição do país como importante competidor global no setor. Essa capacidade extra estabelecerá uma plataforma computacional comum para treinamento e inferência de IA, crucial para desenvolver modelos e soluções de IA adaptados ao contexto indiano.

📢 IA em uma frase


“No início da IA, temia porque as máquinas estavam se tornando mais humanas; mas agora são os humanos que estão parecendo mais com máquinas.”

A frase é de Sari Azout, visionária e investidora, nos desafiando a repensar nosso relacionamento com a IA.
Sari destaca que o verdadeiro desafio com a IA não é técnico, mas filosófico e psicológico e nos encoraja a abraçar
o potencial da IA para explorar nossa criatividade.

 AI_TOOLKIT

🛠️Ferramentas

  • Ai-coustics melhora a qualidade do áudio para sistemas e hardware usando IA.

  • Podgen transforma qualquer conteúdo em podcasts profissionais.

  • Reelup usa IA para criar vídeos curtos e dinâmicos, exibindo produtos com links clicáveis para facilitar a compra em tempo real (shoppable videos). 🎥🛒

📚 Miscelânea 

  • O Google LMEval é uma estrutura de código aberto que simplifica e padroniza a avaliação de grandes modelos de linguagem (LLMs) e multimodais (que trabalham com vários tipo de dados, não apenas texto). A ferramenta compara modelos de diferentes empresas usando um processo unificado.

  • Sugestão de leitura: The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future é uma biografia escrita por Keach Hagey, repórter do Wall Street Journal, que explora a visão política, a capacidade de negociação e o talento de Altman para captação de recursos, sugerindo que ele é perfeitamente adequado para o atual cenário da IA.

 AI_FLASH_NEWS

  • Elad Gil, conhecido investidor em startups de IA, revelou seu próximo foco: rollups - adquirir negócios maduros, mas que fazem uso intensivo de mão de obra, e usar a IA para automatizar tarefas e otimizar operações.

  • Meta fechou uma parceria com a empresa de defesa Anduril, de seu ex-diretor de Realidade Virtual, para desenvolver produtos de Realidade Estendida (XR) com IA para o exército dos Estados Unidos.

  • Gigantes da música podem estar em negociação com Udio e Suno, provedores de ferramentas de IA para criar música, com a finalidade de resolver a pendenga relacionada com licenciamento.

  • Zochi, “cientista artificial" da Intology, tornou-se o primeiro sistema de IA a ter um paper, produzido de forma totalmente autônoma, aceito pela ACL, conferência da área de processamento de linguagem natural.

  • Business Insider destaca que uma importante métrica para acompanhar o crescimento da NVIDIA são os tokens, unidades de entrada e saída dos modelos de IA, que influenciam diretamente as vendas de chips da NVIDIA.

  • Febraban Tech 2025 discutirá o impacto dos agentes de IA no ambiente de trabalho. avanços e desafios no desenvolvimento de uma IA ética. Evento acontece no dia 10 de junho no auditório da instituição. 

  • Google corrigiu um bug que levava o AI Oveviews a declarar que estamos em 2024 quando perguntado se o ano era 2025. 🤭🤭🤭

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊