- IA Express
- Posts
- Como modelos de IA se equiparam à capacidade humana
Como modelos de IA se equiparam à capacidade humana
Bem-vindos, humanos: Seu download diário com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai conhecer o novo benchmark que compara a IA com o poder cerebral humano e saber como uma nova abordagem e uma troca engenhosa de chips ajudaram a reduzir os custos de treinamento da IA. 👨🏫
Porém isso não é tudo no IA Express de hoje:
- Novos modelos de áudio da OpenAI fazem transcrição e síntese de voz
- IA ajuda a prever a próxima chuva em minutos
- Filme sueco utiliza inteligência artificial para fazer dublagem visual
- Microsoft quer recompensar quem contribui com dados para treinamento de IA
Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.
AI_NEWS_CIRCUIT
BENCHMARKING
Como modelos de IA se equiparam à capacidade humana
Uma nova métrica para quantificar o desempenho da IA em relação à capacidade humana foi proposta pela METR, instituição dedicada a pesquisar, desenvolver e fazer avaliações de sistemas de IA.
O objetivo? Apresentar uma compreensão mais clara do tempo de conclusão de tarefas por sistemas de AI, particularmente em cenários complexos. Mais do que um benchmarking, a métrica também forneceu uma previsão surpreendente: dentro de uma década, a inteligência artificial poderá lidar de forma independente com tarefas de software que hoje levam dias ou semanas para serem finalizadas por humanos.

Crédito: METR
O que você precisa saber:
O estudo mostrou que essa métrica tem aumentado exponencialmente de forma consistente nos últimos seis anos, duplicando a cada 7 meses.
A abordagem da METR usa uma medida mais prática e holística: quanto tempo uma tarefa leva para ser executada por um profissional versus um agente de IA com, pelo menos, 50% de confiabilidade.
Em 2019, os primeiros modelos tinham dificuldade com tarefas que, em contrapartida, levavam mais de um minuto para serem executadas por humanos. Em 2025, os atuais modelos são capazes de lidar de forma confiável com tarefas que levariam quase uma hora para serem realizadas por especialistas humanos, de acordo com os dados do estudo.
A METR argumenta que se concentrar no tamanho da tarefa gera uma medida mais intuitiva e preditiva do potencial da IA no mundo real.
Por que isso importa? O novo benchmarking também auxilia em previsões. Ao rastrear como o horizonte de tempo da IA cresce, é possível antecipar quando os sistemas atingirão limites críticos - digamos, automatizando um dia de trabalho completo ou um projeto de um mês, desencadeando mudanças sociais relevantes. Esse tipo de previsão é fundamental para gerenciar riscos e aproveitar oportunidades.
MENOS TREINAMENTO
Receita chinesa para reduzir custos de treinamento em 20%
O Ant Group, apoiado por Jack Ma, magnata chinês fundador do Alibaba, afirma ter reduzido os custos de treinamento de IA em 20% usando chips chineses de fabricantes locais, como Huawei e Alibaba Group, para treinar seus modelos de IA.
![]() Imagem meramente ilustrativa |
|
Por que isso importa? Para a China, é um passo em direção à autossuficiência em um campo dominado por gigantes da tecnologia ocidentais, ao contornar principalmente as sanções dos Estados Unidos que limitam o acesso a semicondutores avançados, como os da NVIDIA.
Além disso, a redução de custos de treinamento pode democratizar o desenvolvimento da IA, permitindo que mais empresas possam competir sem dispor de orçamentos bilionários. Globalmente, isso intensifica a rivalidade tecnológica entre Estados Unidos e China ao pressionar ambos os lados a acelerar a inovação.
Para empresas e pesquisadores, o sucesso do Ant Group com o MoE e chips locais pode inspirar uma reformulação das estratégias de IA que priorizar eficiência em vez do poder computacional bruto.
O Ant Group continua usando chips da NVIDIA em algumas ações de desenvolvimento, mas está cada vez mais migrando para alternativas, como AMD e fornecedores chineses.
AI_TRENDS
A Perplexity não está satisfeita em ser apenas mais um mecanismo de busca mais inteligente. De acordo com a Bloomberg, o CEO Aravind Srinivas está apostando em uma abordagem diferente: explorar a IA para fornecer respostas concisas, precisas e abertas ao diálogo. Além disso, está expandindo seus horizontes com novos produtos para ajudar empresas a agilizar as pesquisas e a tomada de decisões.
O modelo Claude da Anthropic agora é capaz de pesquisar a web em tempo real para fornecer respostas mais atualizadas e relevantes, com citações diretas para que o usuário verifique facilmente os fatos nas fontes da informação.
A Canopy Labs afirmou que sua nova família Orpheus de modelos de voz supera os benchmarks para tecnologias de conversão de texto em fala.
De outro lado, a OpenAI anunciou um conjunto de modelos de áudio para aprimorar recursos de transcrição e síntese de voz para desenvolvedores. Os novos gpt-4o-transcribe e gpt-4o-mini-transcribe, ideais para aplicações como call centers e transcrição de reuniões, estão disponíveis via API.
A LG AI Research apresentou o Exaone Deep, primeiro modelo de IA de código aberto da Coreia do Sul projetado para oferecer raciocínio avançado e capacidade para resolução de problemas.
AI_VENTURES
PREVISÃO DO TEMPO
Novo modelo de IA prevê a próxima chuva em minutos
Um novo modelo climático totalmente orientado por IA promete não apenas dizer se pode chover, mas fazer previsões em minutos em um humilde computador.
O que é inovador? Por décadas, a previsão do tempo dependeu de supercomputadores processando equações matemáticas e devorando terabytes de dados de observações de satélites, estações meteorológicas e sensores para fazer a previsões. O novo modelo Aardvark Weather desenvolvido pela Universidade de Cambridge foi treinado com um conjunto dados meteorológicos históricos e observações em tempo real usando aprendizado de máquina.
![]() Imagem meramente ilustrativa | Os resultados? Previsões que se igualam ou superam modelos tradicionais em precisão, entre eles o Sistema de Previsão Global (GFS) dos Estados Unidos, com respostas entregues dezenas de vezes mais rápido e usando milhares de vezes menos poder computacional. Localmente, é uma potência. É claro que peca em alguns detalhes finos em intervalos maiores, uma peculiaridade de modelos baseados em dados, mas é um pequeno preço para tamanha agilidade. |
No entanto, a IA não é perfeita. Ao contrário dos modelos baseados em física, que podem ser rastreados, sistemas de IA são "caixas pretas" - aprendem, preveem, mas nem sempre explicam como.
Por que isso importa? A eficiência do Aardvark não apenas acelera o processo de previsão, mas também o torna mais acessível para várias aplicações, como agricultura na tomada de decisões sobre plantio e colheita e a indústria da aviação com melhores medidas de segurança dos voos.
O novo modelo também permite atualizações em tempo real, que são cruciais durante eventos climáticos severos. Além disso, o Aardvark Weather não é o fim do jogo; é o tiro de largada. Como os pesquisadores destacam, acrescentar mais fontes de dados, resoluções mais altas e previsões sazonais é o próximo passo.
AI_GOVERNANCE & ETHICS
💬 Comentários gerados por IA
O Instagram está explorando um novo recurso que permite gerar comentários usando o Meta AI, levantando questões sobre autenticidade e engajamento em interações em mídias sociais. Como funciona? Atualmente em testes, a ferramenta fornece aos usuários sugestões de comentários geradas por IA. Um ícone de lápis aparece ao lado do campo do comentário que, quando acionado, apresenta três opções personalizadas com base no conteúdo da foto.
😔 Ecos emocionais do ChatGPT
Estudos complementares do MIT Media Lab e da OpenAI analisaram milhões de interações com ChatGPT para identificar padrões de envolvimento emocional. As principais descobertas revelaram uma correlação entre uso mais intenso e aumento da solidão e dependência. A pesquisa busca estabelecer bases para compreensão dos efeitos psicossociais da IA e garantir interações seguras e saudáveis. Os estudos são preliminares e alertam contra generalização excessiva devido à complexidade e a limitações.
AI_SNAPSHOT
💡 Inovação & Inspiração
Para avessos a legendas O filme de ficção científica sueco Watch the Skies a ser lançado nos Estados Unidos utiliza IA para fazer "dublagem visual", ou seja, transformar o diálogo original parecer ter sido feito em inglês. A novidade, proporcionada pela tecnologia TrueSync da Flawless AI, ajuda a ampliar o apelo de filmes estrangeiros ao eliminar barreiras linguísticas e atingir públicos aversos a legendas. 🎬
Relógio mais inteligente A Apple está planejando integrar recursos de IA e câmeras em sua linha de smartwatches com o objetivo de transformar o Apple Watch em um dispositivo versátil e inteligente. Os planos devem se tornar realidade em 2027. 🍎
🌍 Global_AI
🇰🇵 Ataques cibernéticos A Coreia do Norte lançou uma unidade especializada em ataques cibernéticos baseados em IA. Ferramentas de IA para uso em hacking nas mãos de um estado conhecido por ações de ataques digitais e ciberespionagem levantam mais preocupações com potenciais ameaças à segurança global.
🇮🇳 Crescimento na Índia Para superar desafios e se expandir na Índia mantendo seu modelo de assinatura, a OpenAI está em negociações com a Reliance Jio para distribuir o ChatGPT. Também está considerando oferecer modelos de IA para empresas indianas por meio de uma API hospedada localmente, cumprindo as leis de localização de dados.
📢 IA em uma frase
“Sam Altman provavelmente não está dormindo bem.” | Kai-Fu Lee, fundador da 01.AI, comentando sobre o cenário competitivo na indústria de IA, com a ascensão dos modelos de código aberto que fazem frente às solução da OpenAI dirigida por Altman. |
🛠 Ferramentas
Bolt3D do Google Research e DeepMind gera cenas 3D detalhadas a partir de imagens 2D.
Nova API da xAI gera imagens usando o modelo grok-2-image-1212.
Slides Orator criar avatares que apresentam slides em tempo real.
Pikaframes transforma fotos em vídeos com transições especiais.
📚 Mais recursos
Conversa com Dwarkesh Patel, apresentador do podcast Dwarkesh e uma das pessoas mais influentes no campo da IA em 2024 segundo a TIME.
Nessa entrevista de Ben Thompson da Stratechery, Sam Altman, CEO da OpenAI, fala sobre a transformação da OpenAI em uma empresa de tecnologia de consumo, amplamente impulsionada pelo sucesso do ChatGPT.
AI_FLASH_NEWS
A NVIDIA adquiriu a Gretel Labs, startup da área de dados sintéticos, para reforçar as capacidades de IA Generativa da empresa e abordar questões relacionadas à privacidade e escassez de dados. A tecnologia da Gretel vai aprimorar as ofertas da NVIDIA para desenvolvedores.
A OpenAI deve começar a testar um novo recurso conhecido como ChatGPT Connectores que vai integrar o chatbot da OpenAI a aplicativos populares, como Google Drive e Slack, segundo o site TechCrunch.
A Microsoft está explorando um método para recompensar quem contribui com dados para treinamento de IA.
A Oracle anunciou o Oracle AI Agent Studio para Fusion Applications, plataforma para criar, estender, implementar e gerenciar agentes de IA.
O Hugging Face publicou uma resposta ao plano de ação da Casa Branca para IA, que defende sistemas de código aberto para impulsionar a inovação em relação aos modelos de IA comerciais.
Até a próxima
Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.
Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊

