• IA Express
  • Posts
  • O lado negro da IA: desvendando o impacto dos rastreadores da Web

O lado negro da IA: desvendando o impacto dos rastreadores da Web

Bem-vindos, humanos: Seu download diário com as principais notícias sobre Inteligência Artificial começa agora. Nesta edição, você vai conhecer rastreadores de IA que espreitam nas sombras da web, sugando dados como vampiros digitais. Do outro lado da luz, novas sinfonias compostas por IA provam que as máquinas não apenas imitam, mas também pensam sobre música.


Porém isso não é tudo no IA Express de hoje:
- Pegadinha de 1º de abril da NVIDIA se torna realidade
- Extensões de IA para Chrome levanta preocupações sobre violações de privacidade
- Sistema de tutoria baseado em IA aumenta notas de alunos

Porque, no mundo da Inteligência Artificial, conhecimento é seu algoritmo mais valioso.

 AI_NEWS_CIRCUIT

AI CRAWLERS

O lado negro da IA: desvendando o impacto dos rastreadores da Web

Você já ouviu falar em AI crawlers - ou rastreadores de IA, em bom português? São bots automatizados que coletam dados na Web para treinar modelos de IA. Parecem inofensivos? Nem tanto, pois estão sobrecarregando a Internet, drenando recursos e forçando o uso de contramedidas para contê-los.

O que você precisa saber?

  • Enquanto rastreadores tradicionais de mecanismos de busca coletam dados para indexar a Web, muitos desenvolvedores de modelos de IA usam os crawlers para sugar texto, imagens e muito mais de sites em todo o mundo.

  • Para se ter uma ideia, os AI crawlers geram mais de 50 bilhões de solicitações diárias somente na rede da Cloudflare, respondendo por quase 1% de todo o tráfego da Web.

  • De acordo com a DoubleVerify, a taxa de tráfego inválido geral (GIVT, na sigla em inglês) quase dobrou no segundo semestre de 2024 na relação ano a ano (86%). Um recorde de 16% do GIVT foi associado a IA crawlers como Googlebot, Meta AI Crawler, GPTBot e AppleBot.

  • Plataformas de código aberto, em particular, viram o tráfego de IA disparar, levando os custos dos servidores às alturas e degradando o desempenho para usuários reais.

  • Parece que os rastreadores não estão respeitando os arquivos robots.txt, conjunto de instruções detalhando quais páginas ou seções podem ser acessadas pelos AI crawlers.

Crédito: DoubleVerify

O primeiro grande desafio? Esses rastreadores podem sobrecarregar servidores com seu grande volume de solicitações diárias, consumindo largura de banda e reduzindo o tempo de resposta para visitantes humanos.

Como se não bastasse, os AI crawlers geram uma bagunça analítica. Quando inundam os sites, os bots distorcem informações sobre visitantes e dificultam a avaliação do interesse genuíno pelo conteúdo e o planejamento do próximo movimento por parte de seus donos.

O que tem sido feito? A invasão dos AI crawlers tem produzido algumas medidas drásticas como contramedida. Alguns desenvolvedores relatam que, como os bots de IA são geralmente originários de regiões ou intervalos de IP específicos, chegaram ao ponto de bloquear o acesso de países inteiros. 

A boa notícia é que há ferramentas e táticas menos radicais. Por exemplo, o AI Labyrinth, da Cloudflare usa conteúdo gerado por IA (que ironia!) para desacelerar, confundir e desperdiçar recursos dos AI crawlers e outros bots que não respeitam as diretivas de rastreamento.

MÚSICA

IA não só imita melodias, mas “pensa” sobre a música

O primeiro grande modelo de raciocínio musical lançado recentemente deve inaugurar uma nova era para a composição de canções baseada em Inteligência Artificial. O Mureka O1 (fusão de “Música” e "Eureka"), desenvolvido pela Skywork AI, promete redefinir o modo de compor, produzir e ter experiências com o universo sonoro.

Qual é a novidade? O Mureka O1 usa uma nova abordagem chamada MusiCoT (Music Chain-of-Thought) que estrutura previamente a canção antes de preencher os detalhes sonoros, resultando em composições mais coesas e, por que não dizer, emocionantes.

Crédito: Skywork AI

Como é capaz de fazer isso? Os algoritmos do Mureka O1 podem analisar padrões musicais, estilos e até mesmo emoções, o que lhe permite criar composições originais que agradem os ouvintes. De acordo com a Skywork AI, o Mureka O1 supera os modelos de última geração em áreas como precisão de pronúncia, coerência musical e qualidade geral da produção.

Com a API aberta do Mureka, os desenvolvedores podem integrar os recursos do modelo de IA em seus próprios projetos e pode ajudar a desencadear uma onda de aplicativos e experiências musicais orientados por IA.

Quer ter seu dia de compositor? Então tente transformar sua inspiração em uma canção de sucesso aqui.

AI_TRENDS

  • A Perplexity apresentou um novo recurso chamado "abas de resposta" que dá aos usuários a chance de filtrar os resultados da pesquisa por formatos específicos, como imagens, vídeos, empregos, opções de viagens e compras.

  • A Microsoft introduziu dois novos "agentes de raciocínio" no Microsoft 365 Copilot. O Researcher ajuda a lidar com pesquisas complexas e de várias etapas, enquanto o Analyst atua como um cientista de dados qualificado para ir de material bruto a insights em minutos.

  • A xAI integrou o Grok ao aplicativo Telegram. O recurso é gratuito para usuários Premium e permite interagir com chatbot @GrokAI dentro do aplicativo de mensagens.

  • A OpenAI anunciou que vai adotar o Model Context Protocol (MCP) de código aberto da Anthropic e assim permitir que seus produtos se integrem com dados e software externos.

AI_VENTURES

JOGOS

Projeto G-Assist: pegadinha de 1º de abril da NVIDIA se torna realidade

Tudo começou em 2017, quando a NVIDIA fez uma pegadinha de 1º de abril no então Twitter, apresentando o GeForce GTX G-Assist, um falso dispositivo USB que melhoraria as experiências com jogos usando Inteligência Artificial.

De volta para o futuro, em 2025, a Projeto G-Assist agora é real com uma versão experimental do Project G-Assist System Assistant para usuários da GeForce RTX em desktops, via NVIDIA app, e futuramente em laptops.

O que esse assistente faz? Esse é o companheiro de IA que todo dono da GeForce RTX não sabia que precisava. Ele está sempre pronto para atender pedidos de conselho (por voz ou texto) em tempo real sobre truques para otimizar o sistema - quer você esteja ajustando overclocks, configurações de hardware ou outros parâmetros importantes para desempenho, esse assistente vai simplificar sua vida.

Como funciona? O Project G-Assist usa um Small Language Model (SLM) ajustado para interpretar instruções e executar ações por meio de APIs da NVIDIA e de terceiros. É executado localmente, sem taxas de assinatura. Os principais recursos são diagnósticos em tempo real, otimização de desempenho, gráficos de métricas e controle de periféricos.

A NVIDIA incentiva o desenvolvimento de comunidades por meio um repositório GitHub com amostras de plugins que ampliem os recursos do G-Assist. Além disso, a estrutura do G-Assist estará acessível a ferramentas como CrewAI, Flowise e LangFlow para permitir a integração em fluxos de trabalho com uso de pouco ou nenhum código.

AI_GOVERNANCE & ETHICS

👁️ Big Help ou Big Brother?

Um estudo avaliou 10 extensões de IA para Chrome e descobriu que, com frequência, coletam e enviam dados dos usuários, levantando preocupações sobre violações de privacidade que potencialmente violam leis dos Estados Unidos. Outro alerta é para o nome das extensões: apesar do uso de termos familiares como ChatGPT e Copilot, muitas extensões não são afiliadas ao Google, Microsoft ou OpenAI.

🤐 Modelo chinês de censura

Um vazamento de dados contendo milhares de exemplos de texto revelou detalhes sobre um sistema de censura chinês alimentado por IA, conforme relatado pelo TechCrunch. Como funciona? Um LLM está sendo treinado para detectar e sinalizar automaticamente conteúdo considerado sensível pelo governo chinês, como assuntos sobre dissidência política, corrupção e Taiwan. Esse caso gera mais preocupações sobre privacidade e liberdade de expressão e destaca o papel crescente da tecnologia no controle de informações pelo Estado.

AI_SNAPSHOT

💡 Inovação & Inspiração

  • Futuro fashion A varejista de roupas H&M vai incorporar em campanhas de marketing "gêmeos digitais" gerados por IA a partir de modelos de passarela reais. As réplicas virtuais serão de propriedade e gerenciadas por elas próprias, permitindo que licenciem para a H&M ou outras marcas. A iniciativa pretende equilibrar inovação e empoderamento das modelos, embora levante questões sobre impacto nos empregos na indústria da moda, como fotógrafos e maquiadores. 👗

  • Chatbot nota 10 Uma escola do Texas registrou um aumento significativo nas notas dos alunos e colocou suas turmas entre as 2% melhores do país após implementar um novo sistema de tutoria baseado em IA. Os alunos interagem com um chatbot por duas horas diárias, que presta apoio educacional personalizado. 👩‍🏫

🌍 Global_AI

🇺🇸 Liminar não concedida A Anthropic obteve uma vitória judicial antecipada contra Universal Music Group (UMG), Concord e ABKCO. As empresas haviam solicitado uma liminar em um tribunal federal da Califórnia para impedir a Anthropic de usar letras de músicas protegidas por direitos autorais para treinar o chatbot de Claude. A juíza rejeitou o pedido, detalhando que era muito amplo e não conseguia provar "danos irreparáveis" gerados pela Anthropic.

🇺🇸 Lista negra O Departamento de Comércio dos Estados Unidos adicionou mais de 50 empresas chinesas de tecnologia à lista negra de exportação. A medida tem como objetivo restringir os avanços de Pequim em IA e sistemas computacionais avançados, citando preocupações com segurança nacional e política externa.

🔢 IA em números


É a projeção da receita da OpenAI para 2025. No entanto, a empresa soma despesas substanciais e não espera ter fluxo de caixa positivo até 2029, quando espera reportar mais de US$ 125 bilhões em receita.

🛠 Ferramentas

  • Ideogram 3.0 traz avanços nas áreas de fotorrealismo, criação de designs e estilos consistentes. Em avaliações humanas, afirma superar os concorrentes.

  • Consolex.ai é um espaço com LLMs e ferramentas para criar agentes de IA.

  • Bebop encontra leads e insights B2B para que você feche negócios mais rapidamente.

  • Cresh é ferramenta multiagente de pesquisa e análise que ajuda a aprimorar ideias de negócios.

📚 Mais recursos

  • Esse artigo explora como as pessoas percebem respostas geradas por humanos versus LLMs sob diferentes condições. Um experimento controlado mostrou que, em geral, os participantes preferiam resultados gerados por IA quando a fonte da resposta estava oculta. No entanto, quando a origem da IA era revelada, a preferência caía significativamente.

  • Sugestão de leitura: Empire of AI - Dreams and Nightmares in Sam Altman’s OpenAI, de Karen Hao, conta a história da ascensão da OpenAI, as ambições de seu líder e as profundas consequências da corrida armamentista da IA.

 AI_FLASH_NEWS

  • A OpenAI está considerando uma grande expansão de sua capacidade de armazenamento, com planos, inclusive, de construir seu próprio data center, segundo o site The Information. Essa medida marcaria uma grande mudança da empresa, que atualmente depende de provedores de nuvem externos para armazenar dados.

  • A startup Extropic tem uma nova abordagem para chips com a qual pretende desafiar o domínio da NVIDIA. Está desenvolvendo um processador que aproveita flutuações termodinâmicas - variações aleatórias em circuitos eletrônicos normalmente vistas como um problema - para executar cálculos probabilísticos altamente eficientes.

  • A Manus anunciou que realizará encontros presenciais em várias cidades do mundo nas próximas semanas para agradecer à comunidade e entender melhor as demandas dos usuários.

  • A FuriosaAI, startup sul-coreana de atua na área de chips para IA, rejeitou uma oferta de aquisição no valor de US$ 800 milhões feita pela Meta Platforms, demonstrando sua intenção de permanecer independente e competir com gigantes do setor como a NVIDIA.

Até a próxima

Obrigado por mergulhar nesta edição. Seu tempo é valioso, e estamos felizes por você ter escolhido passar alguns minutos aqui.

Voltaremos à sua caixa de entrada em breve. Até lá, cultive a curiosidade.😊