Reddit impõe bloqueio ao Internet Archive
O Reddit decidiu restringir o acesso de robôs do Internet Archive, em uma medida para proteger os dados de sua plataforma. A rede social alega que empresas de inteligência artificial estão utilizando a Wayback Machine para coletar informações sem consentimento.
Motivos por trás da decisão
A restrição resultou em uma limitação no arquivamento, permitindo que apenas a página inicial do Reddit seja acessada por meio da Wayback Machine. Os robôs agora estão impedidos de acessar posts, comentários e perfis de usuários, o que significa que informações detalhadas das interações da comunidade não estarão mais disponíveis. “O Internet Archive presta um serviço à web aberta, mas nós tomamos conhecimento de que, em alguns casos, empresas de IA violam as políticas de plataformas, incluindo a nossa, e raspam dados”, destacou um porta-voz do Reddit ao portal Verge.
Impactos para os usuários do Reddit
Com essa nova política, apenas será possível consultar quais eram as publicações mais populares em datas específicas, sem ter acesso a seus conteúdos. O diretor da Wayback Machine, Mark Graham, afirmou que a equipe tem um relacionamento de longa data com o Reddit e se compromete a continuar as discussões sobre o acesso.
Medidas da comunidade e histórico recente
Nos últimos anos, o Reddit tem estado no centro das atenções por suas medidas relacionadas à inteligência artificial. Em 2023, a empresa restringiu o acesso às suas APIs, alegando que estavam sendo usadas para raspar conteúdo. Essa decisão causou protestos na comunidade, especialmente após o impacto negativo em aplicativos independentes.
Integração e litígios com empresas de IA
A rede também estabeleceu acordos de licenciamento com grandes empresas como Google e OpenAI, que agora pagam para usar o conteúdo do Reddit em seus modelos de IA. No entanto, o Reddit processou a Anthropic por coletar dados de seus fóruns sem autorização, ressaltando sua postura rígida em defesa da privacidade dos usuários.
Resposta da Cloudflare e da Wikipédia
O debate sobre o acesso de robôs de IA à informação se expandiu para outras plataformas. A Cloudflare, que oferece serviços de otimização para sites, decidiu bloquear bots utilizados por empresas de IA para rastrear conteúdos, e moveu um processo contra a Perplexity por violar o protocolo robots.txt. Além disso, a Wikipédia também está considerando tomar medidas semelhantes, já que a raspagem de seus conteúdos tem resultado em lentidão e aumento de custos operacionais.
Com a crescente preocupação acerca da inteligência artificial na internet, ações como as do Reddit e outras plataformas destacam a necessidade de um equilíbrio entre acesso à informação e proteção de dados pessoais.