A Cloudflare, empresa de segurança de rede, fez graves acusações contra a startup de inteligência artificial Perplexity, afirmando que a companhia utilizou táticas enganosas para contornar o protocolo robots.txt e acessar dados de sites sem autorização. Essa prática, que infringe normas estabelecidas há décadas na internet, levantou ainda mais preocupações sobre as ações da Perplexity, já criticada por desrespeito à propriedade intelectual.
Acusações de Rastreadores Furtivos
O conflito começou a se intensificar após a Cloudflare receber diversas reclamações de clientes que implementaram medidas para proibir a coleta de dados em seus sites. Apesar dessas barreiras, a Perplexity continuou a acessar o conteúdo, levando a uma investigação aprofundada. Os pesquisadores descobriram que, quando o acesso era bloqueado, a Perplexity ativava um "bot furtivo" para driblar as restrições. Esse rastreador utilizava uma série de endereços de IP variados, permitindo que a empresa realizasse a coleta de dados sem ser detectada.
O Que é o Protocolo Robots.txt?
O robots.txt é um arquivo utilizado por sites para informar aos bots da web quais áreas do site não devem ser acessadas. Considerado um padrão da internet desde sua proposta em 1994, esse protocolo é respeitado por muitos mecanismos de busca. A violação dessa norma pelos rastreadores da Perplexity é vista como uma manobra antiética.
Reação da Cloudflare e Implicações
Diante das descobertas, a Cloudflare decidiu remover a Perplexity de sua lista de "bots verificados" e implementou novas regras de firewall para bloquear o acesso não autorizado. Essas medidas visam proteger o conteúdo da web e garantir que as regras em vigor sejam respeitadas por todas as empresas, especialmente aquelas que dependem de dados da internet para alimentar seus serviços de IA.
Outras Acusações Contra a Perplexity
Além da violação do protocolo robots.txt, a Perplexity também enfrenta outras acusações de práticas agressivas de coleta de dados. A empresa já foi apontada por desrespeito à propriedade intelectual, com acusações de plágio em relação a conteúdos de terceiros. Recentemente, a Forbes reportou que a Perplexity teria publicado artigos considerados plágios de reportagens exclusivas, aumentando as críticas sobre sua conduta.
Contexto Mais Amplo
Essas alegações não são isoladas, já que outros gigantes da tecnologia, como a Microsoft, também foram mencionados em discussões sobre a coleta de dados. O CEO do Reddit, Steve Huffman, destacou que empresas como Perplexity tratam o conteúdo da internet como gratuito e acessível, uma afirmação que agora ganha respaldo nas evidências apresentadas pela Cloudflare. A situação da Perplexity serve como um alerta sobre a necessidade de regulamentações mais rigorosas na coleta de dados e na proteção da propriedade intelectual online.

