Perplexity continue de collecter des données même sans autorisation (et en se cachant)

Le géant des infrastructures et de la sécurité Cloudfare tire la sonnette d'alarme et accuse la startup Perplexity de ne pas respecter les règles. Pire encore, elle utiliserait des contournements afin de continuer à "crowler" ("moissonner") des données sur des sites qui ont pourtant mis en place des blocages contre les IA génératives.
Pour ce faire, son robot collectant des données ferait en sorte de ne pas prendre en compte le fichier robot.txt présent sur certains sites. Celui-ci permet de donner des instructions aux robots du web, comme ceux de Google pour son moteur de recherche, afin qu'ils ne viennent pas sur une page en particulier. C'est principalement le cas sur des sites proposant des accès payants mais on trouve aussi ce fichier sur Wikipedia.
Un déguisement pour mieux piller le web
Si ce n'était que ça, les affirmations de Cloudfare ne feraient pas grand bruit. Mais l'entreprise va plus loin et révèle les manipulations de Perplexity pour ne pas que cela se voit aux yeux du web. Concrètement, Perplexity se "déguiserait" en humain, dans le but de ne pas se faire repérer. Elle utilise pour ce faire un user-agent sur Chrome (qui permet d'afficher un site web selon certains critères, par exemple comme un smartphone), tout en changeant d'adresse IP régulièrement pour éviter les blocages.
Une accusation grave, qui vient entraver la confiance tacite sur le web, mais que Perplexity réfute. La startup explique que son système fonctionne à la demande de l'utilisateur. Seul ce dernier peut faire en sorte qu'une "moisson" n'ait lieu, y compris sur un site non autorisé. Elle explique en outre que Cloudfare aurait de son côté accusé l'entreprise sans fondement réel, lui attribuant des prétendus vols sans que ce ne soit le cas dans la réalité. La défense de Perplexity est néanmoins bancale, d'autant plus quand on sait que la startup a déjà été accusée d'un peu trop recopier les sites webs sur lesquels elle se source afin de générer des réponses.
Cette affaire tombe au plus mal alors que des rumeurs insistantes laissent entendre qu'Apple pourrait s'offrir Perplexity pour muscler son jeu dans l'intelligence artificielle. Seulement voilà : l'entreprise derrière l'iPhone a jusqu'ici mis en avant une IA "saine" et "éthique" qui met la vie privée sur un piédestal. Les méthodes de moissonnage de Perplexity, si elles se confirment, sont donc à rebours de celle de son potentiel acquéreur.