Tech&Co
Actualités

"Une pompe à fric": sur Google Discover, 20% des sites recommandés sont générés par IA

placeholder video
Dans une vaste enquête du média Next, il apparaît que de nombreuses recommandations visibles au sein de Google Discover sur du fait de sites entièrement générés par intelligence artificielle.

C'est un business très lucratif. Aujourd'hui, de nombreux internautes utilisent Google Discover (proposé par défaut sur les appareils Android) pour découvrir de nouvelles actualités. Pour les sites web qui réussissent à y référencer des articles, c'est la quasi assurance d'un trafic important.

Un élément qui provoque aujourd'hui un phénomène d'ampleur avec la multiplication de sites dont les articles sont générés par intelligence artificielle. Ils seraient même 20% à être régulièrement suggérés par l'algorithme de Discover, selon une étude dévoilée par Next.

En utilisant l'outil de surveillance du trafic GNewsalyzer, Next a en effet pu constater que près de 1.000 sites avaient été recommandés plus de dix fois sur Discover, et que 18% d'entre eux, à partir d'une base de données de 7.250 sites d'actualité, sont générés en partie ou complètement par IA.

Des fermes à clic aux contenus trompeurs

La technique est d'ailleurs toujours la même. Ces sites peuvent générer des milliers d'articles par jour dans l'espoir que plusieurs d'entre eux soient "capturés" par l'algorithme de Google. Des "fermes" à contenu qui utilisent en outre des techniques agressives de référencement, avec à la clef, de confortables revenus publicitaires.

Dans le podcast Clic, Clément Pesseaux, spécialisé dans l'édition de sites générés par IA, expliquait qu'un tel projet pouvait générer plusieurs dizaines de milliers d'euros par jour en fonction de son nombre de visiteurs - que Discover vient augmenter davantage.

Le problème n'est pas seulement qu'ils apparaissent dans Discover: nombre d'entre eux propagent aussi de fausses informations ou des articles tronqués afin de les rendre plus attrayant pour l'internaute. Interrogé par Le Parisien, partenaire de cette étude édifiante, le journaliste d'investigation Jean-Marc Manach estime que ces faux sites d'actualité sont gérés par un petit groupe d'autoentrepreneurs, dont l'un d'eux, Julien Jimenez, arrive à publier des milliers d'articles par jour "sans relecture, ni validation".

Dans les exemples cités par le quotidien, le site Decontair-67.fr, qui a été recommandé en une seule semaine au moins 325 fois par Discover, montre bien les abus en cours. On y voit des articles aux titres trompeurs ou volontairement exagérés, illustrés par des images là aussi générées par IA.

Le site decontair-67.fr généré par IA
Le site decontair-67.fr généré par IA © Capture Tech&Co

Google juge et partie ?

La faute, selon Jean-Marc Manach, au fonctionnement même de Discover. Contrairement à Apple News (qui n'est pas disponible en France) où les sites sont choisis par des humains, assurant donc une certaine qualité éditoriale, Google ne cherche plus à proposer un mixe entre la pertinenance et la qualité: "Il analyse uniquement les interactions des internautes avec le titre, la photo et le site web."

Pour les médias légitimes, cette étude est l'occasion de jeter un pavé dans la mare sur la dépendance à Google. Dans une étude de l'Alliance de la presse d'information générale de mars 2025, 70% des clics depuis Google provenaient de Discover.

L'étude explique néanmoins que Google semble s'en apercevoir a posteriori. Certains des sites cités dans l'enquête ont ainsi disparu des recommandations. Mais d'autres continuent de proliférer pour tromper les filtres antispam de l'entreprise. Reste à savoir si le problème peut être réglé alors que Google est, dans cette affaire, impliqué à très haut niveau: plus d'interaction, même vers des sites de piètre qualité, c'est aussi plus de revenus et de données collectées pour l'entreprise américaine.

Interrogé par Le Parisien, Google se défend et explique nettoyer régulièrement les flux Discover via un système antispam. Mais il admet également ne pas pour autant blacklister les sites IA qui doivent néanmoins se conformer à un règlement sur les contenus interdits ou trompeurs. Un règlement qui ne semble pas très efficace.

Sylvain Trinel