2.500 pages: les secrets du moteur de recherche de Google ont fuité en ligne

Un secret bien gardé qui a fini par fuiter. Alors que deux experts en référencement ont révélé une fuite de 2.500 documents internes de Google lundi 27 mai, le géant américain a confirmé leur authenticité ce jeudi 30 mai.
Cette fuite a été révélée par deux experts en référencement, Rand Fishkin et Mike King, qui ont pu analyser les documents en question. Ces derniers détaillent les données que Google collecte, dont certaines peuvent être utilisées dans son algorithme de classement des résultats de recherche.
Google accusé d’avoir menti
Les documents révèlent notamment que l’entreprise recueille et utilise potentiellement des informations qui ne contribuent pas au classement des pages web sur son moteur de recherche, comme le nombre de clics ou les données des utilisateurs de Chrome.
Ils dévoilent également que Google prend en compte la "réputation" d’un site ou l’expertise des auteurs pour le référencement, mais aussi que la société privilégie des sites pour des sujets sensibles tels que les élections. Les deux experts assurent par ailleurs que certaines des informations contenues dans les documents contredisent des déclarations publiques des représentants de Google.
"Le mot "mentir" est un peu fort, mais c’est le seul mot exact à utiliser ici. Si je ne reproche pas nécessairement aux représentants publics de Google de protéger leurs informations confidentielles, je m’insurge contre leurs efforts visant à discréditer activement les personnes du monde du marketing, de la technologie et du journalisme qui ont présenté des découvertes reproductibles", a précisé Mike King.
"Des informations hors contexte, obsolètes ou incomplètes"
Confirmant la fuite, Google a mis en garde "contre des suppositions inexactes sur la recherche basées sur des informations hors contexte, obsolètes ou incomplètes".
"Nous avons partagé de nombreuses informations sur le fonctionnement de la recherche et les types de facteurs que nos systèmes prennent en compte, tout en nous efforçant de protéger l’intégrité de nos résultats contre les manipulations", a déclaré Davis Thompson, porte-parole de Google, au média américain The Verge.
Si les milliers de pages constituent un référentiel d’informations pour les employés de la société, il est impossible de savoir exactement quelles données détaillées sont réellement utilisées pour classer les contenus de recherche. Les informations collectées pourraient en effet ne pas être utilisées pour la recherche, mais strictement à des fins de formation par exemple. Elles pourraient aussi être obsolètes.
Le contenu des documents est assez technique et donc peu compréhensible pour le grand public. Ils seront surtout utiles aux spécialistes du référencement, qui pourront mieux comprendre le fonctionnement du moteur de recherche de Google. Ces informations pourraient provoquer des remous dans ce secteur, mais aussi dans celui du marketing. De nombreux sites sont en effet dépendants de l’entreprise et optimisent leurs contenus afin d’être bien classé par son algorithme.