Vos vieux tweets permettent de connaître l’adresse de votre domicile

- - JOSH EDELSON AFP
En quelques minutes, il est possible de savoir où vit n’importe quel utilisateur de Twitter avec 90% de fiabilité, pour peu qu’il ait utilisé le réseau social entre 2009 et 2015. C’est ce qu’avancent des chercheurs américains, qui ont mis au point un logiciel capable de déterminer avec précision les habitudes de membres de Twitter à partir de données liées à leurs messages.
Dans un papier de recherche repéré par le site américain Wired, ils mettent en garde contre la multiplication des métadonnées, ces informations liées au contexte de chaque publication en ligne (heure de publication, emplacement de l’utilisateur etc.).
15 millions de messages étudiés
Entre 2009 et 2015, Twitter enregistrait les coordonnées GPS de chaque utilisateur qui acceptait de se géolocaliser. Ces informations très précises n’étaient pas visibles sur Twitter, mais disponibles pour tous les développeurs tiers utilisant la plateforme pour leurs applications. Quatre chercheurs de la Fondation pour la Recherche et la Technique (Grèce) et de l’Université de l’Illinois (Etats-Unis) ont extrait 15 millions de tweets, provenant de 87 000 utilisateurs différents.
Ils ont ensuite analysé les données en agrégeant les messages publiés aux mêmes emplacements par chaque internaute, selon les heures de la journée ou les jours de la semaine. Une analyse de laquelle a découlé - dans de nombreux cas - un emplacement largement utilisé pour tweeter en journée, durant la semaine, et un second emplacement utilisé le matin, le soir et le week-end. Autrement dit, le lieu de travail et le domicile.
Pour vérifier leur expérience, les chercheurs ont étudié manuellement le contenu des messages de 2000 personnes, qui figuraient parmi les 87 000 utilisateurs de l’échantillon. Des indications (comme des publications confirmant qu’ils se trouvaient à leur domicile) ont montré que le logiciel avait établi la bonne adresse dans 92,5% des cas. Le taux de réussite tombe à 55,6% pour définir un lieu de travail. Interrogé par Wired, l’un des chercheurs explique ce chiffre par la plus grande diversité des lieux où un individu peut passer sa journée (entreprise, école, etc.). En revanche, le logiciel a pu déterminer avec 80% de précision la visite régulière d’autres endroits, comme des hôpitaux, des lieux de culte, ou encore des clubs de strip-tease.
Les données toujours disponibles
“Nous avons admis en 2015 que nous aurions pu être plus transparents avec nos utilisateurs sur le sujet, mais nous avons toujours tenu à ce que le partage de sa position soit volontaire et que les utilisateurs puissent choisir ce qu’ils désirent partager”, se défend un employé de Twitter auprès de Wired. Sauf qu’à l’époque, rares étaient les utilisateurs informés de la collecte et du partage de leur position GPS.
Depuis 2015, Twitter ne collecte plus les coordonnées GPS et se contente d’enregistrer le nom d’un emplacement (une ville ou un point d’intérêt, comme un bar, une entreprise, ou un musée) lors du partage de la localisation d’un utilisateur. Un changement qui rend le logiciel mis au point par les chercheurs bien moins efficace: en étudiant les données de messages publiés après 2015, le taux de précision tombe à moins de 7%. Seul problème, les données GPS antérieures à cette date sont toujours à la disposition des développeurs. Il est possible de les supprimer en se rendant sur la page dédiée à la confidentialité du réseau social.