BFM Business
Vie numérique

Grand débat: des algorithmes pour trier les préoccupations des Français

Le Grand Débat National, et les contributions en ligne qu'il implique, se clôt le 15 mars.

Le Grand Débat National, et les contributions en ligne qu'il implique, se clôt le 15 mars. - PHILIPPE WOJAZER / POOL / AFP

Plus d’un million de contributions au grand débat national seront brassées de façon automatique par des algorithmes, pour rendre compte des idées les plus plébiscitées. L’initiative laisse craindre quelques biais d'analyse.

L’intelligence artificielle s'invite au cœur du grand débat national. Pour tirer au mieux les leçons des contributions apportées sur la plateforme granddebat.fr, le gouvernement s'en remettra à OpinionWay. L'institut de sondage sera chargé d'analyser les réponses fermées des internautes à des questionnaires en ligne. Pour les commentaires plus libres et verbatims, une société d'analyse sémantique sur le Web a été sollicitée.

Qwam, qui a pour habitude de travailler aux côtés d'OpinionWay, dispose d’un outil informatique qui lui permet de traiter des volumes massifs de texte en s’appuyant sur des algorithmes et de l’intelligence artificielle. A partir de propositions publiées en ligne, ce même outil aura vocation à trier, classer et sous-classer les thématiques abordées, du développement durable au pouvoir d'achat, pour faire remonter les idées saillantes et largement plébiscitées. 

Il s'agit-là d'une première en France, dans un cadre aussi vaste. OpinionWay et Qwam auront en effet du pain sur la planche. A l'heure actuelle, pas moins de 1.100.000 contributions ont été mises en ligne, selon des chiffres donnés ce 28 février par RMC. Mi-février, le collège des "garants" du grand débat avançait déjà un total de 900.000 contributions en ligne, par 210.000 personnes. Autant d'informations qui devront être traitées en un temps record: les contributions au grand débat seront closes le 18 mars, pour une restitution publique prévue moins de deux semaines plus tard. 

Un délai restreint d'analyse

Dans ces conditions, impossible de s'en remettre uniquement à un traitement manuel. L'équipe de Qwam ne prendra la main sur les données analysées qu'en cas de contributions jugées ambigües par les algorithmes. "Cela recouvre notamment les réponses qui n'ont rien à voir avec les questions posées, qui comprennent des disgressions ou ne correspondent pas à la thématique de départ", explique Christian Langevin, directeur général de Qwam. "De toute manière, une vérification manuelle est systématique pour vérifier la cohérence des résultats."

Le manque de détails sur le fonctionnement du logiciel de Qwam pourrait-il cacher des biais d'analyse ? "Cette opacité fait craindre que l'algorithme utilisé soit paramétré pour avantager telle ou telle idée, en refuser telle ou telle autre ou en minorer les effets", avance auprès de BFM Tech Thierry Vallat, avocat au barreau de Paris spécialisé dans les sujets numériques. "Sur le principe nos logiciels sont à même de lire toutes les contributions de manière exhaustive, en extrayant les thèmes principaux et les suggestions émises", affirme Christian Langevin. "Le défi principal, c'est le délai de rendu. Il est extrêmement court par rapport au volume de données à brasser."

L'autre faiblesse de la grande analyse en ligne lancée par le gouvernement tient non pas aux algorithmes utilisés mais à la plateforme grandebat.fr en elle-même. Sur cette dernière, aucune information n'est requise de la part des contributeurs lors de leur inscription, hormis un code postal. Il est ainsi possible de donner plusieurs avis successifs à partir d'une fausse adresse mail. Difficile dès lors de distinguer les vraies contributions de celles avancées de façon artificielle. "Nous sommes en mesure de repérer les copier-coller de personnes qui voudraient faire passer leurs idées en les soumettant à plusieurs reprises", note Christian Langevin. "Et cela représente un volume extrêmement faible de contributions, soit bien moins de 2% d'entre elles".

Pour s'assurer que l'analyse de données soit la plus fiable possible, quelques initiatives ont été lancées. Parmi elles, "la Grande Annotation", un site créé pour faire analyser les contributions du grand débat par de "petites mains" humaines. Les internautes peuvent s’y inscrire pour lire les propositions et les classer par thématique, avant de "faire émerger les idées les plus répandues". Par ailleurs, l'ensemble des données du site granddebat.fr seront accessibles en open data, une fois la consultation terminée. De quoi permettre à tout un chacun de s'y intéresser de près et d'en tirer ses propres conclusions.

https://twitter.com/Elsa_Trujillo_?s=09 Elsa Trujillo Journaliste BFM Tech