BFMTV
Société

Ce camion du CNRS fait le tour de la France pour enregistrer les différents accents et langues

Le laboratoire mobile du CNRS et du ministère de la Culture, déployé dans le cadre du projet "Écouter-parler", vise à "créer la plus large base de données sur les langues parlées en France".

C'est un camion blanc siglé de grandes lettres rouges qui composent les mots "Écouter-parler", le nom du projet du Centre national de la recherche scientifique (CNRS) et du ministère de la Culture qui vise à enregistrer toutes les langues et tous les accents de France.

Le véhicule et les scientifiques qu'il transporte commencent à sillonner les routes de l'Hexagone en cette fin septembre pour collecter les données langagières des habitants, rapporte RTL.

"Nous voulons dessiner un vaste portrait sonore de la France", explique Olivier Baude, professeur de sciences du langage à l’université Paris-Nanterre et responsable scientifique du projet, ajoutant qu'"Écouter-Parler est un dispositif atypique qui nous permet d’aller au contact des gens tout en restant reliés à nos plateformes technologiques".

Des usages scientifiques et industriels

Au cours des missions de prélèvement, les scientifiques vont inviter les personnes souhaitant participer à s'assoir dans le camion afin d'avoir une conversation. Ils seront enregistrés et les fichiers seront stockés dans les bases de données du CNRS.

Si le premier objectif est de documenter les pratiques langagières des Français à un instant T pour voir comment elles ont évolué et pour les comparer aux évolutions futures, des applications pratiques pour la vie quotidienne existent également.

Les bases de données seront également utilisées pour permettre d'entraîner les intelligences artificielles travaillant avec des voix, comme les assistant vocaux ou les traducteurs automatiques.

En réunissant plusieurs documents sonores enregistrés dans les langues présentes en France ainsi que certaines particularités langagières au sein même du français, les scientifiques veulent permettre aux machines de mieux comprendre les singularités de leurs interlocuteurs pour affiner et rendre plus pertinentes leurs réponses.

Une inspiration centenaire

Ce projet a été inspiré par un illustre prédécesseur, Ferdinand Brunot. En 1911, déjà en camion, le linguiste parcourt le Berry, le Limousin et les Ardennes afin de collecter des conversations. Nul usage pour les assistants vocaux à l'époque, mais une volonté, comme aujourd'hui, de réaliser ce que le scientifique appelle des "Archives de la parole".

Le projet dure trois ans et doit prendre fin lors du déclenchement de la Première Guerre mondiale. Mais les archives sont conservées et transférées à la Bibliothèque nationale de France. Elle finiront par être numérisées et sont aujourd'hui disponibles sur le site Gallica.

Par Glenn Gillet