Google avance dans son projet d'IA pour traduire ses services dans 1000 langues

Le campus Bay View de Google à Mountain View en Californie - NOAH BERGER / AFP
Plus polyglotte que jamais. Google a partagé mardi 7 mars ses premiers éléments de recherche pour la construction d'une intelligence artificielle, qui serait capable à terme de traduire dans 1000 langues ses services. Actuellement, ses services en ligne, comme Google Traduction, ne sont disponibles qu'en 130 langues - alors que plus de 7000 langues sont recensées dans le monde.
Ce projet d'intelligence artificielle, dévoilé pour la première fois en novembre dernier, a été baptisé "modèle universel de la parole" (pour universal speech model, en anglais). Sa particularité: être entraîné à la fois sur de l'oral et de l'écrit.
Le modèle a depuis été formé sur "12 millions d'heures de parole et 28 milliards de phrases écrites, qui couvrent plus de 300 langues", détaille Google dans un point d'étape partagé sur son blog dédié à ses projets de recherche. L'intelligence artificielle est notamment utilisée pour créer des légendes sur YouTube, la plateforme vidéo du groupe.
Des données difficiles à trouver
Le modèle peut déjà effectuer une reconnaissance automatique de la parole dans une centaine de langues - qu'elles soient très répandues, comme l'anglais ou le mandarin, ou qu'il s'agisse de dialectes. Pour certaines langues qui sont parlées par moins de vingt millions de personnes, la recherche des données nécessaires à l'entraînement de l'intelligence artificielle est "très difficile", souligne Google.
L'entreprise américaine se montre optimiste : "Notre processus d'apprentissage du modèle est efficace pour s'adapter à de nouvelles langues et à de nouvelles données."
En novembre dernier, Google avait déjà affirmé que le projet prendrait plusieurs années. Il sera progressivement déployé dans les différents services du géant de la tech, comme ses claviers numériques ou encore Google Traduction.