Intelligence artificielle: comment les machines apprennent?

- - -
Emmanuel Macron doit dévoiler ce jeudi son plan pour faire de la France un leader en matière d’intelligence artificielle. Le machine learning, autrement dit la capacité d’apprentissage des machines, est au cœur des dernières avancées scientifiques. Pour cela, algorithmes et robots utilisent d’immenses bases de données, appelés "big data". Mais comment marche exactement cette technologie?
Avec ou sans assistance humaine
Le machine learning a déjà envahi de nombreux aspects de notre vie. Sans le savoir, vous avez déjà aidé un robot à apprendre. Les reCAPTCHA, inventés par l’entrepreneur Luis von Ahn, servaient à la fois aux sites web à vérifier que les formulaires étaient bien remplis par des humains, mais alimentaient en même temps une base de données géantes de numérisation de livres. L’algorithme utilisaient les exemples remplis par des humains pour retranscrire en texte des livres scannés en images.
Dans ce cas, on parle "d’apprentissage supervisé". L’ordinateur cherche à reproduire une compétence typiquement humaine (lire un texte, reconnaître un animal, comprendre une voix) et a besoin de notre assistance. Pour d’autres objectifs, les scientifiques préfèrent laisser les machines apprendre sans intervention humaine. C’est le cas des algorithmes de recommandations. En se basant sur des critères purement mathématiques, l’ordinateur n’est pas influencé par des biais humains, comme les stéréotypes de genre. Pour une intelligence artificielle, il n'y a pas de "films de fille".

Une méthode d'apprentissage inspirée des humains
A la manière des humains, la machine apprend de ses erreurs. Elle a parfois besoin qu’un être humain lui dise "non, ceci n’est pas un chien", mais peut également constater par elle-même l’échec d’une de ses prédictions. C’est ce qu’on appelle "l’apprentissage par renforcement", utilisé notamment par Tesla pour développer la conduite autonome.
Une voiture automatique prend plusieurs informations de son environnement: vitesse, distance avec le véhicule précédent, passage piétons… Grâce à cette représentation de la réalité à un instant T, elle va prendre une décision, comme s’arrêter ou accélérer. Si cette action entraîne une réaction négative, comme une collision, elle va enregistrer dans sa base de données ce stimuli négatif. Quand elle se retrouvera dans une situation similaire, elle se souviendra de cette mauvaise expérience et tentera autre chose.
Les tests réalisés sur route réelle par Tesla ou Uber permettent de nourrir cet historique de bonnes ou mauvaises décisions. L’apprentissage des machines demandent donc une immense capacité de stockage d’informations.