BFM Tech

Une machine vient de battre le meilleur joueur mondial au jeu de Go

L'intelligence artificielle AlphaGo a battu le champion d'Europe de jeu de Go au mois d'octobre 2015.

L'intelligence artificielle AlphaGo a battu le champion d'Europe de jeu de Go au mois d'octobre 2015. - Deep Mind

Le programme AlphaGo, créé par une start-up de Google, a battu le champion du monde de jeu de Go Lee Sedol à deux reprises. Le troisième match a lieu aujourd'hui.

Après trois heures et demie d'un match acharné, le champion du monde du jeu de Go, Lee Sedol, a jeté l'éponge face au programme informatique AlphaGo de Google. Cet évènement marque un grand pas dans le domaine de l'intelligence artificielle, même si la partie s'est révélée très serrée entre les deux adversaires.

Lee Sedol a abandonné car, malgré une position favorable, il n'était pas en mesure de remporter la partie. Le champion a joué de façon très agressive mais l'intelligence artificielle a répliqué avec le même niveau de combativité. Le match s'est joué dans les dix dernières minutes avec un écart de points particulièrement faible.

"J'ai été très surpris. Je ne m'attendais pas à perdre, je ne m'attendais pas à ce que l'ordinateur joue de manière si parfaite" a indiqué Sedol après le match, selon The Verge. "Je ne regrette pas avoir accepté ce challenge. Je suis choqué, je l'admets, mais ce qui est fait est fait. J'ai apprécié ce match et attends avec impatience le prochain. Je pense que j'ai mal joué durant l'ouverture. Si j'améliore ce point, j'ai plus de chances de gagner."

Ci-dessous, la rediffusion intégrale de ce match historique :

Il y a encore quelques semaines, le Coréen de 32 ans assurait pouvoir triompher facilement du programme. Mais à la veille du combat, il s'était montré moins présomptueux lors d'une conférence de presse à Séoul. "Je crois que je ne pourrai peut-être pas vaincre AlphaGo avec une marge aussi importante que 5-0. Je dois être un peu plus stressé", avait-il tempéré.

Google à la manoeuvre

Le Go est un jeu millénaire chinois plus complexe que les échecs en raison de la multitude de ses combinaisons. Aucun joueur professionnel n'avait jamais été battu par une machine. Jusqu'à ce que l'on apprenne qu'AlphaGo, un programme développé par la start-up Deep Mind qui appartient à Google, avait écrasé le champion européen Fan Hui en octobre 2015. La révélation de ce résultat à l’occasion de la parution d’un article scientifique dans Nature au mois de janvier dernier avait abasourdi la communauté scientifique.

"On ne pensait pas cet exploit possible avant une dizaine d’années", avait alors déclaré DeepMind, sans fausse modestie, dans un communiqué officiel. Une pierre jetée dans le jardin de Facebook dont le labo de recherches en intelligence artificielle dirigé par Yann Le Cun a échoué sur le même sujet.

Lee Sedol, le champion du monde de jeu de Go.
Lee Sedol, le champion du monde de jeu de Go. © JUNG YEON-JE / AFP

L’enjeu de la première rencontre entre l'homme et la machine était énorme. Car le Go est le dernier jeu à information complète - tous les joueurs disposent à tout moment des mêmes informations pour effectuer leurs choix - dont le champion n’a pas encore été battu par une machine. L’événement se situe donc à la hauteur de celui qui opposa le maître des échecs Kasparov à l’ordinateur d’IBM Deep Blue en 1997. Eu égard à la cuisante défaite que subit alors le joueur russe, personne ne s’aventure à donner l’avantage par avance à Lee Sedol.

AlphaGo devient de plus en plus puissant

D’autant plus que nul ne connaît le niveau atteint aujourd’hui par AlphaGo qui a continué à s’améliorer en jouant contre lui-même. "Je suis en relation avec l’un des deux principaux auteurs de l’article paru dans Nature, Aja Huang", nous a confié Tristan Cazenave, professeur à l’Université Paris Dauphine et expert en intelligence artificielle. "Il m’a dit que le programme s’était beaucoup amélioré depuis octobre et qu’il devenait de plus en plus fort. Il est donc très difficile de savoir ce qui va se passer". Reste que l'on ignore les faiblesses d'AlphaGo.

Fan Hui avait été ainsi surpris d'avoir été mis en difficulté sur les parties plus lentes à jouer et pas les plus rapides, contrairement à ce que l'on aurait pu attendre d'une machine puissante en calculs. "AlphaGo a peut-être des faiblesses mais personne ne connaît bien son style de jeu", souligne Tristan Cazenave.

Contrairement au match du mois d’octobre, qui s’était tenu dans le plus grand secret et dont vous pouvez voir un résumé en vidéo ci-dessus, Google a décidé de médiatiser à l’extrême le tournoi en le diffusant en direct sur YouTube et sur plusieurs chaînes de télévision asiatiques. Le Go est en effet très populaire dans cette région du globe où il compte des millions d’adeptes.

Le tournoi se composera de cinq matchs qui auront tous lieu au Four Seasons Hotel de Séoul les 9, 10, 12, 13 et 15 mars.

Attention, si vous avez le courage de vous lever aux aurores, chaque round devrait durer entre 4 et 5 heures. Le tout sera commenté par plusieurs experts dont un Occidental, Michael Redmond, qui s’exprimera en anglais pour s’adresser à un plus large public.

pourquoi alphago est en train de révolutionner l'intelligence artificielle

Trois questions à Tristan Cazeneuve, professeur à l’Université Paris Dauphine et expert en intelligence artificielle.

01net : Quelles ont été les différentes méthodes utilisées par Deep Mind pour développer son programme AlphaGo ?

Tristan Cazeneuve : La première repose sur un réseau d'apprentissage profond (deep learning) de type supervisé. Le but est de faire apprendre à la machine les parties déjà jouées et gagnées par des champions. De cette manière, Deep Mind est déjà parvenu à prédire 57% des coups des joueurs les plus forts.

La deuxième méthode s'appuie sur l'apprentissage renforcé. Cela consiste à faire jouer le réseau neuronal contre différentes versions de lui-même pour améliorer encore la prévision des coups intéressants. Une façon de perfectionner le niveau de jeu mais pas seulement. Le réseau va aussi être capable de déterminer s'il va perdre ou gagner bien avant l'issue d'une partie.

Enfin, AlphaGo fait appel à la méthode de Monte Carlo qui permet de prévoir plusieurs coups à l'avance. L'idée est de faire jouer de façon aléatoire un grand nombre de fins de parties et de s'appuyer ensuite sur les parties gagnantes pour évaluer les positions. C'est la combinaison de ses trois méthodes qui a permis à AlphaGo d'atteindre des résultats encore jamais vus.

Qu'est-ce qui est le plus novateur dans cette démarche ?

Sans conteste, l'utilisation de l'apprentissage renforcé. Ils ont du faire jouer 30 millions de parties différentes en entier. Cela a nécessité beaucoup de temps, de calculs et de données pour arriver à un résultat aussi bon.

Il faut dire que Deep Mind dispose d'effectifs humains et de moyens matériels informatiques exceptionnels avec une puissance de calcul énorme, beaucoup de machines et de cartes graphiques. Ce qui en fait une expérience très difficile à reproduire ailleurs.

Quelles applications peut-on en attendre à moyen terme ?

C'est impossible à prévoir. La réussite d'AlphaGo fait progresser des méthodes générales d'intelligence artificielle qui seront à coup sûr utiles pour beaucoup d'autres applications, de la même manière que le deep learning a permis d'améliorer la reconnaissance d'image ou vocale. Mais on atteint là un degré de complexité extrêmement élevé. L'important, c'est que Deep Mind publie ses recherches pour que d'autres puissent avancer sur les algorithmes que cette équipe a conçus.

Amélie Charnay