Tech&Co Intelligence artificielle
Intelligence artificielle

"Pokémon Bleu" a été bouclé par l'IA de Google... en plus de 800 heures

placeholder video
Gemini, developpé par Google, a été la première IA à terminer un classique du jeu vidéo, "Pokémon Bleu". Un exploit qui aura pris néanmoins plusieurs centaines d'heures.

Le chemin aura été long, mais Gemini est enfin devenu maître de la ligue Pokémon. En mars 2025, l'IA de Google s'est lancée dans un voyage à travers le jeu vidéo Pokémon Bleu, premier jeu de la licence sorti en 1996. Le 3 mai 2025, Gemini 2.5 Pro a fini le jeu, faisant d'elle la première IA à l'avoir terminé.

L'initiative ne vient pas directement de Google mais d'un ingénieur d'une trentaine d'années, extérieur à l'entreprise. L'homme a diffusé la partie de Gemini sur la plateforme de streaming Twitch sous le nom de chaîne Gemini_Plays_Pokemon

La course pour devenir maître Pokémon

Le premier à s'être lancé dans la course à la ligue Pokémon est Claude, l'IA d'Anthropic. En février 2025, l'entreprise américaine voulait tester la puissance de son dernier modèle d'IA Claude 3.7 Sonnet en le faisant jouer à Pokémon Rouge (jeu presque identique à Pokémon Bleu). Ses progrès sont eux aussi diffusés sur la chaîne Twitch ClaudePlaysPokemon.

Après plusieurs mois de jeu, Claude a passé quelques étapes importantes comme l'obtention de trois badges. Mais l'IA d'Anthropic n'a jamais atteint la ligue, la dernière zone du jeu. Depuis que Claude s'est lancé dans l'aventure Pokémon, ce classique de la Gameboy se transforme en nouveau banc de test pour les IA.

Le 29 mars 2025, Gemini entre dans la course pour devenir maître Pokémon. L'ingénieur qui a lancé le défi à Claude explique s'être "inspiré de ClaudePlaysPokemon". La compétition entre les IA de Google et Anthropic interpelle les internautes curieux qui par centaines regardent les IA progresser. Le 3 mai, c'est finalement Gemini qui a eu raison de Claude en terminant le jeu en premier.

Gemini se sera battue sans répit pendant plus de 800 heures pour finir ce Pokémon. Mais cela reste 31 fois le temps moyen mis par un joueur humain. 26 heures sont en moyenne requises pour terminer Pokémon Rouge/Bleu selon le site Howlongtobeat.

L'IA doit donc encore progresser avant de devenir le meilleur dresseur. Cela n'a pas empêché Sundar Pichai, patron de Google, de féliciter Gemini sur X: "Quel final! Gemini Pro 2.5 vient juste de terminer Pokémon Bleu!"

Un avantage qui fait la différence

Pour atteindre de tels résultats Gemini ne se base pas uniquement sur sa puissance de calcul mais possède un atout de taille. L'IA dispose d'une minimap, une carte de la zone où se trouve le joueur, visible en haut à droite du stream.

"Les humains construisent naturellement des cartes mentales en jouant à des jeux, ce que les IA actuelles ne peuvent pas encore faire de manière autonome. La fonction de minimap compense cette limitation", informe l'ingénieur derrière le compte Twitch Gemini_Plays_Pokemon.

Son aspect très simplifié est beaucoup plus lisible pour l'IA que l'écran du jeu. Cela permet à Gemini de se repérer dans l'espace, de repérer les cases où se trouvent les objets ou les personnages mais également de localiser les endroits clé comme les entrées ou les sorties de zones.

Pour naviguer dans le jeu, Gemini s'aide d'une minimap en haut à droite de l'écran. Elle l'aide à résoudre certains puzzles comme ce passage où le jouer doit pousser un rocher.
Pour naviguer dans le jeu, Gemini s'aide d'une minimap en haut à droite de l'écran. Elle l'aide à résoudre certains puzzles comme ce passage où le jouer doit pousser un rocher. © Gemini_Plays_Pokemon - Twitch

Cet avantage peut expliquer qu'elle soit parvenue à dépasser Claude. Ce dernier se base uniquement sur ce qui se trouve sur son écran et ne visualise la zone que grâce à sa mémoire. S'il ne trouve pas un objet ou une sortie, Claude peut s'enfermer dans une boucle presque interminable.

Selon l'ingénieur derrière Gemini_Plays_Pokemon, les performances sur Pokémon ne peuvent pourtant pas servir de comparatif entre les deux IA. Il indique dans la bio de la chaîne Twitch: "Il n'est pas possible de faire des comparaisons directes: Gemini et Claude disposent d'outils différents et reçoivent des informations différentes. Chaque modèle pense différemment et excelle de manière unique."

Théotim Raguet