Tech&Co Intelligence artificielle
Intelligence artificielle

Un générateur de mondes interactifs: Google dévoile sa nouvelle IA Genie 3

placeholder video
Google Deepmind a montré les première images de Genie 3, une IA capable de créer toute sorte de mondes dans lesquels on peut se déplacer ou interagir avec des objets, à la manière d'un jeu vidéo.

Un univers numérique créé à partir de quelques mots. Dans une note de blog publiée le 5 août 2025, Google Deepmind, le département IA du géant de la tech, a dévoilé Genie 3. Il s'agit d'une IA générative unique en son genre puisqu'elle ne crée ni image, ni musique, ni vidéo, mais un monde dans lequel on peut se déplacer, comme dans un jeu vidéo.

Sortie en décembre 2024, son prédécesseur, Genie 2, s'est fait relativement discret. Mais dans des vidéos comparatives, publiées par Google, la différence entre les deux modèles est flagrante. En l'espace de huit mois, Genie est devenu bien plus fluide, la résolution des images est de meilleure qualité (en 720p) et la durée de simulation a largement été augmentée.

Des environnements interactifs

À la première ou à la troisième personne, les vidéos de démonstration publiées par Google montrent une variété d'univers générés. On peut voir des mondes aussi bien réalistes, que fantastiques, parfois cartoonesques, dans lesquels il est possible de se déplacer avec les touches de son clavier.

Les utilisateurs pourront même interagir en temps réel avec l'environnement. En formulant une requête au modèle, ils peuvent même faire apparaître des éléments ou des évènements dans l'univers numérique.

Mais l'un des ajouts majeurs de Genie 3 est sa mémoire. Auparavant, pour des IA similaires, dès qu'un élément sortait du champ de vision de l'avatar, il pouvait disparaître ou se transformer en autre chose. Un monde pouvait changer du tout au tout rien qu'en faisant un tour sur soi-même. Genie 3, lui, arrive à se souvenir de l'emplacement de certains objets, voire de modifications apportées à l'environnement. En témoigne la peinture, sur un des exemples pris en vidéo, qui persiste sur le mur bien qu'elle soit sortie du champ de vision.

Encore beaucoup de limites

Google note néanmoins certaines limites à Genie 3. À commencer par une zone d'action limitée dans l'environnement créé ainsi qu'une durée de simulation d'à peine quelques minutes. La génération en temps réel d'un environnement interactif, doté de mémoire, nécessite une puissance de calcul monumentale. Deepmind précise également que Genie est pour le moment incapable de répliquer des endroits réels et de générer du texte indépendamment du prompt.

Les utilisations d'un tel algorithme peuvent être nombreuses. On pense immédiatement au secteur du jeu vidéo mais Google prévoit plutôt de déployer Genie à des fins éducatives ou de formation. Mais là où il pourrait jouer un rôle essentiel, c'est dans l'entraînement d'autres IA. Ces mondes numériques alternatifs pourraient devenir des terrains d'essai privilégiés, puisqu'aucun risque ne peut y être encouru.

"Non seulement Genie 3 offre un vaste espace pour former des agents tels que des robots et des systèmes autonomes, mais il permet également d'évaluer les performances des agents et d'explorer leurs faiblesses", affirme Google Deepmind dans une note de blog.

Contrairement à d'autres IA génératrices de Google (notamment Veo pour les vidéos et Imagen pour les images), Genie 3 n'est pas ouvert au public. Pour l'instant, la firme réserve l'usage du modèle à une poignée de chercheurs. Elle n'exclut cependant pas de "rendre Genie 3 disponible à d'autres testeurs dans le futur".

Théotim Raguet