"Une nouvelle ère de créativité": Google a marqué les esprits avec son outil de génération de vidéos

Des concurrents de taille pour Sora. Alors qu'OpenAI permet de générer des vidéos ultraréalistes avec cette IA, Google ne veut pas être laissé de côté. Quelques mois après Veo 2, l'entreprise a profité de sa conférence annuelle des développeurs pour dévoiler son successeur, Veo 3.
Et ce nouveau générateur de vidéos se distingue de son prédécesseur avec une nouveauté de taille: il peut créer des vidéos avec du son, y compris du dialogue. Comme le montre Google avec plusieurs exemples, ces contenus sont très réalistes, avec des origamis qui fusionnent, un vieux matelot qui parle de la force de l'océan ou encore un hibou qui se pose et échange quelques mots avec un blaireau avant de s'envoler.
Résultats bluffants
Dès le début de sa conférence, Google a montré les capacités bluffantes de son nouvel outil, avec un film d'ouverture généré par Veo 3. Il commence avec une "cowgirl" qui arrive dans une petite ville, qui semble vide. "Cette ville n'a encore rien vu", dit-elle, avant qu'une musique ne se lance et que de nombreux animaux (flamand rose, éléphant, girafe...) apparaissent les uns après les autres.
"Dans tous les domaines, Veo 3 excelle, de la requête textuelle et visuelle à la physique réelle en passant par la synchronisation labiale précise. Il est excellent en compréhension; vous pouvez raconter une courte histoire dans votre requête, et le modèle vous renvoie un extrait qui lui donne vie", a assuré Google dans un article de blog.
Il suffit en effet à l'utilisateur d'indiquer ce qu'il veut dans sa requête pour que la vidéo soit générée. En plus de Veo 3, Google a dévoilé un nouveau modèle de génération d'images, présenté comme "le plus performant à ce jour", Imagen 4. Il peut créer des images réalistes avec une clarté au niveau des détails (gouttelettes d'eau, fourrure animale, etc.).
"Ces deux fonctionnalités (...) inaugurent une nouvelle ère de créativité", a déclaré le PDG de Google, Sundar Pichai.
Le géant américain est allé encore plus loin en dévoilant Flow, un outil de réalisation de films propulsé par l'IA. Conçu pour les créatifs, il permet de "créer facilement des extraits, des scènes et des histoires cinématographiques en associant les modèles les plus avancés de Google Deepmind: Veo, Imagen et Gemini". Cela, avec des requêtes en langage naturel.
Avec Flow, les utilisateurs peuvent aussi contrôler les angles et les mouvements de la caméra ou encore modifier des plans existants. Comme le montre une vidéo, il est par exemple possible d'allonger une séquence montrant une femme courir et arriver dans une rue avec des maisons qui ont été détruites pour la voir arriver dans une rue de son village avec une fête qui s'y déroule.
Mais Veo 3 comme Flow ne sont pas accessibles gratuitement. Uniquement disponibles aux États-Unis, elles peuvent uniquement être utilisées par les abonnés aux formules Google AI Pro (21,99 euros par mois) et Google AI Ultra (274,99 euros par mois).