Veo 3.1: Google répond à Sora 2, d'OpenAI, dans la guerre des générateurs de vidéos

Cinq mois après son lancement, Veo 3 s'offre une première mise à jour. Alors que Sora 2, d'OpenAI, fait parler de lui et est disponible depuis le 30 septembre, Google a annoncé quelques nouveautés pour son générateur de vidéos qui impressionnait déjà par ses capacités. Avec Veo 3.1, l'entreprise promet une meilleure capacité à suivre fidèlement les requêtes et une meilleure qualité audiovisuelle lors de la transformation d'images en vidéo.
En plus d'un réalisme accru, cette mise à jour offrirait un meilleur contrôle narratif et un son plus riche. Des nouveautés qui sont également disponibles dans l'outil de réalisation de films propulsé par l'IA Flow de Google.
Entre fonctions enrichies...
La grande nouveauté de Veo 3.1 est l'ajout de l'audio aux fonctions existantes, permettant au modèle d'IA de générer de la vidéo et de l'audio simultanément à partir d'images fixes. Il offre aussi plus de contrôle à l'utilisateur dans Flow, notamment avec "Frames to video". Avec cette fonction, il pourra fournir une image de début et une autre de fin afin que l'outil de réalisation génère une vidéo fluide reliant les deux.
Il sera également en mesure de modifier l'apparence d'une scène grâce à "Ingredients to video", qui lui donnera la possibilité de soumettre jusqu'à trois images comprenant des personnages, des objets et un lieu pour que Flow les associe afin de créer une scène "conforme à ses attentes".
Enfin, Veo 3.1 va permettre de prolonger des scènes avec "Extend". Cette fonction utilisera la dernière seconde du clip original pour générer une nouvelle vidéo. Les utilisateurs pourront ainsi "créer des vidéos plus longues, d'une minute ou plus, qui rejoignent et prolongent l'action de votre clip original".
... et nouvelles capacités
Outre ces trois fonctions enrichies avec de l'audio, Veo 3.1 introduit de nouvelles capacités de modification directement dans Flow. La première permet d'ajouter de nouveaux éléments dans des scènes. "Flow gère désormais des détails complexes comme les ombres et l'éclairage de la scène, rendant l'ajout naturel", promet Google.
Avec la seconde, il sera bientôt possible de retirer des objets ou des personnages d'une scène sans problème, selon l'entreprise, car Flow reconstruira l'arrière-plan et l'environnement en "donnant l'impression que l'objet n'a jamais été là".
Veo 3.1 est disponible dès maintenant dans l'application Gemini, ainsi que dans Vertex AI pour les entreprises et dans l'API pour les développeurs.