Après la photo, les IA créent désormais des vidéos selon votre imagination

Pourrez-vous bientôt créer votre propre film en quelques secondes, à partir de seulement quelques mots? Après avoir révolutionné la création d'images (avec des logiciels comme Midjourney et Dall-E) puis l'écriture de textes (avec ChatGPT et son petit frère GPT-4), l'intelligence artificielle s'attaque à un nouveau terrain: la création de vidéos.
La startup américaine Runway a dévoilé lundi une nouvelle version de son outil "Text to Video". Elle permet de générer des séquences vidéo en quelques minutes, simplement en écrivant en quelques mots d'anglais la scène qu'on souhaite voir apparaître.
Ce type d'IA en est encore à ses débuts: l'IA de Runway n'est capable de générer que des séquences d'environ 3 secondes, aux contours mouvants et au contenu parfois incohérent. Et cette fonctionnalité n'est pas encore accessible à tous, puisqu'il faut s'inscrire sur une liste d'attente.
Mais comme leurs homologues textuels, ces modèles progressent à une vitesse impressionnante. La première version de Text to Video, publiée par la startup en février, permettait seulement de modifier le style d'une vidéo existante grâce à l'IA.
Cette nouvelle version conserve cette fonctionnalité et en ajoute d'autres, comme la possibilité de combiner une description avec une image qui servira à guider le style de la vidéo générée. Les vidéos créées sont pour l'instant silencieuses, mais Runway s'intéresse également à la génération audio, affirme son dirigeant à Bloomberg.
Un secteur en pleine expansion
Runway n'est pas la première entreprise à travailler sur ce genre d'IA. Dès l'automne 2022, les géants de la tech Meta et Google avaient tous deux annoncé travailler sur leurs propres IA de génération de vidéo. Mais aucun d'eux n'a annoncé quand ces programmes seraient disponibles pour le grand public.
Le secteur de la vidéo est aussi exploré par le champion actuel de l'intelligence artificielle générative, OpenAI, comme l'avait révélé son dirigeant Sam Altman. Mais malgré les spéculations, son dernier modèle GPT-4 n'est pas capable de ce genre de créations.
Un autre modèle "texte-vers-vidéo" s'est lancé pour occuper l'espace vacant: une IA sobrement nommée "text-to-video synthesis", créée par un laboratoire de recherche affilié au géant chinois Alibaba, est disponible depuis le 19 mars sous forme de démo gratuite sur Hugging Face, une des plateformes incontournables du boom de l'intelligence artificielle. Elle aussi promet de créer de courtes séquences vidéos à partir de quelques mots.
Mais cette démo est régulièrement saturée à cause du grand nombre d'utilisateurs. Et surtout, les vidéos générées par cette IA comportent régulièrement le logo de la plateforme Shutterstock, suggérant que l'IA a été entraînée sur un très grand nombre de vidéos issues de cette plateforme – ce qui pose des questions en matière de droits d'auteur.
Ces modèles ne manqueront pas non plus de soulever de nombreux problèmes éthiques. Plus les IA pourront pourront générer des vidéos photoréalistes, plus la création de deepfakes sera accessible, y compris à des fins de désinformation ou de deepfakes pornographiques.
"Certaines personnes vont essayer d'en faire des mauvais usages", anticipe auprès de Bloomberg Hany Farid, expert en investigation numérique à l'Université de Berkeley (Californie).
Ces programmes pourraient-ils bientôt révolutionner le cinéma, jusqu'ici en grande partie préservé des bouleversements qui affectent déjà de nombreux artistes? Certains professionnels du secteur se sont élevés contre ces développements, à l'image de Steven Spielberg, qui s'est dit "très mal à l'aise" face aux créations des IA: "L'âme est inimaginable et inexprimable. Elle ne peut être créée par aucun algorithme."