Tech&Co Intelligence artificielle
Intelligence artificielle

100 heures de travail: comment le clip de Bigflo et Oli a été réalisé à l'aide d'une IA

placeholder video
Tech&Co a pu s’entretenir avec le réalisateur de “Ça va beaucoup trop vite”, le dernier morceau des deux frères toulousains qui a été créé à l’aide de l’intelligence artificielle.

Un titre qui prête à confusion. Dévoilé dimanche 24 mars, le clip "Ça va beaucoup trop vite" de Bigflo et Oli a dépassé les 200.000 vues en deux jours, faisant partie des tendances musique de Youtube. Cette vidéo présente une particularité: elle a été réalisée à l’aide de l’intelligence artificielle (IA).

Si le titre, qui inclut la mention "Clip IA", et le début de la vidéo laissent penser qu’il a suffi de "donner les paroles à une intelligence artificielle", la réalité est plus complexe, comme l’explique son réalisateur, connu sous le nom de Neb Sh, à Tech&Co.

100 heures de travail

Neb Sh n’en est pas à son premier coup d’essai avec ce morceau. Depuis deux ans, il crée des clips à l’aide de l’IA. Il est à l’origine des vidéos du remix de "Holidays" de Michel Polnareff, de "Rentrer chez moi" de l’acteur et humoriste Kyan Khojandi ou encore de "Paradis" de DJ Pone.

Cherchant à raconter une histoire avec la plupart de ces clips, le réalisateur a voulu "suivre les paroles" avec le morceau de Bigflo et Oli. Il a souhaité participer à ce projet car il estime que le titre "Ça va beaucoup trop vite" reflète ce que l’on vit actuellement avec l’IA, technologie qui "avance à une vitesse vertigineuse".

Dans les deux cas, la réalisation de ces vidéos à l’aide de l’IA n’a pas été simple. "Beaucoup croient qu’il suffit de rentrer les paroles, mais cela nécessite plus d’heures de travail que pour un morceau classique. Il faut préparer un concept et écrire le scénario, soit les prompts (requêtes faites au logiciel d'IA, ndlr) pour obtenir des images différentes pour chaque scène", explique Neb Sh à Teché&Co.

A cela s’ajoutent les nombreuses tentatives nécessaires pour obtenir le résultat souhaité. "Je n’ai jamais utilisé une première génération dans un clip car il y a des choses à améliorer, à changer", indique le réalisateur.

Vient ensuite le montage. Sans compter le temps de génération par l’IA, il lui faut en moyenne 100 heures pour réaliser ces vidéos (travail d’écriture, recherche de style, montage, etc.).

"Un outil comme un autre"

Pour créer ces clips, Neb Sh utilise principalement Stable Diffusion, l’IA génératrice d’images de Stability AI. Cela, pour des raisons éthiques. "C’est un outil gratuit et open source. On ne sait pas avec quelles données les outils fermés et payants sont entraînés, contrairement aux outils open source", souligne-t-il.

Stability.ai s’est en outre associée à Spawning pour proposer aux artistes dont les œuvres ont été utilisées pour former son IA de les retirer de sa base de données. Ce groupe d’artistes est à l’origine du site Have I Been Trained?, qui permet d'effectuer des recherches pour savoir si des IA ont été entraînées à partir de leurs œuvres.

Considérant que l’IA est un outil comme un autre, Neb Sh s’inquiète cependant du danger que cette technologie pourrait représenter plus tard. "Tant que l’être humain est au cœur, l’IA a sa place. Le vrai risque, pour tous métiers d’ailleurs, c’est l’automatisation", estime le réalisateur, rappelant que ce danger a déjà commencé à se manifester, notamment avec des sites de presse qui sont entièrement écrits par des IA.

Kesso Diallo