Tech&Co Intelligence artificielle
Intelligence artificielle

Cette intelligence artificielle peut générer des mèmes de Tintin à l'infini

placeholder video
Vous connaissiez Midjourney pour créer des œuvres d'art? Ce chercheur en intelligence artificielle a créé une IA pour générer des images et des mèmes dans le style de Tintin. Et le moins qu'on puisse dire, c'est que ça ressemble beaucoup à la BD d'Hergé.

"Tintin au pays de l'intelligence artificielle". Ce pourrait être le titre d'un nouvel album des aventures du plus célèbre des reporters belges, entièrement créé par ordinateur. En tout cas, c'est aujourd'hui faisable: un chercheur en IA a créé un programme semblable à Midjourney, mais spécialisé dans la création d'images de Tintin et l'imitation du style de Hergé – avec des résultats assez impressionnants.

Les internautes ont pu suivre sur Twitter (récemment rebaptisé X) l'évolution du programme créé par Pierre-Carl Langlais, directeur de recherche en IA chez OpSci. Comme avec Stable Diffusion, l'algorithme peut créer de toutes pièces des images, qui pourraient sans mal passer pour tirées des bandes dessinées (comme les cases ci-dessous, qui ne proviennent d'aucun album).

L'IA peut même "tintiniser" des images réelles – comprendre, leur donner un trait et des couleurs typiques du style de Hergé...

… et surtout, elle peut réinterpréter des mèmes connus, comme ici "This is fine", le chien au milieu des flammes pour qui "tout va bien".

"Pourquoi Tintin? Je suis chercheur en humanités numériques, donc je m'intéresse à l'application des technologies comme les IA à la culture et à son histoire", explique Pierre-Carl Langlais, interrogé par Tech&Co.

"Tintin est aussi une icône de la culture numérique francophone: il n'y a qu'à voir le nombre de groupes dédiés aux mèmes sur Tintin", ajoute le chercheur. "Et ça amène des débats intéressants, comme celui sur les droits d'auteur et le travail des artistes."

Contrairement à d'autres personnages comme Heidi ou des voix comme celle de Johnny Hallyday, le globe-trotter de Moulinsart avait jusqu'ici largement échappé aux détournements facilités par le développement des IA génératives. La raison est simple: pour pouvoir reproduire un personnage, ces logiciels doivent analyser un certain nombre d'images de référence, qu'elles aspirent sur Internet.

Or, Tintin est largement absent des bases de données de ces IA. La preuve avec le site haveibeentrained, qui permet d'explorer une partie d'un dataset utilisé pour entraîner Midjourney: les images associées à la recherche "Tintin" sont souvent de mauvaise qualité, ou ont des styles graphiques très différents, ce qui n'aide pas le logiciel à associer un type de trait particulier au personnage.

Le droit d'auteur en question?

Mais parce qu'il crée son programme lui-même, Pierre-Carl Langlais peut choisir les images qu'il utilise pour l'entraîner, y compris des images non disponibles sur le web. L'entraînement en lui-même n'est d'ailleurs pas si compliqué: deux heures à faire fonctionner un programme sur la plateforme Google Colab, pour "fine-tuner" (ajuster) une version déjà entraînée de Stable Diffusion (la version XL, publiée en juillet). Le tout pour moins de 5 euros.

"Le plus long, c'est la création du corpus de données: chaque case doit être annotée avec une description qui permet au logiciel d'interpréter ce qu'il voit. Mais pas trop détaillée, sinon il se perd", explique le chercheur à Tech&Co.

Évidemment, les résultats ne sont pas toujours parfaits, et l'aléatoire donne parfois des créations perturbantes – mais c'est le cas de toutes les IA, même les plus poussées comme Midjourney. La première version du programme de Pierre-Carl Langlais n'était entraînée que sur 35 cases de BD, numérisées par ses soins. "J'ai la collection, ça aide!"

Et après plusieurs tests, le système s'est clairement amélioré, comme le prouve son créateur.

Reste la question des droits d'auteur: la société propriétaire de Tintin, Tintinimaginatio (ex-Moulinsart), défend farouchement sa propriété et n'hésite pas à lancer des procédures judiciaires contre les internautes qui utilisent son œuvre pour des productions commerciales. Auprès de Tech&Co, Pierre-Carl Langlais se dit confiant, soulignant que ses créations n'entrent pas en concurrence avec l'œuvre originale.

"Évidemment qu'utiliser ce genre de créations dans un but commercial est interdit", rappelle le chercheur.

"Les seules exceptions sont l'usage privé et le détournement à des fins parodiques, et j'ai fait exprès de créer des parodies évidentes pour cette raison." Il pointe vers les comptes humoristiques comme Tintinades, ou les mèmes célèbres utilisant les dessins d'Hergé, comme "Captain, it's Wednesday".

Pierre-Carl Langlais a depuis rendu son modèle disponible directement sur Google Colab, avec une explication détaillée de sa démarche. Il assure avoir conscience des enjeux juridiques et éthiques de cette décision: "le modèle est utilisable à des fins strictement non-commerciales, dans le respect des exceptions au droit d'auteur (notamment droit de parodie)", explique le chercheur sur la page du modèle.

Luc Chagnon