Comment trois Français exilés aux Etats-Unis sont devenus des incontournables de l'IA
"Pendant la ruée vers l'or, ce ne sont pas les chercheurs d'or qui se sont le plus enrichis, mais les vendeurs de pioches." Qui profitera de la ruée vers l'intelligence artificielle qui obsède aujourd'hui le secteur de la tech, des géants américains comme Google et Microsoft à une infinité de startups? Parmi les vendeurs de pioches les mieux placés, il y a trois Français.
Julien Chaumond, Clément Delangue et Thomas Wolf sont aujourd'hui à la tête d'un des rouages essentiels de cet écosystème en pleine expansion: la plateforme Hugging Face. Un nom encore peu connu du grand public, et qui l’était encore moins il y a six ans quand l'entreprise a dû s'exiler aux Etats-Unis pour espérer lever des fonds. "L'IA paraissait tellement loin à l'époque, c'était impossible de lever des fonds en France en se plaçant à aussi long terme", explique à Tech&Co Thomas Wolf.
Dire que la situation a changé serait un euphémisme. Chaque semaine apporte son lot de nouvelles IA aux capacités bluffantes, de l'écriture automatique de textes à la création d'images en passant par la reproduction de voix plus vraie que nature. Et Hugging Face a réussi à se placer au centre de cette révolution.
La boîte à outil de l'IA
Hugging Face est une plateforme à tout faire de l'IA, à la fois boîte à outil, bibliothèque et bac à sable. Sur le site, n'importe qui peut concevoir sa propre IA, l'entraîner avec ses propres jeux de données ou des ensembles déjà existants, et la publier pour que tout le monde puisse l'utiliser gratuitement ou la commenter. À la manière d'un GitHub (qui permet à n'importe qui de stocker des lignes de code et de les mettre à la disposition de tous), Hugging Face héberge ainsi près de 150.000 modèles conçus par ses utilisateurs.
Jusqu'à récemment, la plateforme hébergeait surtout des programmes spécialisés dans le traitement du langage, comme le modèle Bert de Google. Mais 2022 est passé par là. Parmi les plus populaires aujourd'hui, les modèles de "text-to-image" comme Stable Diffusion, ou son prédécesseur Craiyon, dont le style graphique en faisait le générateur de mèmes favori des réseaux sociaux.
"On avait dû rajouter des serveurs en urgence pour tenir le rythme des demandes", s'amuse Thomas Wolf auprès de Tech&Co.
Mais Hugging Face n'est pas (seulement) un "App Store de l'IA". La plateforme héberge aussi certaines pièces indispensables à la construction des principaux modèles actuels. La librairie Transformers, qui permet aux modèles de langage comme ChatGPT de comprendre une phrase dans son contexte; ou les Diffusers, qui permettent à Stable Diffusion de générer des images à partir d'un amas de pixels de couleurs aléatoires; ces librairies sont maintenues par les équipes de Hugging Face, mises à jour et à disposition de tous. Tout cela en open source.
Concilier IA et éthique
Car Hugging Face cultive aussi une image d'entreprise éthique et ouverte, à l'opposé des géants de la tech comme Google ou OpenAI, qui entretiennent très souvent le secret sur le fonctionnement de leurs modèles ou les données d'entraînement. "Il y a beaucoup de connaissances qui sont privées et ne sont pas partagées autour de ces modèles, on pense que ce n'est pas quelque chose de sain pour le domaine à long terme", estime Thomas Wolf.
"L'IA devrait être une sorte de bien commun, et pas seulement la propriété de quelques Big Tech américaines", affirme Thomas Wolf pour Tech&Co.
Cette politique d'ouverture se retrouve dans le prix de la plateforme: celle-ci est gratuite pour les utilisateurs individuels, avec des comptes payants seulement pour les grosses entreprises qui ont des besoins plus importants en termes de puissance de calcul. En mai 2022, la plateforme comptait environ 1000 de ces comptes payants, pour des entreprises comme Renault ou Bloomberg. De quoi lever des revenus tout en restant ouvert aux chercheurs et aux utilisateurs les plus créatifs.
Mais le développement de ces IA alimente aussi des inquiétudes. N'y a-t-il pas des risques à mettre autant de modèles aussi puissants à disposition de n'importe qui? Hugging Face affirme avoir conscience de ces dangers, et réfléchit constamment à la manière de concilier IA et éthique.
"On sait qu'on manipule des systèmes puissants qui peuvent avoir des répercussions négatives sur la société", insiste auprès de Tech&Co Giada Pistilli, éthicienne en chef chez Hugging Face.
Discrétion autour du chiffre d'affaires
L'entreprise emploie déjà des grands noms de la recherche sur l'éthique en matière d'IA, comme Margaret Mitchell, anciennement chez Google. Parmi ses 160 salariés, elle possède depuis peu une équipe dédiée spécialement à ces questions, chargée de concevoir des chartes éthiques pour guider ses développeurs à travers des questions morales complexes.
"Si j'ai un modèle qui peut créer de l'art érotique, à quel point je l'autorise à aller jusqu'au pornographique? À quel point je dois autoriser ou bloquer ce que la communauté demande?" s'interroge Giada Pistilli pour Tech&Co.
Ces réflexions théoriques doivent ensuite être mises en pratique, et évoluer avec le temps et les changements du droit. Ce à quoi Hugging Face s'applique, tout en publiant régulièrement des articles détaillant leur méthodologie pour diffuser les bonnes pratiques. Une image protectrice et empathique résumée par le nom de l'entreprise et son logo, un emoji câlin.
L'éthique et l'open source sont-ils compatibles avec la rentabilité? L'entreprise refuse de donner ses chiffres publiquement. Le coût des ressources informatiques nécessaires au traitement de tant de modèles reste très élevé, mais Hugging Face chercher à les réduire, notamment à travers le partenariat privilégié avec Amazon Web Services qu'elle a conclu en 2021.
Le Point évoque des revenus de 15 millions de dollars en 2022, et des perspectives optimistes. "La communauté du machine learning va être multipliée par 50 d’ici 2030 car les développeurs de logiciels vont s'y mettre", promet le cofondateur Julien Chaumond dans l'hebdomadaire. Pour les vendeurs de pioches, l'avenir s'annonce plein de promesses.