Trustii.io, une plateforme collaborative pour écrire le monde de demain

Quel est le fonctionnement de Trustii.io ?
Les organisations privées et publiques peuvent construire facilement des modèles d’intelligence artificielle, en mode Saas, en faisant appel à notre communauté de data scientists. Il suffit d’entrer les données souhaitées sur notre plateforme de Machine Learning. Nos datas scientists (ils sont près de 2 000 aujourd’hui, issus du monde entier) prennent ensuite le relais, sous forme d’une compétition, pour construire le meilleur modèle d’IA possible autour de leur problématique.
La durée de cette compétition varie d’un à deux mois, selon les souhaits de l’organisateur. Nos outils permettent de classer automatiquement les modèles d’IA. Trustii.io propose alors aux clients entre le top 3 ou le top 5 des projets réalisés. Passer par Trustii.io est un véritable gain de temps et d’argent pour nos clients : ils peuvent se tourner vers nos data scientists en toute confiance, et concrétiser leur projet à un prix 10 fois moins cher que s’il le réalisait eux-mêmes.
Pourquoi les data scientists participent-ils à ces compétitions ?
Il y a toujours un prix à gagner ! Par exemple, lors de la compétition Allergen-Chip Challenge, organisée par la Société française d’allergologie (SFA), il y avait 25 000 euros à la clé, à partager entre trois candidats. Les data scientists apprennent, se perfectionnent d’un projet à l’autre, et peuvent également trouver des stages ou des emplois par la suite, par l’intermédiaire de Trustii.io.
Pouvez-vous nous en dire plus sur la compétition Allergen-Chip Challenge ?
Les data scientists avaient trois mois pour réaliser un algorithme d’intelligence artificielle capable de prédire si une personne peut développer une allergie, et si oui, quel type d’allergie (kiwi, œuf, etc.). Ce challenge a réuni environ 300 participants à travers le monde, dont l’un des lauréats, un jeune Indien d’à peine 16 ans. Cet événement a été organisé par la SFA (Société française d’allergologie), en collaboration avec le Health Data Hub, l’agence de l’État qui s’occupe de la numérisation des données de santé.
Quels sont les critères retenus lors de ces compétitions de modèles d’IA ?
Il existe deux types de critères : objectifs et subjectifs. La plateforme Trustii.io se base sur les critères objectifs, à savoir la performance et l’accuracy du modèle, c’est-à-dire la précision des réponses des algorithmes fournis par les compétiteurs data scientists. Reprenons l’exemple du projet pour la SFA : les data scientists ont dû réaliser un modèle capable de prédire si une personne peut développer une allergie, et si oui, quel type d’allergie. Une fois réalisé, ce modèle a généré un score (entre 0 et 100 %). Plus un projet s’approche des 100 %, plus il correspond aux attentes de nos clients.
L’organisation qui fait appel à Trustii.io peut aussi ajouter des critères subjectifs, comme l’explicabilité. Elle peut notamment demander aux candidats qui ont des super scores de lui expliquer rapidement comment fonctionne leur modèle, avant de faire son choix.
Pour quels domaines d’activités les data scientists peuvent-ils créer ces IA ?
Notre communauté de data scientists est issue du monde académique. Ils sont donc chercheurs, professeurs, étudiants… Mais nous comptons également des data scientists experts. Ces acteurs viennent du monde entier : États-Unis, France, Asie, Afrique, Inde... En tant que généralistes, ils peuvent s’adresser à tout type de problématique et de marché.
Côté clients, le domaine de la santé est très demandeur de ces modèles d’intelligence artificielle, car ils permettent de diagnostiquer des maladies. Les acteurs de la santé sont aussi encouragés à avoir recours à ces challenges par le biais de financements. C’est notamment le cas avec le Data Challenge, un programme d’État, organisé avec le Health Data Hub, et à destination des hôpitaux et de sociétés savantes comme la SFA. Nous avons également réalisé des challenges dans le domaine de la banque (pour prédire si un client va quitter une banque), la cybersécurité…
Comment assurez-vous la protection des données de santé, très sensibles ?
Trustii.io n’a pas inventé ce modèle de compétition. Il existe plusieurs players du genre dans le monde entier, dont la plateforme référence Kaggle, rachetée par Google en 2017. Cependant, la plupart se situent en dehors de la France, ce qui pose donc des problèmes de confidentialité et de sécurité de la donnée, pour les acteurs français – et plus encore pour les institutions de santé. De plus, ces plateformes étrangères n’ont pas véritablement d’offre accès sur la sécurité des données, mais fonctionnent plutôt en Open Source.
D’où l’intérêt pour les établissements de santé français de se tourner vers Trustii.io, qui a développé une offre de sécurité de la donnée. Lorsqu’un hôpital entre de la donnée sur notre plateforme, elle est bien sûr sécurisée et stockée en Europe. Chose importante : nos data scientists peuvent y accéder à travers la plateforme, écrire leur code sur la plateforme, mais ils ne peuvent jamais télécharger la donnée. En d’autres termes, ils peuvent entraîner leur modèle d’IA directement sur la plateforme, mais la donnée du client reste en lecture seule.
Trustii.io est le seul player au monde à avoir mis en place cette technique. Ce gage de confiance nous a permis de compter l’hôpital Foch et les HUS (Hôpitaux Universitaires de Strasbourg) parmi nos clients. Il nous positionne aussi correctement sur les marchés français et européen, où la souveraineté de la donnée est très importante.
Enfin, la sécurité est aussi assurée grâce à un mécanisme permettant de sélectionner la zone géographique des data scientists. Par exemple, une organisation peut donc choisir de travailler uniquement avec des acteurs résidant en Europe (par exemple, pour respecter l’anonymat des données et de la RGPD), ou en Asie. Ce mécanisme leur donne un contrôle d’accès.
Quels sont les plus grands défis que vous identifiez dans votre secteur ?
La première difficulté réside dans la longueur du cycle de vente. Les échanges avec les organisations de santé sont souvent très lents, prenant entre un et deux ans, du premier contact au lancement du projet. Cependant, ce système devrait évoluer à mesure que l’écosystème de santé prendra conscience de l’importance de l’IA. Il y a encore tout un travail d’éducation à faire pour que les professionnels de santé comprennent en quoi ces technologies peuvent les aider.
Cependant, les réglementations française et européenne imposent que les données soient pseudonymisées. Une photo de bouche reste un identifiant biométrique, ce qui nécessite de nombreux documents pour respecter les exigences de sécurité et de conformité. Ces contraintes ont limité le défi aux participants européens, réduisant leur nombre à 84. À l’avenir, nous espérons que davantage de données de santé seront accessibles en Open Source pour favoriser le développement de cet écosystème.
Enfin, pour développer des modèles d’IA, le principal défi réside dans les ressources nécessaires, notamment pour effectuer les calculs. Les hôpitaux nous choisissent, car nous disposons de ressources de calcul, comme des GPU, qui permettent de réaliser des analyses d’imagerie. Par exemple, lors d’un défi avec l’hôpital Foch sur les biopsies pulmonaires, nous avons pu combiner la confidentialité des données avec la mise à disposition de capacités de calcul pour les participants. Cela leur a permis de créer leurs modèles sans se préoccuper de savoir s’ils ont accès aux processeurs adaptés.
Avez-vous un mot de la fin ?
Début 2024, nous avons lancé un partenariat avec l’entreprise Understand.Tech. Il permet à notre communauté d’accéder à des cours de Machine Learning via une plateforme interactive, similaire à ChatGPT. Cette plateforme est capable de répondre à des questions techniques pointues et de générer du code. Nos data scientists peuvent également utiliser cet outil pour accélérer le développement de leurs projets, notamment lors de nos challenges.
La rédaction de BFM Business/BFMTV/RMC/RMC Sport n'a pas participé à la réalisation de ce contenu en partenariat avec Scribeo. La consultation du présent article est notamment soumise aux CGU de Scribeo.