Microsoft va numériser chaque détail de Notre-Dame de Paris pour en faire un double numérique "pour l'éternité"

Microsoft va numériser dans les détails Notre-Dame de Paris - Microsoft - Iconem
L’IA au service de la culture et de l’histoire. C’est l’annonce inattendue faite ce lundi 21 juillet par Brad Smith, le président de Microsoft. L’entreprise américaine s’associe avec le ministère de la Culture afin de créer un jumeau numérique complet de la cathédrale Notre-Dame de Paris. Une initiative qui intervient alors que les travaux de restauration du monument touchent à leur fin, plus de six ans après le terrible incendie qui ravagea notamment le toit et sa célèbre flèche.
Le géant de l’informatique entend ainsi contribuer à la conservation du patrimoine français en mettant ses technologies d’imagerie avancées et ses algorithmes d’intelligence artificielle à profit. Chaque détail architectural de l’édifice gothique sera ainsi capté et numérisé afin de créer une réplique de Notre-Dame de Paris. Un travail qui avait manqué au moment d’entamer les travaux de reconstruction du bâtiment et qui devrait servir aux chercheurs, conservateurs et autres restaurateurs pour pouvoir comparer l’évolution de la cathédrale au fil du temps, identifier l’usure ou les défauts avec une précision d’un centimètre, assure-t-on.
"Ce sera une ressource historique essentielle, utilisable dans un, deux ou même trois siècles", souligne Brad Smith. "Une façon de préserver le patrimoine pour l'éternité."
Microsoft va confier la numérisation à la société française Iconem, spécialiste du numérique avec laquelle elle a déjà conçu une réplique de la basilique Saint-Pierre au Vatican (avec plus de 400.000 photographies et des algorithmes d’IA), mais aussi travaillé sur un projet plus large autour d’archives inédites de la Libération avec le musée de l’Armée aux Invalides. Un partenaire avec lequel l’américain a noué de profonds liens technologiques et avec lequel il partage une même vision: construire les fondations numériques pour que le patrimoine traverse les âges.
Ce projet qui démarre, et devrait voir le jour d’ici deux ans à coup de millions de dollars, sera intégré par la suite au musée Notre-Dame de Paris et donné à l’État français par Microsoft.
D’autres partenariats pour la conservation et la pérennité numérique du patrimoine français
Cela fait plus de six ans que Microsoft s’est lancé dans la numérisation culturelle à travers le monde afin de protéger monuments, mais aussi langues en déclin. Rien qu’en France, d’autres projets ont vu le jour ou sont en cours. Le musée du Plan-Relief à Paris a été numérisé, notamment sa maquette du Mont-Saint-Michel datant de 1702, et un projet est en cours avec la Bibliothèque Nationale de France pour numériser près de 1.500 décors de l’Opéra de Paris, certains datant du début du XIXe siècle, mais aussi avec le musée des Arts décoratifs (1,5 million d’artefacts). Tout cela sera rendu disponible par la suite pour des expériences éducatives et comme base de données pour de la recherche.

Et le jumeau numérique de Notre-Dame est un maillon d’un programme plus vaste de Microsoft visant à préserver la richesse culturelle et linguistique de l’Europe à l’ère du numérique. À Strasbourg, des centres d'innovation vont être déployés pour développer des modèles d’IA multilingues, avec notamment l’université de Strasbourg. Un appel à projets sera lancé le 1er septembre prochain dans le but de numériser du contenu dans 10 langues européennes sous-représentées (grec, maltais, estonien, alsacien, etc.). Microsoft financera, parrainera et aidera techniquement les propositions retenues. Et cela pourrait concerner des archives universitaires, collections privées, bibliothèques, etc.
Dans le cadre de son programme Culture AI, Microsoft vise ainsi à sauvegarder les langues, les monuments et artefacts grâce à une technologie qui "doit refléter la richesse de l’humanité, et non la dépouiller". Une façon de "garantir que l’IA n’efface pas la diversité linguistique et culturelle, mais la renforce", assure Brad Smith.
Entraîner des modèles IA sur des données locales pour être plus adapté
Car Microsoft est parti d’un constat simple dans l’entraînement des IA: "Internet est aujourd’hui très fortement biaisé en faveur du contenu en anglais", reconnaît le responsable. "Seulement 5% des personnes ont l’anglais comme langue native dans le monde. Mais quand on regarde les langues sur Internet, l’anglais est en fait majoritaire."
Alors, le groupe américain va entraîner ses modèles d’IA sur des données plus locales, afin d’ajuster aussi ses réponses à des datas historiques, culturelles ou sociétales plus adaptées aux populations locales. Et cela permettra aussi de ne pas exclure des futurs services d’IA certaines langues peu représentées en ligne, dont certaines considérées comme menacées par l’Unesco (le romanche, l’occitan, le breton…) malgré un profond héritage culturel, mais qui ne sont pas prises en charge par les systèmes d’IA actuels faute de data.
"Je ne pense pas qu’un pays puisse entièrement protéger sa souveraineté numérique s’il ne dispose pas de contenu dans sa propre langue, rendu disponible pour l’entraînement des modèles d’IA que sa propre population peut utiliser", estime Brad Smith.
Mais il l’assure, les tensions réglementaires récemment rencontrées avec la Commission européenne n’ont rien à voir avec ce geste qui pourrait s’apparenter à une main tendue politique. "Ce que nous faisons n’aura aucun impact sur les décisions réglementaires. Ce n’est pas le but", martèle-t-il devant un parterre de journalistes européens. Le message paraît pourtant clair: une IA utile à l’Europe doit être entraînée en Europe, sur des données locales et avec des Européens. Une manière aussi pour Microsoft de se distinguer d’autres géants de la tech en jouant la carte de la coopération culturelle et de l’arche de Noé numérique pour le patrimoine culturel et la diversité linguistique grâce à l’IA.