Meta va entraîner ses modèles d'IA sur les données publiques de ses utilisateurs européens

Meta va entraîner ses modèles d'intelligence artificielle (IA) générative sur le contenu public de ses utilisateurs européens et leurs conversations avec le chatbot Meta AI, a annoncé le groupe dans un communiqué lundi. L'entreprise exploitera notamment les publications et les commentaires publics partagés sur ses réseaux sociaux pour former ses modèles.
"Cet entraînement (...) permettra de mieux accompagner des millions de personnes et d'entreprises dans l'UE, en apprenant à l'IA de Meta à mieux comprendre et à refléter leurs cultures, leurs langues et leur histoire", a affirmé le groupe californien.
Pour l'entreprise, il ne faut en effet pas seulement fournir une IA aux Européens, mais aussi s'assurer que celle-ci puisse comprendre leurs dialectes, expressions familières ou encore connaissances locales, ce qui ne peut pas se faire sans entraîner ses modèles sur leurs données publiques.
Opposition possible
Dès ce lundi 14 avril, Meta va commencer à informer les utilisateurs concernant l'utilisation de leurs contenus publics pour entraîner ses modèles via des notifications. Celles-ci leur expliqueront le type de données utilisées, mais aussi comment cet entraînement permettra d'améliorer son IA et l'expérience utilisateur globale.
Les utilisateurs européens auront cependant la possibilité de s'opposer à l'utilisation de leurs données à cet effet, grâce à un lien renvoyant vers un formulaire dédié dans ces notifications.
"Nous avons fait en sorte que ce formulaire d'objection soit facile à trouver, à lire et à utiliser, et nous honorerons tous les formulaires d'objection que nous avons déjà reçus, ainsi que ceux soumis ultérieurement", a assuré Meta.
La société précise en outre que les données publiques des comptes mineurs dans l'UE ne seront pas utilisées pour entraîner ses modèles d'IA. Cette annonce intervient près d'un mois après le lancement de Meta AI dans l'UE. Alors que le groupe californien a lancé son chatbot en 2023 aux États-Unis, il a tardé à le rendre disponible dans l'UE à cause des réglementations.
"L'année dernière, nous avons retardé l'entraînement de nos grands modèles de langage à l'aide de contenus publics pendant que les régulateurs clarifiaient les exigences légales. Nous saluons l'avis rendu par le Comité européen de la protection des données en décembre, qui a confirmé que notre approche initiale était conforme à nos obligations légales", a souligné Meta, se réjouissant de pouvoir "continuer à faire profiter les Européens de tous les avantages de l'IA générative".