OpenAI reconnaît entraîner ChatGPT sur des contenus protégés par le droit d'auteur

Le succès de l'intelligence artificielle générative (IA) pose des questions juridiques complexes, notamment en ce qui concerne le droit d'auteur. OpenAI et Microsoft, son principal investisseur, font l'objet de plusieurs actions en justice pour violation d'œuvres protégées par le droit d'auteurs. Les deux entreprises sont accusées d'utiliser ces contenus pour entraîner les modèles de langage (LLM) d'OpenAI.
Or, dans le cadre d’une enquête de la commission des communications et du numérique de la Chambre des Lords du Royaume-Uni sur les modèles de langage, la startup a l'origine de ChatGPT a reconnu qu'il "serait impossible d'entraîner les meilleurs modèles d'IA d'aujourd'hui sans utiliser de documents protégés par le droit d'auteur", rapporte Engadget.
Selon OpenAI, il est actuellement impossible d'échapper au droit d'auteur qui couvre "pratiquement toutes les formes d'expression humaine y compris les articles de blog, les photographies, les messages de forum, les bouts de code de logiciel et les documents gouvernementaux".
OpenAI se retranche derrière le "fair use"
En outre, "l'utilisation de données d'entraînement dans des livres et des dessins du domaine public créés il y a plus d'un siècle pourrait donner lieu à une expérience intéressante, elle ne permettrait pas d'obtenir des systèmes d'IA qui répondent aux besoins des citoyens d'aujourd'hui", analyse la startup.
En parallèle, OpenAI a tente de redorer son blason en insistant sur respect de la législation sur le droit d'auteur en dépit des accusations formulées à son encontre. "L'entraînement de modèles d'IA à l'aide de contenus accessibles au public sur Internet est couvert par le principe de fair use", argue l'entreprise en évoquant ce principe légal américain selon lequel certains contenus protégés par des droits d'auteur peuvent être utilisés dans certaines circonstances.
Par ailleurs, OpenAI se dit "déçu" et "surpris" des accusations du New York Times, qui l'accuse d'utiliser sans autorisation les articles de presse qu'il a publiés. "Nos discussions avec le New York Times semblaient progresser de manière constructive jusqu'à notre dernière communication du 19 décembre. Les négociations portaient sur un partenariat de grande valeur autour de l'affichage en temps réel avec attribution dans ChatGPT, dans lequel le New York Times gagnerait un nouveau moyen de se connecter avec ses lecteurs existants et nouveaux, et nos utilisateurs auraient accès à leurs reportages", regrette le géant de l'IA dans un billet de blog en réponse au journal américain.