Deepseek a-t-il triché? OpenAI affirme avoir des preuves que l'IA chinoise s'est appuyée illégalement sur son modèle

Le "ChatGPT chinois". C'est le surnom de Deepseek, une IA conçue par une start-up chinoise éponyme qui ne cesse de faire parler d'elle depuis quelques jours. Pour preuve, Deepseek est l’application gratuite la plus téléchargée sur le magasin d’applications d’Apple, supplantant ChatGPT.
Ce qui impressionne, ce sont ses capacités. Le nouveau modèle Deepseek R1 dévoilé ce week-end est capable de résoudre des problèmes complexes, en mathématiques ou en chimie par exemple. Des capacités équivalentes à celles des leaders américains du secteur, donc, obtenues à une fraction des coûts.
Une tricherie?
Mais comme le rapporte le Financial Times, le chatbot est accusé de tricherie. OpenAI, son principal concurrent, aurait des preuves que Deepseek s'est appuyé sur ses modèles d'algorithme pour automatiser l'entraînement de son propre modèle open-source à moindre frais.
Le créateur de ChatGPT affirme ainsi avoir observé des signes de "distillation massive". Cette technique utilisée par les développeurs consiste à utiliser les données d'un modèle d'IA pour en entraîner un autre et développer des capacités similaires plus facilement.
"C'est un problème lorsque vous [sortez de la plateforme] et que vous faites cette technique pour créer votre propre modèle à vos propres fins", précise une source proche d'OpenAI au média américain.
Deepseek aurait donc utilisé cette technique pour construire son propre modèle concurrent à moindre coût, ce qui constitue une violation de la politique d'utilisation d'OpenAI. Cette dernière précise en effet que ses utilisateurs n'ont pas le droit de "copier" aucun de ses services ni d'"utiliser les résultats pour développer des modèles qui concurrencent OpenAI".
Les doutes s'accumulent
Et OpenAI ne sont pas les seuls à avoir des doutes. Plusieurs experts en IA ont affirmé que Deepseek fournissait des réponses qui indiquaient qu'il avait été formé à partir de données provenant de ChatGPT-4 d'OpenAI.
David Sacks, le conseiller en IA et cryptomonnaies de Donald Trump, a confirmé à Fox News qu’il était "possible" que Deepseek ait "aspiré" les données d’OpenAI.
"Il existe des preuves substantielles que Deepseek a distillé les connaissances des modèles d’OpenAI", indique le responsable, sans pour autant fournir des preuves concrètes.
Il appelle les entreprises américaines, leaders du secteur, à prendre des mesures concrètes pour empêcher les concurrents de dérober leur savoir. De son côté, OpenAI a assuré "prendre des mesures pour protéger [sa] propriété intellectuelle".