Deepseek: comment cette startup chinoise a évité les sanctions américaines sur les puces IA

Comment Deepseek, un chatbot développé par une petite entreprise chinoise, s'est-il retrouvé en position de (peut-être) saborder le travail de plusieurs grosses entreprises américaines spécialisées dans l'intelligence artificielle? La question a le mérite de se poser alors que la Chine est sous le coup d'un embargo américain sur les puces dédiées à l'intelligence artificielle.
Ce modèle d'IA, qui n'aurait coûté que 6 millions de dollars à produire, contre plusieurs centaines de millions pour ceux d'OpenAI ou encore Google, est en fait basé sur des puces Nvidia. Pour le faire fonctionner, la start-up Deepseek s'appuie sur des puces H800. Celles-ci ne sont pas les plus réputées dans le domaine, et ne sont d'ailleurs pas des produits considérés comme "haut de gamme".
Des puces sous embargo américain
Pourtant, selon l'entreprise basée à Hangzhou, cela serait largement suffisant pour faire tourner la troisième version de son modèle de langage, qui a été lancé le 10 janvier dernier.
Afin de s'organiser, Deepseek s'est surtout assuré d'avoir les stocks nécessaires. Elle a pour ce faire réussi à en commander suffisamment alors que les H800 n'étaient pas considérées comme "critiques" par les Etats-Unis. Ces puces devaient ne servir que sur des tâches restreintes, échappant donc à l'embargo américain.
Avec le temps, les puces H800 ont néanmoins été ajoutées dans le train de sanctions américain. Autrement dit, il n'a plus été possible pour Nvidia de les vendre à des entreprises chinoises. Un ajout tardif, qui semble avoir bénéficié à Deepseek.
Une victoire du logiciel libre?
Si plusieurs analystes se disent "stupéfaits" par l'incursion de Deepseek, notamment Holger Zschaepitz qui voit ce chatbot comme "la plus grande menace pour les marchés boursiers américains", c'est parce que si la Chine arrive vraiment à développer un modèle d'IA à bas coût, et ce, sans rogner sur la qualité des réponses, cela pourrait être un coup très dur pour les sociétés américaines.
Nvidia vend ses puces "premiums" à des prix très élevés, assurant qu'elles sont les seules à pouvoir faire fonctionner des modèles de langage très évolués. Si Deepseek prouve le contraire, il y a des chances que Nvidia en paye le prix fort. Son cours a d'ailleurs perdu près de 12% de sa valeur lundi, peu après l'annonce de Deepseek.
Yann Le Cun, directeur scientifique de l'IA chez Meta, a de son côté mis en avant un modèle conçu de manière ouverte, montrant qu'il était capable de "surpasser" des modèles propriétaires: "Car leur travail est publié et open source, tout le monde peut en profiter," s'est-il félicité.