Tech&Co
Cybersécurité

"Slopsquatting": quand l'IA générative déroule le tapis rouge aux hackers

placeholder video
La génération de code avec l'IA n'est pas sans risque puisqu'elle peut créer des failles facilement exploitables. Le "slopsquatting" permet d'exploiter des lignes de codes inventées par l'IA.

L'intelligence artificielle générative est un outil formidable pour générer du code, surtout quand on n'a aucune notion en programmation. Mais une simple ligne de code générée par erreur peut rendre vulnérable l'ensemble d'un programme.

Une menace en particulier alerte les experts du domaine: le "slopsquatting". Cette faille, lorsqu'exploitée, crée une porte d'entrée aux hackers dans le programme, à l'insu de l'utilisateur inconscient.

Attention, code piégé

Le mot "slopsquatting" se décompose en deux. "Slop" est un terme anglais utilisé pour désigner le contenu de mauvaise qualité généré par IA.

"Squatting" vient du "typosquatting", une technique utilisée par les hackers qui consiste à s'approprier un lien internet avec un nom proche d'un site déjà existant. Les hackers espèrent qu'avec une faute de frappe, des internautes tombent sur ce site piège.

De la même manière, le "slopsquatting" est une technique où le hacker espère que l'IA se trompe lorsqu'elle génère un programme informatique. L'IA, parce qu'elle ne sait pas toujours quoi dire, peut inventer des lignes de codes. Parfois, elle place des lignes de codes qui téléchargent des fichiers en ligne via des faux liens inventés.

Des hackers peuvent écrire un prompt, souvent générique, demandant à un chatbot de générer du code. Ils regardent si l'IA invente des liens dans le code généré. On a testé avec ChatGPT qui nous a par exemple généré un code qui télécharge un fichier sur le site "exemple.com", site qui est aujourd'hui à vendre.

Ils peuvent alors s'approprier ce site pour y placer des fichiers malveillants. Tout utilisateur qui écrira le même prompt, générera le même code et téléchargera donc les fichiers empoisonnés du site.

Dans un rapport, une équipe de chercheurs américains estiment à 19,7% le pourcentage de code généré avec des contenus inventés potentiellement nuisibles.

Paquets empoisonnés

Prenons un exemple concret. En Python, langage informatique couramment utilisé, il existe par exemple la commande "pip install". Elle permet de télécharger des paquets dans une grande bibliothèque en ligne appelée l'Index de paquets Python.

"pip install mon_fichier" va par exemple aller chercher et télécharger le paquet appelé "mon_fichier". L'IA, lorsqu'elle invente, aime souvent prendre des noms génériques.

Il suffit qu'un hacker s'aperçoive que l'IA génère "pip install mon_fichier". Il a alors l'occasion de créer lui-même le paquet "mon_fichier", et d'y intégrer du code malveillant. Il le met ensuite en ligne (s'il n'existe pas déjà) en attendant que quelqu'un morde à l'hameçon.

Le prochain utilisateur qui générera un code grâce à cette IA où on retrouve la ligne "pip install "mon_fichier" téléchargera sur son ordinateur le paquet empoisonné mis en ligne par le hacker.

Cela marche évidemment avec toute autre commande qui permet de télécharger du contenu en ligne.

Théotim Raguet