"Sélectionnez les feux de circulation": pourquoi les "captchas" sont devenus insupportables

Vous voyez ce feu tricolore? Ou ce scooter? Oui, tout le monde peut le voir. Mais il faut sélectionner chaque centimètre de ce véhicule à deux roues via des petits carrés pour accéder à un site web ou envoyer un message via un formulaire. Un peu trop de carrés sélectionnés, et vous revenez en arrière ou perdez tout ce que vous aviez écrit dans votre formulaire. Et même si vous avez eu l'impression de réussir, il faudra inlassablement recommencer avec des bus ou des voitures.
Ce problème est le quotidien de millions d'internautes qui ont de plus en plus de mal à répondre aux Captchas, des petits tests qui permettent de savoir si vous êtes un robot ou un véritable humain. Ne pas réussir signifie-t-il toutefois que vous êtes un robot? La réponse n'est pas aussi simple.
Non, vous n'êtes pas un robot
Avec les années, ces robots qui écument le web pour tenter de propager du spam se sont perfectionnés. L'intelligence artificielle permet d'ailleurs de plus en plus d'outrepasser les limitations développées, reconnaissant facilement ce que le Captcha réclame de l'utilisateur, à savoir identifier clairement ce qui est visible à l'écran (scooters, bus, feux tricolores, etc.).
Les créateurs de ces solutions doivent donc constamment revoir leur copie. C'est le cas de Google, qui s'est offert le service reCaptcha en 2009, aujourd'hui utilisé par quantité de sites internet.
Les plus simples (reCaptcha V1) se présentent sous la forme d'un texte écrit bizarrement (puisé dans Google Books et des articles du New York Times afin de les numériser), et qu'il faut donc retranscrire.

Les plus courants (ReCaptcha V2) sont donc des images à identifier case par case, parfois en plusieurs étapes, parfois pénibles.
L'interprétation que l'on se fait de la demande d'une information - par exemple un feu de circulation - peut mener à l'échec. Faut-il sélectionner les cases contenant la barre tenant ces feux? Cela dépend de la configuration du reCaptcha et de sa précision.
Qu'en est-il de ce petit millimètre de feu de circulation qui dépasse sur une case adjacente au reste? Faut-il vraiment le sélectionner? Là encore, c'est en fonction de la configuration de l'outil. Par moment, vous devrez sélectionner la case, parfois non. Certains Captchas seront plus sévères que d'autres, c'est aléatoire et donc par extension vite pénible.
Par ailleurs, et c'est moins connu, Google utilise cette reconnaissance d'images pour entraîner son intelligence artificielle maison. Si l'on vous demande de reconnaître un élément spécifique, c'est donc aussi pour faire en sorte que l'IA sache à quoi ça ressemble avec une diversité de photos très importante.

Et si l'on est bloqué dans une boucle de Captchas? Ce n'est probablement pas vous le problème. Il peut s'agir d'un bug, d'un problème lié à une extension de votre navigateur (comme un adblockers), ou tout simplement une mauvaise configuration du gestionnaire du site. Si vous vous retrouvez face à cette boucle, pas de panique: revenez plus tard ou contactez le responsable qui corrigera (peut-être) la faille.
La fin des images
Mais, pénible soit-elle pour les humains, cette solution a très vite rencontré ses limites: l'IA étant de plus en plus performante, les images à identifier par étape étaient facilement contournable.
Conscient du problème, Google a donc imaginé le NoCaptcha, appelé aussi ReCaptcha (V3). Autrement dit, il a mis à la poubelle aussi bien les textes que les images.
C'est la fameuse case "Je ne suis pas un robot" qui nécessite aucun effort supplémentaire. Pour simplifier la démarche, Google a changé sa méthode, en analysant les mouvements de l'utilisateur sur la page.
Un comportement normal va ainsi voir la souris d'abord scroller pour descendre en bas de page, mais le curseur de la souris va également se balader sur la page. Un comportement humain que les robots n'ont pas forcément, puisqu'ils vont immédiatement se diriger vers le Captcha et cocher la case "Je ne suis pas un robot". La case n'est d'ailleurs pas visible tout le temps et fonctionne en arrière-plan. Invisible, elle peut donc faire dans la tromperie et déceler les robots les plus manipulateurs.
"Il protège votre site web et ses applications mobiles contre le trafic abusif, sans compromettre l'expérience utilisateur," explique Google. "ReCaptcha (V3) utilise un mécanisme de détection invisible basé sur des scores pour différencier les utilisateurs légitimes des bots et d'autres attaques malveillantes."
Des sites web pas à jour
Mais la plupart des développeurs de sites web ne sont pas à jour, et n'implémentent donc pas le noCaptcha. Elle est pourtant importante. Comme l'écrit Nicolas Petetin, développeur chez Opteven, les problèmes rencontrés avec les V1 et V2 mettent de côté les personnes qui ont des problèmes de compréhension d'une image ou d'un texte, comme les personnes dyslexiques ou mal-voyantes:
"Un utilisateur humain peut rencontrer des difficultés à lire et comprendre les caractères/images présents sur un Captcha. Voilà pourquoi ils sont difficiles à déchiffrer, pour éviter qu'un ordinateur puisse faire pareil dans un temps raisonnable."
La fin des feux tricolores et des bus est finalement une bonne nouvelle pour tout le monde.