Vous tentez d'acheter un produit ou de vous connecter à un compte. Après avoir saisi vos identifiants, un test s'affiche pour vérifier que vous êtes un humain. Cochez « Je ne suis pas un robot » et décryptez une image floue de chiffres déformés. Ces CAPTCHA, bien que frustrants, sont essentiels pour la sécurité en ligne.
Que sont les CAPTCHA ? Comment fonctionnent-ils ? En quoi diffèrent-ils des reCAPTCHA ? Et pourquoi sont-ils souvent si ardus ?
CAPTCHA signifie Completely Automated Public Turing test to tell Computers and Humans Apart (Test de Turing public entièrement automatisé pour différencier les humains des ordinateurs). Inspiré du test de Turing d'Alan Turing, pionnier de l'informatique, il évalue si une machine peut imiter un comportement humain.

Contrairement au test de Turing classique, jugé par un humain, les CAPTCHA sont automatisés par ordinateur. On les appelle parfois « test de Turing inversé » ou preuve d'interaction humaine (HIP).
Créés pour bloquer les bots spammeurs, ils empêchent l'inscription automatisée massive sur les sites web. Les humains décryptent plus facilement le texte déformé que les ordinateurs, surtout avec des fonds colorés et des distorsions.
Le terme CAPTCHA a été inventé en 2003 par l'Université Carnegie Mellon. Il sécurise e-mails, sondages, enregistrements et protège contre les attaques DDoS ou par dictionnaire.
Le texte est déformé pour exploiter la paréidolie humaine : notre cerveau discerne des formes dans le chaos, comme des visages dans les nuages ou la Nébuleuse de la Tête de Cheval.
Cette capacité nous permet de lire des lettres tordues que les algorithmes peinent à analyser.
Selon Luis von Ahn, co-créateur chez Carnegie Mellon, un CAPTCHA prend en moyenne 9 secondes à résoudre, avec 92 % de succès. Les 8 % d'échecs sont normaux, grimpant à 30 % si sensible à la casse. Les confusions comme « l » et « 1 » aggravent cela.
Les sites proposent un renouvellement. Leur difficulté croît avec l'IA : certains bots atteignent 99 % de précision via algorithmes en niveaux de gris et reconnaissance de motifs.
Google a innové pour contrer cela.
Ils posent des défis aux malvoyants ou dyslexiques. Les évolutions incluent : images (sélectionner des objets comme des panneaux), plus intuitives sur mobile ; audio avec bruit de fond ; et reCAPTCHA.
La vision par ordinateur des bots reste un frein.
Les reCAPTCHA, issus de Carnegie Mellon (2007, acquis par Google en 2009), numérisent livres (Google Books, New York Times) via mots réels indéchiffrables par OCR.
Contrairement aux CAPTCHA aléatoires, reCAPTCHA utilise des mots ciblés pour l'apprentissage automatique.
Le reCAPTCHA v3 analyse le comportement (score invisible) sans interaction, évaluant si vous êtes humain.
Avec l'essor de l'IA, les CAPTCHA évoluent. reCAPTCHA reste efficace, mais soulève des questions sur la collecte de données par Google.
[]