CAPTCHA : Comment fonctionnent-ils et pourquoi sont-ils si difficiles à résoudre ?

Vous tentez d'acheter un produit ou de vous connecter à un compte. Après avoir saisi vos identifiants, un test s'affiche pour vérifier que vous êtes un humain. Cochez « Je ne suis pas un robot » et décryptez une image floue de chiffres déformés. Ces CAPTCHA, bien que frustrants, sont essentiels pour la sécurité en ligne.

Que sont les CAPTCHA ? Comment fonctionnent-ils ? En quoi diffèrent-ils des reCAPTCHA ? Et pourquoi sont-ils souvent si ardus ?

Qu'est-ce qu'un CAPTCHA ?

CAPTCHA signifie Completely Automated Public Turing test to tell Computers and Humans Apart (Test de Turing public entièrement automatisé pour différencier les humains des ordinateurs). Inspiré du test de Turing d'Alan Turing, pionnier de l'informatique, il évalue si une machine peut imiter un comportement humain.

CAPTCHA : Comment fonctionnent-ils et pourquoi sont-ils si difficiles à résoudre ?

Contrairement au test de Turing classique, jugé par un humain, les CAPTCHA sont automatisés par ordinateur. On les appelle parfois « test de Turing inversé » ou preuve d'interaction humaine (HIP).

Créés pour bloquer les bots spammeurs, ils empêchent l'inscription automatisée massive sur les sites web. Les humains décryptent plus facilement le texte déformé que les ordinateurs, surtout avec des fonds colorés et des distorsions.

Le terme CAPTCHA a été inventé en 2003 par l'Université Carnegie Mellon. Il sécurise e-mails, sondages, enregistrements et protège contre les attaques DDoS ou par dictionnaire.

Comment fonctionnent les CAPTCHA ?

Le texte est déformé pour exploiter la paréidolie humaine : notre cerveau discerne des formes dans le chaos, comme des visages dans les nuages ou la Nébuleuse de la Tête de Cheval.

Cette capacité nous permet de lire des lettres tordues que les algorithmes peinent à analyser.

Pourquoi les CAPTCHA sont-ils si difficiles ?

Selon Luis von Ahn, co-créateur chez Carnegie Mellon, un CAPTCHA prend en moyenne 9 secondes à résoudre, avec 92 % de succès. Les 8 % d'échecs sont normaux, grimpant à 30 % si sensible à la casse. Les confusions comme « l » et « 1 » aggravent cela.

Les sites proposent un renouvellement. Leur difficulté croît avec l'IA : certains bots atteignent 99 % de précision via algorithmes en niveaux de gris et reconnaissance de motifs.

Google a innové pour contrer cela.

Les limites des CAPTCHA

Ils posent des défis aux malvoyants ou dyslexiques. Les évolutions incluent : images (sélectionner des objets comme des panneaux), plus intuitives sur mobile ; audio avec bruit de fond ; et reCAPTCHA.

La vision par ordinateur des bots reste un frein.

CAPTCHA vs reCAPTCHA : quelle différence ?

Les reCAPTCHA, issus de Carnegie Mellon (2007, acquis par Google en 2009), numérisent livres (Google Books, New York Times) via mots réels indéchiffrables par OCR.

Contrairement aux CAPTCHA aléatoires, reCAPTCHA utilise des mots ciblés pour l'apprentissage automatique.

Le reCAPTCHA v3 analyse le comportement (score invisible) sans interaction, évaluant si vous êtes humain.

Faciles pour les humains, impitoyables pour les bots ?

Avec l'essor de l'IA, les CAPTCHA évoluent. reCAPTCHA reste efficace, mais soulève des questions sur la collecte de données par Google.

[]

SMH : Que signifie cette abréviation et comment l'utiliser sur les réseaux sociaux ? Les 8 Meilleurs Jeux de Réalité Augmentée pour Enfants (iOS et Android)

Poids numériques Tonal et NordicTrack : comment fonctionnent-ils ? Guide expert

Câbles sous-marins : définition, histoire et importance pour Internet mondial

Centres de données : définition, histoire et rôle essentiel dans le numérique

Répéteurs Wi-Fi : fonctionnement et utilisation des amplificateurs pour étendre votre réseau

Comment fonctionnent les émulateurs ? Émulation vs virtualisation expliquée

USB-PD expliqué : Comment fonctionnent les chargeurs d'alimentation rapides ?