Vous essayez d'acheter un article ou de vous connecter à un compte. Vous entrez vos informations d'identification, mais avant de continuer, vous devez prouver que vous êtes un être humain. Cochez la case "Je ne suis pas un robot". Vous pouvez voir une image floue avec des chiffres asymétriques que vous devez déchiffrer. Ce sont des CAPTCHA, et même s'ils peuvent être gênants, ils sont nécessaires.
N'est-ce pas ?
Que sont les CAPTCHA et comment fonctionnent-ils ? En quoi sont-ils différents des reCAPTCHA ? Et pourquoi beaucoup d'entre eux sont-ils si difficiles ?
CAPTCHA signifie Test de Turing public entièrement automatisé pour différencier les ordinateurs des humains. Ils tirent leur nom d'Alan Turing, le génie de la cryptanalyse qui a créé le test de Turing. C'est une façon d'examiner la pensée d'une machine, de vérifier si son comportement est indiscernable de celui d'un être humain.
Un test de Turing standard implique une personne réelle jugeant les sujets. Les CAPTCHA ne le font pas :ils sont généralement administrés par un ordinateur. En tant que tels, certains les appellent le "test de Turing inversé", tandis que d'autres les appellent la preuve de l'interaction humaine (HIP).
Les CAPTCHA ont été créés pour empêcher les bots de spammer des sites Web. Tout as de la technologie compétent peut créer un programme qui s'inscrit automatiquement sur des millions de comptes ; Les CAPTCHA sont conçus pour empêcher que cela ne se produise.
C'est parce que les ordinateurs ont du mal à déchiffrer un texte déformé --- ou du moins plus difficile que les humains. La plupart des CAPTCHA sont associés à différents dégradés de couleurs en arrière-plan, pour obscurcir davantage le message.
Il y a un débat sur qui a créé les CAPTCHA, bien que le terme ait été inventé par l'Université Carnegie Mellon de Pittsburgh en 2003.
L'équipe scientifique a postulé qu'ils pourraient être utilisés pour sécuriser les e-mails, les sondages en ligne et d'autres services nécessitant un enregistrement des robots des moteurs de recherche, des vers et des spambots, et des attaques par dictionnaire. Ils sont également utiles pour lutter contre les attaques par déni de service distribué (DDoS).
Le texte peut être vraiment obscurci, mais vous pouvez souvent encore comprendre ce qu'il signifie. Plus les symboles sont biaisés, plus un CAPTCHA est efficace. C'est parce que les humains présentent une paréidolie, un phénomène dans lequel notre cerveau essaie de donner un sens au hasard. C'est votre esprit qui essaie de mettre de l'ordre dans le chaos.
La paréidolie est la raison pour laquelle vous déduisez des visages là où ils ne devraient pas être --- dans les nuages, les bâtiments, les falaises, les arbres, les boissons, les fleurs, etc.
Les exemples les plus célèbres de cette bizarrerie psychologique concernent généralement la religion (avec des personnes prétendant voir Jésus dans leur nourriture) et l'astronomie. Vous connaîtrez Barnard 33 par son expression familière, la Nébuleuse de la Tête de Cheval, en raison de ses qualités équines; d'autres voient un lapin sculpté dans les cratères de la lune.
C'est aussi pourquoi vous pouvez distinguer des mots dans les CAPTCHA même lorsqu'ils sont barrés et déformés. Notre cerveau établit des connexions que les programmes informatiques ne peuvent généralement pas.
Luis von Ahn, ancien membre de l'équipe CAPTCHA de l'Université Carnegie Mellon, explique qu'il faut en moyenne neuf secondes pour résoudre un CAPTCHA. 92 % réussissent. Cela pourrait vous faire sentir stupide d'avoir saisi la mauvaise combinaison, mais cela ne devrait pas être le cas. Tout le monde fait partie des 8 % restants de temps en temps.
En fait, les taux d'échec passent de 8 % à près de 30 % si le CAPTCHA est sensible à la casse.
Le problème avec la déduction d'informations est que nous pouvons facilement déduire le faux information. Un « je » peut devenir un « 1 ». C'est encore plus difficile lorsque le CAPTCHA n'est pas composé de mots mais de lettres aléatoires.
Heureusement, les services savent que les humains sont faillibles et ne peuvent pas toujours lire un texte flou. La plupart des CAPTCHA vous offrent la possibilité d'en générer un nouveau, donc si vous rencontrez des difficultés, actualisez-le.
La principale raison pour laquelle les CAPTCHA peuvent être si difficiles est la nécessité. Les CAPTCHA ont évolué, tout comme les attaquants. L'intelligence artificielle (IA) peut lire même des textes particulièrement déformés avec une précision estimée à 99 %. Les CAPTCHA ont dû améliorer leur jeu.
Notamment, Google a considérablement avancé la technologie, mais nous y reviendrons.
Comment les programmes déjouent-ils le CAPTCHA ? Ils sont fissurés à l'aide d'algorithmes qui recherchent des formes particulières. Ceux-ci convertissent généralement la zone de texte en niveaux de gris, supprimant la distorsion causée par les artefacts de couleur. Ils se concentrent ensuite sur les modèles et les croisent avec des lettres et des chiffres standard.
L'algorithme prend, en fait, des suppositions éclairées lorsqu'il s'agit de chiffres qui restent non identifiés.
Les CAPTCHA posent de nombreux problèmes, en particulier pour les personnes handicapées. C'est particulièrement vrai pour les personnes malvoyantes ou souffrant de dyslexie.
Oui, les CAPTCHA se sont développés pour lutter plus efficacement contre les bots et devenir plus faciles pour les humains. Dans certains cas. Cela se fait de plusieurs manières importantes. La première est par la variation de la vérification. Un exemple largement utilisé consiste à remplacer du texte par des photos.
Des images peuvent vous être présentées dans une grille et vous devez cliquer sur chaque case affichant des panneaux de signalisation. Cela fonctionne si bien car les programmes souffrent de la vision par ordinateur, c'est-à-dire d'une difficulté à comprendre le contenu des images numériques.
Certaines IA peuvent différencier et comprendre ce qu'une photo contient. Pensez à la technologie DeepFace de Facebook, qui peut reconnaître les traits du visage et suggérer des profils. Néanmoins, ces types de CAPTCHA représentent un défi supplémentaire pour les robots --- un obstacle supplémentaire pour les attaques par force brute et leurs semblables.
Les images fonctionnent également bien pour ceux qui utilisent des smartphones et des tablettes :il est beaucoup plus facile de sélectionner les bons carrés. C'est-à-dire tant que ces photos se chargent correctement !
Une autre adaptation est le CAPTCHA audio, qui lit le texte pour ceux qui ont du mal à distinguer les chiffres. Ceux-ci sont souvent accompagnés d'un bruit de fond. Cela peut entraîner d'autres problèmes pour les spammeurs utilisant un logiciel de reconnaissance vocale.
L'autre évolution importante des CAPTCHA est l'intégration avec Google et l'introduction des reCAPTCHA. Et non, ce n'est pas tout à fait la même chose…
La plupart des CAPTCHA que vous voyez sont en fait des reCAPTCHA. Ce dernier fait le même travail que le premier, mais le surpasse en favorisant également l'apprentissage automatique.
De plus, les reCAPTCHA sont utilisés pour la numérisation des livres.
Ils ont été développés par la même équipe de l'Université Carnegie Mellon qui nous a donné le terme "CAPTCHA". Le logiciel open source visait à "préserver la littérature en déchiffrant un mot qui n'était pas lisible par les ordinateurs". En effet, chaque fois que vous déchiffrez un mot trouvé dans un reCAPTCHA, il est utilisé pour le machine learning. Vous aidez le programme à comprendre les différentes formes et modèles de symboles.
CAPTCHA est une combinaison aléatoire; reCAPTCHA se compose de mots ciblés que les bots n'ont pas pu analyser auparavant.
Il a été publié en 2007 et acquis par Google en 2009. Beaucoup considèrent Google comme un conglomérat massif auquel vous ne pouvez pas faire confiance, mais les reCAPTCHA ont fait beaucoup de bien. Deux ans seulement après l'acquisition, la technologie avait entièrement numérisé les archives de Google Books et du New York Times. Les deux sont des référentiels d'informations inestimables.
Il est ironique que la technologie puisse désormais comprendre efficacement le texte, rendant les reCAPTCHA redondants. C'est pourquoi Google a poussé l'idée plus loin.
Vous êtes-vous déjà demandé ce qui se passe lorsque vous cliquez sur "Je ne suis pas un robot" et continuez tout de suite, sans rien déchiffrer ? Le nouveau reCAPCTHA de Google analyse votre activité sur l'ensemble du site, puis vous attribue secrètement un score de probabilité pour déterminer si vous êtes un humain ou un bot.
Essentiellement, il s'agit de déterminer si vos interactions avec le service sont plus révélatrices d'une personne réelle ou d'un programme.
À mesure que les robots deviennent plus intelligents, les systèmes de sécurité doivent également progresser. ReCAPTCHA est une idée assez solide. Pour l'instant.
Mais beaucoup s'interrogent sur le pouvoir détenu par Google. L'intelligence artificielle peut reconnaître le comportement humain. Tenez compte de tout ce que Google sait déjà de vous et c'est certainement une source de préoccupation.