Publié

Répondre à un captcha, c'est travailler gratuitement pour Google

Exemple de captcha. [DR - DR]
Les captchas c'est quoi? / On en parle / 5 min. / le 27 avril 2021
Les captchas sont des formulaires censés protéger contre le spam qui demandent à l'internaute d'authentifier des mots ou des images afin de s'assurer qu'il n'est pas un robot. Les réponses données alimentent ensuite l'intelligence artificielle de Google.

Chaque jour, 200 millions d’internautes remplissent un captcha. En estimant que cette pratique prend en moyenne 10 secondes, les humains passent environ 500'000 heures par jour à prouver à une machine qu'ils ne sont pas des robots.

Les captchas farm

Initialement, la fonction d'un captcha est de protéger des spams en s'assurant que la personne est un humain et non un robot. Il existe cependant des moyens très simples de les contourner, comme les "captchas farm".

Celles-ci emploient des armées d'humains afin de résoudre les formulaires. Les robots peuvent alors envoyer leurs spams. Ces employés reçoivent 17 centimes pour mille captchas résolus.

Les captchas au service de Google

L'inventeur du captcha et fondateur de reCaptcha, Luis von Hahn, a vendu la société à Google en 2009. Interrogée, la multinationale explique volontiers: "Nous utilisons l'effort des humains pour résoudre des captchas afin de préserver les livres, améliorer les cartes et résoudre des problèmes complexes d’intelligence artificielles".

Quand le captcha vous demande de reconnaître des images comme des feux de signalisation, des véhicules ou des vélos, Google utilise les réponses obtenues pour éduquer son intelligence artificielle à la reconnaissance d'images de rue, notamment en vue de développer les voitures autonomes.

Numériser des livres

D'autres captchas vous demandent de reconnaître des mots. En y répondant, vous aidez Google à numériser des livres en identifiant les mots que la machine à numériser n'a pas reconnus. Le formulaire vous propose deux mots: l'un est connu par la machine, l’autre inconnu. Si dix personnes reconnaissent le mot illisible de la même manière, il est considéré comme reconnu et numérisé.

Grâce à ce système, 2,5 millions de livres sont digitalisés par les internautes tous les ans, souvent à leur insu. Ainsi, 750 millions de personnes, soit 10% de la population mondiale, ont aidé à digitaliser au moins un mot dans un livre.

Didier Bonvin / Meili Gernet

Publié