Google Books (lancé en 2004) et ses quinze millions de livres numérisés représentent de loin la plus grande bibliothèque numérique du monde. Une prouesse que la firme Californienne n’aurait en réalité pas accompli seule.
En effet, tout commence en 2009 lorsque Google se décide à acheter reCaptcha, une start-up spécialisée dans (vous l’aurez deviné): les captchas, ces petites images à déchiffrer et qui servent à distinguer les robots des humains.
Un captcha est toujours composé de deux mots dont le premier est un mot « test » utilisé pour vérifier si vous êtes un humain ou une machine. Tandis que le second est en réalité un mot contenu dans un livre numérisé que Google n’est pas parvenu à déchiffrer. Soumis à de nombreux utilisateurs, ce mot est enregistré par l’algorithme Google au bout de plusieurs réponses identiques de façon à ce que, par la suite, le système puisse plus facilement le reconnaître. Et c’est ainsi que nous, petits internautes, nous contribuons involontairement à parfaire la numérisation des livres de Google Books.
Selon le magazine américain Science, si tous les captchas utilisées sur la toile étaient mis à profit, nous pourrions retranscrire environ 160 livres par jour.









![[VDS] Samsung Galaxy S2](http://www.journaldugeek.com/files/2012/05/img_S2dimensions-39x39.jpg)

![[VDS] Barnes & Noble Nook Tablet + bonus](http://www.journaldugeek.com/files/2012/05/SAM_52181-39x39.jpg)
![[CARTE SON] CREATIVE X-FI SURROUND 5.1 PRO](http://www.journaldugeek.com/files/2012/05/122655-39x39.jpg)




![[Vends] Sony Xperia S](http://www.journaldugeek.com/files/2012/05/test-xperia-s-06-39x39.jpg)







Le Journal du Geek
lnki
19 oct, 2011, 09:27 #1MaW
19 oct, 2011, 09:28 #2Arelyth
19 oct, 2011, 09:28 #3Beowulf
19 oct, 2011, 09:28 #4RCKblog
19 oct, 2011, 09:29 #5Gulielmus
19 oct, 2011, 09:31 #6Vaal
19 oct, 2011, 09:34 #7(Qui ne le savait pas ???)
sammmmh
19 oct, 2011, 09:35 #8Tardu
19 oct, 2011, 09:35 #9benjyyyyy
19 oct, 2011, 09:37 #10lainiwaku
19 oct, 2011, 09:40 #11sa y est , c’est google, donc c’est mal ?!
je vois pas la mal la dedans
nicoulou
19 oct, 2011, 09:40 #12Twipeep
19 oct, 2011, 09:40 #13urzhiataer
19 oct, 2011, 09:41 #14Le technocentre qui exploite les humains à leur insu
Deckard
19 oct, 2011, 09:42 #15tetsuhito
19 oct, 2011, 09:44 #16tant qu’il mette pas une pub a la place ou il faut taper un slogan qui te rentre bien ds le crane ça va
hugo
19 oct, 2011, 09:48 #17« I’m sorry, are you from the past ? » /roy
alphacentaury
19 oct, 2011, 09:48 #18@Tardu : je m’étais effectivement rendu compte que le deuxième mot passait même si on avait mal tapé
@Nicoulou : tu as que ça à faire de regarder les conditions d’utilisations de reCaptacha ?
mikadannagrram
19 oct, 2011, 09:53 #19C’était un plaisir à lire !
Quentin
19 oct, 2011, 09:54 #20C’est une idée plutôt bonne, et qui est utile en plus!!!!
iMLovinIt
19 oct, 2011, 09:57 #21Mais c’est TRES FACILE de savoir quel mot est le captcha, et lequel est issu du livre.
Dans votre illustration c’est « confisqué(e) » qu’ils veulent numériser.
Du coup, a chaque fois pour ce mot je rentre une vulgarité.
Ici, j’aurai mis « connard lantcle ».
C’est petit comme humour, mais ca me fait marrer de pourrir leur base, et ca passe très bien
xrtyuio
19 oct, 2011, 10:06 #22« Selon le magazine américain Science, si tous les captchas utilisées sur la toile étaient mis à profit, nous pourrions retranscrire environ 160 livres par jour. »
Je pense qu’ils font plusieurs vérifications pour chaque mot à cause de nos amis 4chaniens qui écrivent « nigger » à la place du second mot^^
handicap
19 oct, 2011, 10:12 #23Moi je ne le savais pas !
Trololol
19 oct, 2011, 10:21 #24C’est pour cela que je propose que nous marquions tous connard pour le captcha, si le mot arrive plusieurs fois, il sera bien dans le livre et trololol….
vink
19 oct, 2011, 10:28 #25bref google scie la branche sur laquelle ils sont assis.
Explicit
19 oct, 2011, 10:42 #26@urzhiataer, Hypérion c’est de Dan Simmons, pas Dan Brown
Sinon c’est vrai que je connaissait l’info depuis un certain temps, et ça me motive peut être plus à déchiffrer correctement certains Captcha
J4N
19 oct, 2011, 10:54 #27Zetura
19 oct, 2011, 11:07 #28Ce n’est pas parce qu’on dit que la news est ancienne et que vous, vous ne saviez pas, qu’il faut être aigri et nous en vouloir de nous tenir au courant, quand l’actualité EST une actualité ^^ (je parle aux personnes cliquant sur les « - » pas au rédacteur de la news ;))
liquidwolf
19 oct, 2011, 11:15 #29Enfin ce n’est que mon point de vue!
krimog
19 oct, 2011, 11:15 #30Merci au JDG pour l’info.
Raipak
19 oct, 2011, 11:23 #31AlexMurphy
19 oct, 2011, 11:25 #32vince
19 oct, 2011, 11:44 #33secosse
19 oct, 2011, 11:57 #34@vink pt1 ! c’est pas con !! j’y avais pas pensé… bientôt les Captcha retranscrirons les hyeroglyphe !
christobal
19 oct, 2011, 12:09 #35je ne le savais pas non plus.
Donc en fait on peut saisir n’importe quoi pour le deuxieme mot ?
Mahad
19 oct, 2011, 12:12 #36PS : On se voit à la Geeks Live
zoroz
19 oct, 2011, 12:20 #37Pas idiot comme système.
Pour ceux qui parlent de pourrir la base de donné, excusez moi, mais quel intérêt ?
Plus il y aura de copies (papier/numérique etc.) d’un savoir quelconque, plus il a de chance d’être préservé.
Boudieu
19 oct, 2011, 12:22 #38Le problème avec ce genre de trucs, c’est l’utilisation qui peut en être faite. Si livre du domaine public et gratuit… OK.
Mais rien ne garantit qu’il n’est pas utilisé pour du livre payant… et là, grosso modo, tu contribues à corriger la typo du livre sans contrat de travail avec la tune qui rentre dans les poches de Google et éditeur…
Et ce point-là, il n’a jamais été spécifié nulle part dans leurs conditions… (et autant dire qu’avec les accords signés avec éditeurs qui ne disposent pas d’un fichier source numérique, l’OCR va tourner à plein… et recatchpa aussi par la même occasion).
Blah.
19 oct, 2011, 12:51 #39Mdr, ça me fait penser à de l’esclavage.
Mais bon, ce n’est pas si mal finalement. C’est pour nous que Google le fait (en théorie)
cslevine
19 oct, 2011, 12:51 #40Ah merci intéressant ! Je comprends mieux pourquoi je n’échoue jamais à ce genre de captchas : un hyper facile à gauche, et celui de droite plus difficile, mais toujours cool
Ben le lecteur
19 oct, 2011, 13:07 #41Google te fournit un service de recherche entièrement gratuit, financé par la publicité, que tu n’est d’ailleurs pas obligé de voir (adblock inside). Mais ce n’est pas encore assez, il faut que TOUT soit gratuit.
Je te propose de payer un euro à chaque fois que tu utilises les services de Google. On va rigoler. A défaut, je propose que ton travail soit gratuit et on rigolera encore plus.
Perso, c’est peut-être vieux comme nouvelle, mais je ne le savais pas. A partir du moment où c’est dans les conditions d’utilisation de Google, et relativement innoçent, je ne vois pas le problème.
Un article du JDG impec, sans faute qui pique les yeux, clair, bien mené et informatif. Si Ben pouvait copier.
antoine
19 oct, 2011, 13:42 #42silent auben
19 oct, 2011, 15:16 #43Je ne le savais pas non plus, une bonne idée de Google, et un article qui m’a beaucoup intéressé même si bien trop court ( le travail de traduction effectué par Google mériterai un article plus conséquent ).
tewi
19 oct, 2011, 15:27 #44ok, intéressant; au fait, ca veut dire quoi « lantcle » le 2eme mot dans le captcha de demo??
nargek
19 oct, 2011, 17:31 #45Pas con, pas con du tout !
Jack87
19 oct, 2011, 18:17 #46Peut on changer le titre de cette news?
Parce que « à votre insu » ? —> ça à déjà été dit dans les post précédent, ceci est écrit dans les conditions de googles.
Merci donc de changer le titre de cette news. Ok pour l’information, mais non à la désinformation.
Dr3amer
19 oct, 2011, 18:33 #47Pour ceux qui veulent tenter de pourrir la base du système, vous pensez sérieusement réussi à faire retranscrire le mot connard en demandant à vos 300 amis facebook de le taper ? La vérification ne se fait pas des centaines, ni des milliers de fois mais certainement des dizaines de milliers pour qu’une tendance se démarque largement des autres et ainsi être sûr à 99,99% que le mot recopié sera le bon. Donc du coup, bon courage..
Bernard_David
19 oct, 2011, 20:46 #48Merci Google de pouvoir nous aider en numérisant les livres, c’est pas l’Etat français ou une société française qui pourrait.
thebatman
19 oct, 2011, 21:31 #49J’ai le choix entre « Je me coucherai moins bête » et « Je le savais déjà ! »
dalgeek
19 oct, 2011, 23:53 #50Quoi? On bosse pour Google sans le savoir et en plus sans salaire….
REVOLUTION ! ! ! !