Faire de l’OCR gratuitement avec Google Docs
Par Korben | Nb visites : 709

OCR, ça veut dire Optical Character Recognition. C’est une technologie assez ancienne maintenant qui permet de transformer en texte, le scan d’un document. C’est assez pratique et utilisé dans la numérisation de documents ou de livres (comme pour la bibliothèque de Google).
Le truc, c’est que pour en faire chez vous, vous devez être équipé d’un logiciel d’OCR. Le plus souvent, ceux qui sont livrés avec les scanners sont moisis…. Il en existe des payants comme Omnipage mais ça coute quand même assez cher. Une autre solution qui vient de sortir, c’est d’utiliser la technologie de Google, qui je dois le dire est assez performante (sans être parfaite encore).
Transformer le texte d’une image JPG (ou autre) en texte exploitable dans un traitement de texte type Word, n’est pas encore une fonctionalité officielle de Google Docs… mais elle existe !
Un petit malin a donc crée un script qui vous permet d’uploader une image et de récupérer le texte directement dans un Google Doc… Vraiment pratique !
[Photo]
Je vous recommande aussi la lecture des sujets suivants
- Le code de Google Analytics a changé. Il faut mettre à jour vos sites…
- Devenez un « power user of Facebook » avec ces scripts greasemonkey
- Petit raccourci clavier que je me note dans un coin
- Comment déchiffrer un texte caché avec Photoshop
- Comment intégrer une image haute résolution dans votre site en utilisant Google Map
- J’utiliserai Google avant de poser des questions à la con… J’utiliserai Google avant de poser des questions à la con… J’utiliserai Google avant de poser des questions à la con…
- La réécriture d’url pour les nuls
- Reconnaissance de texte à partir d’une image entièrement online
- La licence Creative Commons selon Microsoft
- Google annonce son Native Client dans Chrome








lemulot
J’ai deja vu l’info ce matin mais je m’interroge sur la possibilite de faire un script pour decrypter les captcha voir meme les ‘recaptcha’ ? (reCaptcha viens d’etre acheter par google)
Ou alors il ont justement mis un captcha pour utilise la fonction ?
Posté le 30 septembre 2009 à 10:41:02
Trouver un voyage
reCaptcha a été racheté par google dans l’optique d’utiliser l’utilisateur lors d’une inscription a un de ces services. En effet un captcha va être soumis a l’utilisateur a la fin de son inscription, et ce captcha sera en faite des caractères que OCR n’aurait pas reconnu… Tout sa dans l’optique de mettre a disposition google books très bientôt.
Pas bête google =)
Posté le 30 septembre 2009 à 11:10:10
laurent
Si les logiciels fournis d’OCR sont moisis, publier une news sur une fonctionnalité qui n’est plus fonctionnelle, ça ressemble aussi à du moisi…
Posté le 30 septembre 2009 à 11:53:33
SolykZ
@Trouver un voyage: Woot, ‘faut quand même être vachement tordu pour penser à un truc pareil.
Ahahah, et les plaintes pour recevoir une rémunération pour chaque captcha rempli, c’est pour quand ?
Posté le 30 septembre 2009 à 11:55:00
Korben
@laurent: gna gna gna… :-p
j’ai enlevé l’edit, ça marche très bien maintenant
Posté le 30 septembre 2009 à 12:01:52
Arnaud E.
Je teste ca de suite
Posté le 30 septembre 2009 à 12:12:47
nephanddi
Je dois pas arriver au bon moment, j’obtiens une erreur moi
Error processing document:
Unable to read response, or response is empty
Posté le 30 septembre 2009 à 12:18:53
Micky
gocr et pas mal non plus.
je l’avais utiliser pour lire des petites phrases.
ca marche plutot bien. Bien que la curiosité entre windows/linux avec la MEME version de ce logiciel est bhin… linux s’en sort mieux… allez savoir pourquoi…
mais pas bete google docs!
Posté le 30 septembre 2009 à 12:21:06
Arnaud E.
Hmmm … pas fameux… mon « ABBYY FineReader » fourni avec mon imprimante à 35€ fait mieux
Il a du mal sur les pages de livres et sur les caractères ambigues du style un « J » qu’il remplace par un « I »… bref plein d’imperfections
Posté le 30 septembre 2009 à 12:54:25
Tortue Tordue
Si vous vous lancez dans l’OCR avec un logiciel, je vous conseille ABBYY Finereader plutôt qu’Omnipage. J’ai eu la chance de pouvoir tester les deux. Finereader l’emporte haut la main. Attention toutefois au portefeuille !
Posté le 30 septembre 2009 à 12:56:42
Arnaud E.
@Tortue Tordue: Finereader était fourni avec une imprimante en promo sur cdiscount pour ma part
Posté le 30 septembre 2009 à 13:01:36
the impossible thrill
@Arnaud E.: et @Tortue Tordue:
Effectivement ABBYY finereader est un bijoux que je ne regrette à aucun moment d’avoir
téléchargéacheté.Posté le 30 septembre 2009 à 13:25:43
kriok
Pour ma part j’ai essayé sur des messages d’erreur sans succès (page vide).
Dommage ça m’aurait bien servit.
Sinon c’est la première fois que je réponds mais je lit avec assiduité le blog
Bravo Kroben faut continuer et pas faire du Quake live;)
Posté le 30 septembre 2009 à 13:58:39
SphaX
Article grandiose et très utile ! Merci korben !
Posté le 30 septembre 2009 à 14:19:17
Trouver un voyage
@SolykZ : C’est une technique utilisé par les spammeurs du monde entier. Ils utilisent un site porno en couverture, avec obligation pour l’utilisateur de s’inscrire pour accéder aux contenus du sites. Lors de son inscription l’utilisateur rempli un captcha mais celui ci correspond au captcha d’un site tout a fait honnête auquel le spammeur veut accéder et ce sert de l’utilisateur pour le remplir.
L’utilisateur pense remplir un simple captcha pour s’inscrire sur un site porno mais en faite il contribue aux spam mondial… mouahahahahahahaha
Posté le 30 septembre 2009 à 15:27:26
ponky
Sinon y’a ça :
http://www.korben.info/reconnaissance-de-texte-a-partir-dune-image-entierement-online.html
Posté le 30 septembre 2009 à 16:08:39
Mask
http://www.free-ocr.com/
Nickel, limité a 10 upload/heure
Posté le 30 septembre 2009 à 16:18:54
Location Vacance
Très bonne info utile, Google continu à se diversifier dans ces applications toujours gratuites. Merci Korben pour cette info…
Posté le 1 octobre 2009 à 12:26:12
elban44
Si on se fait hacker son compte Google : c’est simple on est mort. Je précise que j’adore les outils google.
http://a.drouan.free.fr/
Posté le 2 octobre 2009 à 09:30:17
Avalanche de nouveautés | Le blog d'Arnaud Vallière
[...] La reconnaissance de caractère est possible avec GoogleDocs. Cela pourrit être intéressant, couplée avec le lien précédent. [...]
Posté le 12 octobre 2009 à 20:47:14
Daous
Bonjour,
Moi j’utilise la version d’essai de Finereader et je ne parviens a garder le fond de page du document scanner. Je ne veux modifier que certains textes. Comment est ce que je peux faire?
Dois je acquérir la version payante pour le faire?
Merci pour votre aide
Daous
Posté le 28 novembre 2009 à 23:03:12