BlogBang

Faire de l’OCR gratuitement avec Google Docs

scan Faire de lOCR gratuitement avec Google Docs

OCR, ça veut dire Optical Character Recognition. C’est une technologie assez ancienne maintenant qui permet de transformer en texte, le scan d’un document. C’est assez pratique et utilisé dans la numérisation de documents ou de livres (comme pour la bibliothèque de Google).

Le truc, c’est que pour en faire chez vous, vous devez être équipé d’un logiciel d’OCR. Le plus souvent, ceux qui sont livrés avec les scanners sont moisis…. Il en existe des payants comme Omnipage mais ça coute quand même assez cher. Une autre solution qui vient de sortir, c’est d’utiliser la technologie de Google, qui je dois le dire est assez performante (sans être parfaite encore).

Transformer le texte d’une image JPG (ou autre) en texte exploitable dans un traitement de texte type Word, n’est pas encore une fonctionalité officielle de Google Docs… mais elle existe !

Un petit malin a donc crée un script qui vous permet d’uploader une image et de récupérer le texte directement dans un Google Doc… Vraiment pratique !

Capture 155 Faire de lOCR gratuitement avec Google Docs

Le script est dispo ici

[Photo]

Publicité

Je vous recommande aussi la lecture des sujets suivants


Faites un lien vers cette news sur votre site



21 commentaires

  1. lemulot Reply to this comment


    J’ai deja vu l’info ce matin mais je m’interroge sur la possibilite de faire un script pour decrypter les captcha voir meme les ‘recaptcha’ ? (reCaptcha viens d’etre acheter par google)

    Ou alors il ont justement mis un captcha pour utilise la fonction ?

    Posté le 30 septembre 2009 à 10:41:02

  2. Trouver un voyage Reply to this comment


    reCaptcha a été racheté par google dans l’optique d’utiliser l’utilisateur lors d’une inscription a un de ces services. En effet un captcha va être soumis a l’utilisateur a la fin de son inscription, et ce captcha sera en faite des caractères que OCR n’aurait pas reconnu… Tout sa dans l’optique de mettre a disposition google books très bientôt.

    Pas bête google =)

    Posté le 30 septembre 2009 à 11:10:10

  3. laurent Reply to this comment


    Si les logiciels fournis d’OCR sont moisis, publier une news sur une fonctionnalité qui n’est plus fonctionnelle, ça ressemble aussi à du moisi… :)

    Posté le 30 septembre 2009 à 11:53:33

  4. SolykZ Reply to this comment


    @Trouver un voyage: Woot, ‘faut quand même être vachement tordu pour penser à un truc pareil. :|

    Ahahah, et les plaintes pour recevoir une rémunération pour chaque captcha rempli, c’est pour quand ? :P

    Posté le 30 septembre 2009 à 11:55:00

  5. Korben Reply to this comment


    @laurent: gna gna gna… :-p
    j’ai enlevé l’edit, ça marche très bien maintenant

    Posté le 30 septembre 2009 à 12:01:52

  6. Arnaud E. Reply to this comment


    Je teste ca de suite :)

    Posté le 30 septembre 2009 à 12:12:47

  7. nephanddi Reply to this comment


    Je dois pas arriver au bon moment, j’obtiens une erreur moi :(
    Error processing document:
    Unable to read response, or response is empty

    Posté le 30 septembre 2009 à 12:18:53

  8. Micky Reply to this comment


    gocr et pas mal non plus.
    je l’avais utiliser pour lire des petites phrases.
    ca marche plutot bien. Bien que la curiosité entre windows/linux avec la MEME version de ce logiciel est bhin… linux s’en sort mieux… allez savoir pourquoi…
    mais pas bete google docs!

    Posté le 30 septembre 2009 à 12:21:06

  9. Arnaud E. Reply to this comment


    Hmmm … pas fameux… mon « ABBYY FineReader » fourni avec mon imprimante à 35€ fait mieux :D

    Il a du mal sur les pages de livres et sur les caractères ambigues du style un « J » qu’il remplace par un « I »… bref plein d’imperfections :(

    Posté le 30 septembre 2009 à 12:54:25

  10. Tortue Tordue Reply to this comment


    Si vous vous lancez dans l’OCR avec un logiciel, je vous conseille ABBYY Finereader plutôt qu’Omnipage. J’ai eu la chance de pouvoir tester les deux. Finereader l’emporte haut la main. Attention toutefois au portefeuille !

    Posté le 30 septembre 2009 à 12:56:42

  11. Arnaud E. Reply to this comment


    @Tortue Tordue: Finereader était fourni avec une imprimante en promo sur cdiscount pour ma part :D

    Posté le 30 septembre 2009 à 13:01:36

  12. the impossible thrill Reply to this comment


    @Arnaud E.: et @Tortue Tordue:
    Effectivement ABBYY finereader est un bijoux que je ne regrette à aucun moment d’avoir téléchargé acheté.

    Posté le 30 septembre 2009 à 13:25:43

  13. kriok Reply to this comment


    Pour ma part j’ai essayé sur des messages d’erreur sans succès (page vide).
    Dommage ça m’aurait bien servit.

    Sinon c’est la première fois que je réponds mais je lit avec assiduité le blog ;) Bravo Kroben faut continuer et pas faire du Quake live;)

    Posté le 30 septembre 2009 à 13:58:39

  14. SphaX Reply to this comment


    Article grandiose et très utile ! Merci korben !

    Posté le 30 septembre 2009 à 14:19:17

  15. Trouver un voyage Reply to this comment


    @SolykZ : C’est une technique utilisé par les spammeurs du monde entier. Ils utilisent un site porno en couverture, avec obligation pour l’utilisateur de s’inscrire pour accéder aux contenus du sites. Lors de son inscription l’utilisateur rempli un captcha mais celui ci correspond au captcha d’un site tout a fait honnête auquel le spammeur veut accéder et ce sert de l’utilisateur pour le remplir.

    L’utilisateur pense remplir un simple captcha pour s’inscrire sur un site porno mais en faite il contribue aux spam mondial… mouahahahahahahaha :P

    Posté le 30 septembre 2009 à 15:27:26

  16. ponky Reply to this comment


    Sinon y’a ça :

    http://www.korben.info/reconnaissance-de-texte-a-partir-dune-image-entierement-online.html

    Posté le 30 septembre 2009 à 16:08:39

  17. Mask Reply to this comment


    http://www.free-ocr.com/
    Nickel, limité a 10 upload/heure

    Posté le 30 septembre 2009 à 16:18:54

  18. Location Vacance Reply to this comment


    Très bonne info utile, Google continu à se diversifier dans ces applications toujours gratuites. Merci Korben pour cette info…

    Posté le 1 octobre 2009 à 12:26:12

  19. elban44 Reply to this comment


    Si on se fait hacker son compte Google : c’est simple on est mort. Je précise que j’adore les outils google.

    http://a.drouan.free.fr/

    Posté le 2 octobre 2009 à 09:30:17

  20. Avalanche de nouveautés | Le blog d'Arnaud Vallière Reply to this comment


    [...]  La reconnaissance de caractère est possible avec GoogleDocs. Cela pourrit être intéressant, couplée avec le lien précédent. [...]

    Posté le 12 octobre 2009 à 20:47:14

  21. Daous Reply to this comment


    Bonjour,
    Moi j’utilise la version d’essai de Finereader et je ne parviens a garder le fond de page du document scanner. Je ne veux modifier que certains textes. Comment est ce que je peux faire?
    Dois je acquérir la version payante pour le faire?

    Merci pour votre aide

    Daous

    Posté le 28 novembre 2009 à 23:03:12