Scansionare e convertire una pagina scritta di un libro in testo modificabile (OCR)

Qualche settimana fa mi è stato chiesto di ricopiare molte pagine di un libro di testo su Microsoft Word. Senza esitare ho deciso non di copiare manualmente le pagine, ma di affidarmi ad un programma di riconoscimento ottico dei caratteri (OCR).

I programma di riconoscimento ottico dei caratteri sono in grado di convertire la scansione di una pagina scritta di un libro in testo modificabile. Se si esegue, infatti, una semplice scansione di una pagina di un libro, il suo testo non è per ovvi motivi modificabili.

La prima cosa che ho fatto è stata quindi quella di scansionare le pagine scritte del libro da convertire in testo modificabile. A questo punto, le ho date in pasto a TopOCR, uno dei migliori programmi di OCR completamente gratuito, che lo ha trasformato in pochi secondi in testo modificabile.

Dopo aver identificato a colpo d’occhio e corrette le parole non riconosciute da TopOCR, ho terminato il mio lavoro. Utilizzare un programma di OCR è, infatti, molto più facile e veloce rispetto a copiare manualmente le varie pagine del libro!

Scanner(Foto GE Healthcare Typhoon 9400 scanner di jepoirrier)

Scaricare ed installare TopOCR

Collegati sul sito Internet di TopOCR e fai click sull’icona a forma di macchina fotografica per scaricare il programma. Al termine dello scaricamento, apri, facendo doppio click su di esso, il file scaricato (topocr.exe).

Nella finestra che si apre, fai click sul pulsante Next e poi accetta il contratto di licenza del programma, facendo click sul pulsante I Agree. A questo punto, per terminare l’installazione fai click prima sul pulsante Install e poi sul pulsante Finish.

TopOCR

Usare TopOCR per il riconoscimento

La finestra principale di TopOCR è divisa in due sezioni: a sinistra viene mostrata l’immagine del libro, mentre a destra il suo riconoscimento sottoforma di testo modificabile.

TopOCR

Per fare analizzare una immagine di una pagina di testo scansionata, fai click, nella finestra di sinistra, sul menu File e poi sulla voce Open…. Nella finestra che si apre, cerca fra le cartelle del tuo computer e seleziona, facendo doppio click su di essa, l’immagine scansionata.

Essa viene subito analizzata e il suo risultato mostrato, come già anticipato, nella finestra di destra. Dagli esperimenti che ho effettuato, il riconoscimento è di buona fattura e gli errori sono minimi, facilmente correggibili effettuando il confronto con l’immagine del libro.

TopOCR

Per salvare il testo ottenuto, fai click, nella finestra di destra, sul menu File e poi sulla voce Save. Se vuoi modificare il testo con altri programmi, ti consiglio di salvarlo in formato RTF.

TopOCR

Ricevi gratuitamente i nuovi articoli sull'informatica di Salvatore Aranzulla nella tua casella email:


13 Commenti a “Scansionare e convertire una pagina scritta di un libro in testo modificabile (OCR)”

  1. Luca

    Certo che ne sai un sacco di cose Salvatore!! Questa e’ stata utilissima, pensa che stavo copiando su file di testo il ricettario per mia mamma e invece ora andro’ a comprarmi uno di questi oggettini e zac.. il lavoro e’ fatto.
    Chissa’ dove hai imparato queste cose.. ma via all Universtia’ di Informatica?? Sei proprio un esperto informatico, complimenti ancora!

    G.

  2. NavBack

    Bello!
    Conoscevo già l’OCR, ma i software che provavo facevano molti errori!
    Di questo invece sono soddisfatto!

  3. Da UNO CHE STUDIA IN ING INFORMATICA

    @LUCA
    Non associare il concetto di ingegneria informatica con quello di “smanettone” o appassionato informatico. In ing Informatica queste cose non si spiegano, anzi per dirla tutta all’università si impare ad apprendere non si apprende molto del mondo del lavoro se non le basi per crescere da soli!!!

  4. karmo

    beh alla fine i suoi articoli non sono altro che una ricerca su google! purtroppo non tutti sono capaci di cercare le parole giuste…..

  5. Riccardo

    @Karma, non è solo questione di cercare.
    Giustamente tu dici “cercare le parole giuste”, ma aggiungerei: spiegare in modo chiaro, aggiungere le immagini giuste, dire cose nuove…

  6. carlo

    Infatti se proprio dovete fare l’università non andate ad ing informatica. Qua a pisa la facoltà è pessima. Alti costi, strumenti didattici e edifici fatiscenti, professori che si credono degli dei in terra… meno male ho smesso!

  7. Damy

    Ciao a tutti! Volevo sapere se questo programma è totalmente gratuito e se è disponibile in italiano (purtroppo odio l’inglese!)…Ciao!!!

  8. takeshi

    Ciao! Ma l’OCR è efficace anche con i manoscritti in corsivo?

  9. alessandro

    Ho usato tempo fa l’OCR per trasformare pagine di libri in documenti word. Col TopOCR è possibile farlo?
    Grazie
    Alessandro

  10. Alessandro

    Il problema è lo scanner piano, la pagina di un libro non sempre si riesce a spinarla sullo scanner. Credevo esistessero scanner mobili adatti a posarla sulla pagina.
    Oppure fotografare con la digitale e poi trasferirla sul PC e poi usare un OCR per
    trasferirlo in word. Ma è veramente complicato!

  11. Davide

    Ciao. Scusate la domanda, ma non sono molto esperto. Sto cercando di risolvere un problema qua in un teatro a Parigi e non so che fare. Dovrei scannerizzare un testo teatrale in modo tale da poterlo modificare. Modificare perchè alla fine si dovrà avere un unico testo con parti sia in francese sia in Italiano. Questo programma sembra proprio faccia al caso mio, l’unico problema è che non riesco ad aprire le pagine scannerizzate. Usando adobe, questo programma non vede i documenti salvati e quindi non riesco ad aprirli. Lo scanner, compreso nella stampante HPLaserjetM1005, non ha il programma apposito per la scannerizzazione, quindi non so cosa fare.
    Vi ringrazio anticipatamante per l’aiuto.

  12. Davide

    Modifico un attimo la mia richiesta. Riesco Ad aprire la pagina, ma quando va nell’altra schermata non viene bene. Questo evidentemente perchè il programma é impostato sull’italiano. Quindi, come cambiare lingua in modo che legga in francese (visto che da quello che ho capito il programma puo’ tradurre in undici lingue)?

  13. Claudio

    Bellissimo articolo! Ho sempre cercato una cosa simile! Volevo solo chiederti una cosa: c’è un modo per trasformare un file di testo in un file audio?

    In questo articolo: FOGLIO STAMPATO > FILE TI TESTO
    Quello proposto sopra: FILE DI TESTO > FILE AUDIO

Scrivi un commento

Prima di inviare il tuo commento assicurati che:
sia in tema con l'articolo e contribuisca alla discussione in corso
non abbia contenuti offensivi nei confronti di chicchessia
non abbia contenuti che violini le leggi italiane
non contenga indirizzi e-mail









Guide su Windows

Trucchi, consigli e suggerimenti per usare al meglio Windows, il sistema operativo di casa Microsoft. Puoi trovare articoli su Windows XP e il nuovo Windows Vista.

Leggi altri articoli su Guide su Windows