Scansionare e convertire una pagina scritta di un libro in testo modificabile (OCR)
Qualche settimana fa mi è stato chiesto di ricopiare molte pagine di un libro di testo su Microsoft Word. Senza esitare ho deciso non di copiare manualmente le pagine, ma di affidarmi ad un programma di riconoscimento ottico dei caratteri (OCR).
I programma di riconoscimento ottico dei caratteri sono in grado di convertire la scansione di una pagina scritta di un libro in testo modificabile. Se si esegue, infatti, una semplice scansione di una pagina di un libro, il suo testo non è per ovvi motivi modificabili.
La prima cosa che ho fatto è stata quindi quella di scansionare le pagine scritte del libro da convertire in testo modificabile. A questo punto, le ho date in pasto a TopOCR, uno dei migliori programmi di OCR completamente gratuito, che lo ha trasformato in pochi secondi in testo modificabile.
Dopo aver identificato a colpo d’occhio e corrette le parole non riconosciute da TopOCR, ho terminato il mio lavoro. Utilizzare un programma di OCR è, infatti, molto più facile e veloce rispetto a copiare manualmente le varie pagine del libro!
(Foto GE Healthcare Typhoon 9400 scanner di jepoirrier)
Scaricare ed installare TopOCR
Collegati sul sito Internet di TopOCR e fai click sull’icona a forma di macchina fotografica per scaricare il programma. Al termine dello scaricamento, apri, facendo doppio click su di esso, il file scaricato (topocr.exe).
Nella finestra che si apre, fai click sul pulsante Next e poi accetta il contratto di licenza del programma, facendo click sul pulsante I Agree. A questo punto, per terminare l’installazione fai click prima sul pulsante Install e poi sul pulsante Finish.

Usare TopOCR per il riconoscimento
La finestra principale di TopOCR è divisa in due sezioni: a sinistra viene mostrata l’immagine del libro, mentre a destra il suo riconoscimento sottoforma di testo modificabile.

Per fare analizzare una immagine di una pagina di testo scansionata, fai click, nella finestra di sinistra, sul menu File e poi sulla voce Open…. Nella finestra che si apre, cerca fra le cartelle del tuo computer e seleziona, facendo doppio click su di essa, l’immagine scansionata.
Essa viene subito analizzata e il suo risultato mostrato, come già anticipato, nella finestra di destra. Dagli esperimenti che ho effettuato, il riconoscimento è di buona fattura e gli errori sono minimi, facilmente correggibili effettuando il confronto con l’immagine del libro.

Per salvare il testo ottenuto, fai click, nella finestra di destra, sul menu File e poi sulla voce Save. Se vuoi modificare il testo con altri programmi, ti consiglio di salvarlo in formato RTF.



Certo che ne sai un sacco di cose Salvatore!! Questa e’ stata utilissima, pensa che stavo copiando su file di testo il ricettario per mia mamma e invece ora andro’ a comprarmi uno di questi oggettini e zac.. il lavoro e’ fatto.
Chissa’ dove hai imparato queste cose.. ma via all Universtia’ di Informatica?? Sei proprio un esperto informatico, complimenti ancora!
G.
Bello!
Conoscevo già l’OCR, ma i software che provavo facevano molti errori!
Di questo invece sono soddisfatto!
@LUCA
Non associare il concetto di ingegneria informatica con quello di “smanettone” o appassionato informatico. In ing Informatica queste cose non si spiegano, anzi per dirla tutta all’università si impare ad apprendere non si apprende molto del mondo del lavoro se non le basi per crescere da soli!!!
beh alla fine i suoi articoli non sono altro che una ricerca su google! purtroppo non tutti sono capaci di cercare le parole giuste…..
@Karma, non è solo questione di cercare.
Giustamente tu dici “cercare le parole giuste”, ma aggiungerei: spiegare in modo chiaro, aggiungere le immagini giuste, dire cose nuove…
Infatti se proprio dovete fare l’università non andate ad ing informatica. Qua a pisa la facoltà è pessima. Alti costi, strumenti didattici e edifici fatiscenti, professori che si credono degli dei in terra… meno male ho smesso!
Ciao a tutti! Volevo sapere se questo programma è totalmente gratuito e se è disponibile in italiano (purtroppo odio l’inglese!)…Ciao!!!
Ciao! Ma l’OCR è efficace anche con i manoscritti in corsivo?
Ho usato tempo fa l’OCR per trasformare pagine di libri in documenti word. Col TopOCR è possibile farlo?
Grazie
Alessandro
Il problema è lo scanner piano, la pagina di un libro non sempre si riesce a spinarla sullo scanner. Credevo esistessero scanner mobili adatti a posarla sulla pagina.
Oppure fotografare con la digitale e poi trasferirla sul PC e poi usare un OCR per
trasferirlo in word. Ma è veramente complicato!
Ciao. Scusate la domanda, ma non sono molto esperto. Sto cercando di risolvere un problema qua in un teatro a Parigi e non so che fare. Dovrei scannerizzare un testo teatrale in modo tale da poterlo modificare. Modificare perchè alla fine si dovrà avere un unico testo con parti sia in francese sia in Italiano. Questo programma sembra proprio faccia al caso mio, l’unico problema è che non riesco ad aprire le pagine scannerizzate. Usando adobe, questo programma non vede i documenti salvati e quindi non riesco ad aprirli. Lo scanner, compreso nella stampante HPLaserjetM1005, non ha il programma apposito per la scannerizzazione, quindi non so cosa fare.
Vi ringrazio anticipatamante per l’aiuto.
Modifico un attimo la mia richiesta. Riesco Ad aprire la pagina, ma quando va nell’altra schermata non viene bene. Questo evidentemente perchè il programma é impostato sull’italiano. Quindi, come cambiare lingua in modo che legga in francese (visto che da quello che ho capito il programma puo’ tradurre in undici lingue)?
Bellissimo articolo! Ho sempre cercato una cosa simile! Volevo solo chiederti una cosa: c’è un modo per trasformare un file di testo in un file audio?
In questo articolo: FOGLIO STAMPATO > FILE TI TESTO
Quello proposto sopra: FILE DI TESTO > FILE AUDIO