Riconosciuti al volo!

Sistemi OperativiWorkspace

L’ufficio senza carta è stata una vera e propriachimera degli Anni ’90, ma un software peril riconoscimento dei caratteri può davverovelocizzare molti lavori di trascrizione.

Nell’olimpo dei software di riconoscimento ottico (noti come OCR, acronimo di Optical Character Recognition) Abbyy FineReader ha sempre occupato un posto di riguardo soprattutto per la precisione della conversione da testo cartaceo a documento digitale modificabile. Ora possiamo dire che questa precisione è stata raggiunta da tutti i più conosciuti programmi OCR disponibili sul mercato, poiché la percentuale di errore è al di sotto dell’1%.Questo progresso è dovuto soprattutto alla maggiore potenza di calcolo dei processori, in grado di rendere accettabili i tempi di attesa per la lettura ottica del foglio di carta. Ciò significa che il programma può commettere un errore ogni 100 caratteri riconosciuti:a ben vedere non è poco, ma gli errori dipendono soprattutto dalla tipologia di font utilizzato nel documento.Per esempio il riconoscimento ottico di una pagina come quella che state leggendo potrebbe essere impreciso perché la distanza tra le singole lettere (la cosiddetta crenatura) è molto ridotta, mentre un documento scritto in Times New Roman può essere “tradotto”senza errore. Abbyy FineReader 8.0 è l’ultima versione di un programma russo molto celebre in Europa, meno negli Stati Uniti (dove regna incontrastato il marchio ScanSoft OmniPage, di cui parleremo in queste pagine nei prossimi numeri).Muniti di scanner, computer e documenti di vario tipo (pagine di riviste, moduli da compilare, lettere semplici e fax) abbiamo affrontato la prova di FineReader 8 con molta curiosità, soprattutto per vedere come il celebre software ha deciso di riproporsi al pubblico a due anni dall’ultima versione.La nuova interfaccia ha reso semplice l’intero processo, anche per una persona che non ha mai svolto un lavoro del genere: quattro icone numerate in modo sequenziale suddividono il lavoro in “Scandisci”(il momento dell’acquisizione del documento da scanner o file), “Leggi”(per avviare il riconoscimento ottico), “Controllo ortografico”(la correzione del testo acquisito), “Salva”(il salvataggio del documento nel formato desiderato). Nella fase “Leggi”il programma è in grado di distinguere automaticamente le diverse porzioni della pagina, i paragrafi, le immagini e di comprendere la sequenza di lettura del testo (molto utile quando si scandiscono pagine di riviste).Vengono identificate come tali le immagini, le tabelle, il testo: manca invece un sistema di riconoscimento specifico per i moduli prestampati, funzione che invece abbiamo notato in una veloce anteprima di ScanSoft OmniPage Professional che però è molto più costoso.Il sistema di salvataggio è in grado di memorizzare i dati in formato DOC (per Word), XLS (documento di Excel, consigliato per le tabelle), HTML (per il Web) e PDF. Il controllo ortografico può avvenire sia nella finestra principale (soluzione preferibile) sia attraverso la specifica finestra che, similmente al correttore di Word, propone le soluzioni alternative ai presunti errori commessi dal programma. Un problema molto comune dei software OCR e che constatiamo anche in FineReader è il sovraffollamento dello schermo. L’utente ha bisogno di vedere contemporaneamente a monitor il documento originale così come è stato scandito, il testo convertito e un ingrandimento della scansione. Ciò si traduce in tre finestre che a volte sono davvero difficili da scorrere, a causa della complessiva rigidità della struttura di FineReader.I vari elementi, infatti, non possono essere spostati, chiusi o ridotti in modo semplice o rapido.La qualità dell’impaginazione finale lascia a desiderare in formato Word (il che è dovuto anche a limiti del formato stesso), mentre in HTML e in PDF la riproduzione è molto fedele. Nel complesso FineReader si conferma ottimo nel riconoscere i caratteri (per un totale di 179 lingue diverse), buono nel gestire la riproduzione dell’impaginazione e infine discreto nell’interfaccia che, a nostro avviso, poteva essere ancora più curata, più flessibile e attenta alle esigenze del pubblico.

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore