Ti riconosco…letterina

Sistemi OperativiWorkspace

I software OCR acquisiscono documenti dagli scanner in tutte le lingue del mondo. Ma non sono ancora perfetti.

Per creare una copia digitale dei documenti cartacei basta avere a disposizione e saper utilizzare i programmi OCR (acronimo dall’inglese “Optical Character Recognition”). Readiris è uno di questi: basta avere uno scanner, un’immagine digitale del documento (per esempio in formato JPG, TIFF oppure anche PDF), e il programma elabora i “segni” presenti sul foglio – persino le parole in stampatello scritte a mano – interpretandoli come caratteri e copiandoli in un programma di videoscrittura come testo modificabile. In sostanza i programmi OCR sono l’ideale per gli studenti e per gli uffici che ricevono documenti cartacei e hanno bisogno di archiviarli elettronicamente. È anche vero che l’acquisizione tramite scanner, alla lunga, può risultare un processo lungo e noioso. La versione 10 di Readiris è, in sostanza, un aggiornamento dell’edizione precedente mirato soprattutto al miglioramento del motore di riconoscimento e al supporto di un più ampio numero di formati con cui salvare il documento digitale in cui viene trasposto il testo acquisito. Il foglio scandito può essere trasformato in semplice testo o in file di Word, Excel, HTML per il Web o PDF. Readiris ha il vantaggio di essere molto semplice da usare, anche senza servirsi della procedura guidata che rende l’acquisizione del testo su foglio ancora più elementare. Inoltre si tratta di un software leggero, non richiede troppo spazio nel disco fisso e viene eseguito in modo rapido dal computer. Nonostante ciò, come tutti i software OCR, Readiris richiede l’attenta collaborazione dell’utente per facilitare l’elaborazione del foglio, soprattutto quando il contenuto non è omogeneo. Spetta a noi indicare al programma quali parti del documento sono un’immagine, quali un grafico, o un codice a barre, un testo, una tabella, soprattutto nel caso in cui ci interessi che vengano riconosciuti accuratamente. Due aspetti di Readiris ci lasciano perplessi: il primo è la funzione di “Apprendimento” che, a seguito delle correzioni dell’utente, dovrebbe migliorare la qualità del riconoscimento. Si tratta di un passaggio poco flessibile, che apporta solo alcune correzioni ma non consente di correggere altri errori di valutazione del motore. Il secondo problema, veniale ma comunque macroscopico, è la qualità appena sufficiente della traduzione italiana dell’interfaccia, che presenta errori marchiani che preferiremmo non leggere in un programma presente da anni nel nostro mercato. Il software è compatibile con un numero sterminato di lingue (sono 117 in tutto tra cui molti idiomi appartenenti a minoranze etniche o con alfabeti non latini come il greco): con un modulo aggiuntivo da acquistare a parte è possibile abilitare il riconoscimento delle lingue asiatiche e dell’ebraico.

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore