Dalla stampa al digitale

Management

Grazie a standard di qualità elevati e a dotazioni di accessori via via
più ampi, gli Ocr sono un aiuto sempre più prezioso nel lavoro d’ufficioe
chi è abituato a utilizzarne uno difficilmente riesce poi a farne a
meno. A confronto i programmi di riconoscimento di caratteri più
conosciuti

I software Ocr sono programmi che si utilizzano a casa e in ufficio per portare in digitale il testo dai documenti cartacei e ottenere file modificabili poi con il Pc. Ocr è un acronimo che indica la funzione di questi programmi, cioè il riconoscimento ottico dei caratteri (Optical Character Recognition). I caratteri ,le parole, e anche le immagini, vengono cioè acquisiti come immagini bitmap dal programma e, grazie a sofisticati algoritmi di riconoscimento, sono poi trasformati in vero testo. Il processo di lavoro tipico prevede quindi la scansione con uno scanner e l’acquisizione dei documenti attraverso software Ocr, che estrae il testo dall’immagine e lo salva su un file, modificabile poi tramite un word processor, o utilizzabile con un client per la posta elettronica o un qualunque altro programma in grado di gestire file di immagini e testo. Le caratteristiche degli Ocr (si utilizza comunemente questa sigla per indicare le applicazioni stesse, anziché la loro funzione) non si limitano naturalmente al riconoscimento del singolo carattere o della singola parola, né alla ricostruzione di testi semplici scritti in modo lineare sull’intera pagina: queste conquiste sono ormai la base di funzionalità minima in qualunque prodotto degno di attenzione, anche in molti dei tool elementari forniti in bundle con gli scanner di tutte le marche. Da qualche anno a questa parte i limiti di questi programmi sono sempre meno, e i campi su cui si sfidano i software sono – oltre naturalmente all’assoluta precisione nel riconoscimento semplice del testo – la capacità di riconoscere e gestire gli elementi grafici e testuali più disparati, ricreando pagine quanto mai simili ai documenti cartacei originali. Parleremo più diffusamente di quali siano gli elementi davvero problematici durante il processo di riconoscimento, e di come i singoli software in prova si comportino nel riconoscimento anche di documenti complessi. Un altro punto caldo del confronto tra i vari pacchetti è la gestione del formato Pdf, che per alcune sue caratteristiche (in primis la possibilità di fondere testo e immagini in vari modi, anche sovrapponendo livelli puramente grafici a testo semplice da copiare nelle applicazioni) si sposa in modo ottimale con il procedimento di Ocr.

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore