TESTI E IMMAGINI DIVENTANO ELETTRONICI

Workspace

I programmi per il riconoscimento ottico dei caratteri e delle foto sono indispensabili per chiunque utilizzi lo scanner.

di Mario De Ascentis e Roberto Gibertini Spesso questi programmi sono offerti in versioni con funzionalità limitate insieme allapparecchiatura hardware ma un pacchetto completo determina in molti casi la buona riuscita del processo di digitalizzazione I documenti quando sono memorizzati come immagini non sono identificabili attraverso il loro contenuto testuale. In sostanza, la scansione di un testo non memorizza i caratteri Ascii che lo rappresentano ma le coordinate di punti che compongono limmagine. I programmi che utilizzano le immagini delle lettere dellalfabeto e sono in grado di tradurle nellequivalente Ascii prendono il nome di Ocr. Gli Ocr (Optical Character Recognition) sono oramai prossimi a un funzionamento quasi ideale grazie a uno sviluppo favorito proprio dagli utilizzi in ambito professionale degli utenti che se ne sono serviti anche quando i Pc ancora non erano diffusi. Infatti questa tipologia di applicativi si è sviluppata in un primo momento per venire incontro alle esigenze degli impiegati bancari per lelaborazione dei contratti prestampati e della modulistica inerente le polizze e le carte di credito. La tecnologia è ovviamente cambiata nel tempo in una prima fase il loro funzionamento era garantito da regole di confronto tra i tratti distintivi dei caratteri. Le immagini/carattere erano definite da una serie di tratti che consentivano di legare limmagine letta dallapparecchiatura a un determinato font. Un sistema di questo tipo ha mostrato però i suoi limiti non appena la pagina presentava caratteri sporchi o non era in condizioni ottimali. La naturale evoluzione è stata, in diversi passaggi, lapprodo a una tecnologia di tipo neuronale basata su algoritmi e su sistemi esperti in grado di apprendere e di formulare ipotesi sul testo da riconoscere. Gli algoritmi nel tempo sono aumentati di numero in modo vertiginoso e ora operano divisi per aree di lavoro con un grado di specializzazione, quindi, sempre più raffinato. Questa evoluzione non è da sottovalutare. Ha consentito un impiego dei software Ocr in ambiti sempre più diffusi. Per fare anche solo un esempio, i moduli del censimento conclusosi alla fine dello scorso anno contenevano istruzioni precise sulla grafia di compilazione proprio perché sarebbero poi stati trattati con pacchetti professionali di questo tipo che consentono un risparmio di ore lavoro non indifferente. La diffusione anche tra lutenza domestica di pacchetti con queste caratteristiche è ora facilitata dai wizard per portare a termine in pochi passaggi anche i compiti più delicati. È fuori dubbio comunque che una conoscenza approfondita dei programmi e un utilizzo seguendo le procedure in modalità manuale è condizione essenziale per potere ottenere il meglio dal proprio software. I wizard infatti non hanno rivali nellaccelerazione delle operazioni ma altrettanto non si può dire riguardo la qualità per il raggiungimento del risultato finale. Lideale complemento dei software di riconoscimento dei caratteri sono i cosiddetti gestori di archivi di file (testi immagini e spesso anche file audio). La gestione documentale dopo un buon processo di digitalizzazione migliora non di poco la produttività. Lindicizzazione delle immagini affiancata dallacquisizione dei documenti con la tecnologia Ocr e, in fase successiva, lindividuazione di chiavi di accesso ai documenti ben impostate, secondo lambito della propria attività, possono risultare uno strumento decisivo nel buon funzionamento dellufficio. Chi digitalizza i propri testi semplicemente per potere avere sotto mano i documenti preferiti o per poterli diffondere finalmente per posta elettronica sotto forma di bit e byte non sentirà lesigenza di un utilizzo così spinto, ma chi si avvicina ai programmi Ocr con lo scopo ultimo di fare sparire la carta dallufficio (relegandola nellarchivio cartaceo del proprio magazzino) potrà apprezzare fino in fondo anche questa tipologia software in grado di generare veri e propri archivi sul Pc e di procedere a una loro precisa classificazione. Segue?

Autore: ITespresso
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore