Cos’è la lettura ottica?

Se fino a qualche anno fa con il termine “lettura ottica” si faceva riferimento al processo di trasformazione dal formato cartaceo al formato elettronico (spesso sintetizzato nell’acronimo “OCR”), è ormai consolidata l’estensione del termine “lettura ottica” ai documenti già esistenti in formato elettronico, siano essi frutto di un processo di digitalizzazione (scansione, fotografia), o frutto di un processo interamente elettronico, come ad esempio un ordine o una fattura generati da un gestionale.

Una delle domande che frequentemente è posta a chi opera nel settore è infatti questa: perché dovrei aver bisogno di leggere un documento che già nasce in formato elettronico? E spesso la domanda è accompagnata da un’affermazione: “la carta sta scomparendo, la lettura ottica non serve più”.

In effetti, sia la domanda che l’affermazione hanno un senso ben preciso, soprattutto se si danno per scontati alcuni presupposti che in realtà di scontato hanno poco, o nulla.

La lettura ottica, così come oggi comunemente intesa, non è soltanto il processo di conversione dal cartaceo all’elettronico: la lettura ottica è ANCHE conversione da analogico a digitale, ma è soprattutto un processo che mira a reperire le informazioni d’interesse in modo semplice, accurato e quanto più automatico possibile da documenti di ogni tipo, stampati o manoscritti, con layout fisso o variabile, in formato cartaceo o elettronico. Se fino a qualche tempo fa il predominare della documentazione cartacea rendeva indispensabile l’utilizzo di soluzioni software atte a “leggere” il contenuto analogico, lo stesso può dirsi oggi con riferimento a un contenuto elettronico “nativo”.

Il fatto di ricevere un ordine in formato PDF, infatti, non significa conoscere automaticamente chi è il cliente, cosa ha ordinato, in che quantità e a quali condizioni. Se ad un operatore è demandato l’inserimento di un ordine nel gestionale, poco importa se gli si chiede di leggere il contenuto di un foglio di carta, o di una pagina di un file PDF. 

Se quindi abbandoniamo per un attimo il concetto di “estrazione dati dal cartaceo”, e ci fermiamo alla sola “estrazione dati”, non è complicato dedurre che il problema dell’acquisizione delle informazioni contenute in documenti ricevuti dall’esterno è più che mai attuale, sebbene abbia spostato il suo baricentro dalla cara vecchia carta, al sempre caro (ma nuovo) documento elettronico (si calcola che oltre il 60% dei documenti aziendali contenenti informazioni rilevanti sia prodotto in formato cartaceo, e che a più della metà dei documenti ricevuti in formato elettronico segua almeno una stampa).

In questo sezione dedicata al mondo della lettura ottica (o al più moderno data-capture, termine sicuramente più efficace e di ampio respiro), cercheremo di raccontare in modo chiaro e sintetico cosa si può fare utilizzando una soluzione di lettura ottica, quali sono le tecnologie fondamentali di lettura (non solo OCR, ma anche ICR, BCR, CHR, OMR. etc.), quando e a cosa servono gli strumenti di elaborazione delle immagini, come determinare l’approccio “vincente” in funzione degli obiettivi preposti, quali sono i vantaggi derivanti da un software di lettura ottica e quali sono gli elementi da valutare per una completa analisi costi/benefici. Infine, approfondiremo alcuni dei numerosi ambiti in cui la lettura ottica si appresta a svolgere un ruolo cardine in funzione delle crescenti esigenze di automazione dei processi di business.