Le tecnologie di lettura ottica: OCR, ICR, BCR, OMR, CHR

Le tecnologie di lettura ottica vengono identificate attraverso degli acronimi.

Quelle più diffuse sono:

  • OCR: Optical Characters Recognition
  • ICR: Intelligent Characters Recognition
  • BCR: Bar-Code Recognition
  • OMR: Optical Mark Recognition
  • CHR: Cursive Handwritten Recognition

Ciascuna è indicata per riconoscere e decodificare un tipo specifico di informazione veicolata dal supporto cartaceo.

L’ OCR serve per il riconoscimento di testi stampati o dattiloscritti, mentre l’ICR serve per il riconoscimento di testi manoscritti in stampatello.

Il BCR serve per il riconoscimento di codici a barre lineari e per il riconoscimento di codici a barre bidimensionali, mentre l’OMR serve per il riconoscimento di caselle di marcatura (caselle annerite) e segni di spunta.

Infine il CHR serve per il riconoscimento di testi scritti a mano in corsivo.

Un sistema di lettura ottica flessibile ed efficace deve essere in grado di utilizzarle tutte, al fine di poter estrarre qualsiasi tipo di dato da moduli e documenti che processa.

Tanto più avanzate e raffinate sono le implementazioni di tutte queste tecnologie, tanto più accurati sono i dati riconosciuti dal sistema di lettura ottica.

Lettori ottici e scanner

Per effettuare la lettura ottica di documenti è necessario ottenere delle immagini dai documenti cartacei. Tale conversione viene effettuata da dispositivi chiamati scanner che consentono di digitalizzare il documenti, ottenendo una mappa di pixel costituente una sorta di fotografia del foglio cartaceo.

Esistono in commercio molti modelli di scanner documentali che possono essere utilizzati per applicazioni di lettura ottica e si differenziano per:

  • massima dimensione del formato di acquisizione
  • velocità di acquisizione
  • presenza e capacità dell’alimentatore automatico di fogli
  • tipologia di interfacciamento al computer
  • profondità di colore gestibile
  • carico di lavoro giornaliero sopportabile
  • prezzo

La scelta dello scanner più idoneo per le proprie esigenze deve essere quindi effettuata tenendo conto di molteplici fattori.

Talvolta gli scanner vengono chiamati anche lettori ottici, ma in realtà questi ultimi sono apparecchi completamente diversi. Un lettore ottica infatti, sebbene abbia un aspetto simile ad uno scanner documentale, non consente di ottenere un’immagine del documento ma di effettuare la sola lettura ottica di caselline di marcatura presenti sul foglio cartaceo in posizioni predefinite. I lettori ottici venivano molto usati in passato per la lettura ottica di moduli di test e quiz, ma oggi la flessibilità delle soluzioni di lettura ottica software li sta rendendo obsoleti.
Recogniform Book Scanner è una interessante novità specifico per la digitalizzazione di libri.

Lettura ottica documenti d’identità

La lettura ottica di passaporti, la lettura ottica di carte di identità e la lettura ottica di patenti sono da tempo una realtà.

Utilizzando uno scanner di piccolo formato è possibile acquisire l’immagine del documento d’identità e processarla in modo tale che automaticamente ed in pochi istanti siano estratti il numero del documento, il nome, il cognome, la data di nascita, la nazionalità e tutti gli altri dati eventualmente previsti.

Con tale tecnologia è quindi possibile automatizzare l’immissione dei dati anagrafici in sistemi di controllo accessi o in sistemi di gestione alberghiera.

Oltre alla lettura ottica dei documenti d’identità con taluni sistemi è possibile effettuare anche la lettura ottica del codice fiscale, della tessera sanitaria e della carta nazionale dei servizi, in modo tale da poter completare i dati di identità con il codice fiscale, laddove richiesto.

Recogniform IdProcessor è il prodotto ideale per la lettura ottica di documenti d’identità, integrabile facilmente in applicazioni terze, che processa simultaneamente carte d’identità italiane e straniere, patenti di guida, passaporti, tesserino codice fiscale e tessera sanitaria.

Lettura ottica di fatture

La lettura ottica delle fatture passive è una della applicazioni che recentemente si sta diffondendo molto.

Infatti, sebbene le fatture, diversamente dalla modulistica, siano documenti non strutturati, quindi con disposizione delle informazioni diversa a seconda dell’azienda che la emette, è diventato possibile processarle con specifici sistemi di lettura ottica free-form.

La lettura ottica free-form per le fatture passive non si basa sull’uso di template, cioè non richiede che per ogni tipologia di fornitore/layout si debbano definire le aree in cui cercare le informazioni da processare.

Infatti un sistema basato su regole euristiche riesce ad identificare quali sono i dati da estrarre a prescindere dalla loro posizione: fornitore, data, numero, imponibili, imposte e totale possono essere così letti in modo totalmente automatico per essere resi disponibili ai programmi di contabilità, di archiviazione ottica o di work-flow senza ricorrere al lento e costoso data-entry.

Recogniform Invoice è un eccellente esempio di piattaforma software pronta all’uso per la lettura ottica e l’estrazione dati da fatture passive.

Lettura ottica di moduli

Un primario utilizzo della lettura ottica è rappresentato dall’estrazione di dati da moduli. In diversi ambiti infatti si ricorre a modulistica cartacea, opportunamente predisposta, per raccogliere informazioni: moduli di sottoscrizione contratti ed abbonamenti, moduli di soddisfazione clienti, test per concorsi ed esami, ricette mediche, e tanto altro.

Costruendo un modulo da utilizzare per la lettura ottica è possibile ottimizzarlo adottando alcuni accorgimenti grafici per ridurre al minimo la possibilità di errore. Ad esempio è possibile inserire dei quadretti di allineamento, spaziare equamente i campi, predisporre delle caselle per scrivere i caratteri, utilizzare specifici colori per la fincatura così che non interferisca con quanto verrà scritto.

Recogniform Reader è una flessibile ed innovativa piattaforma software di lettura ottica che può essere utilizzata nei più disparati ambiti.