Guida alla lettura ottica

[02] Motori di Riconoscimento

I motori di riconoscimento sono il primo pilastro su cui si fondano le tecnologie di lettura ottica: si tratta di sottosistemi software dedicati all’attività di lettura “in senso stretto”, le cui caratteristiche sono funzione della natura delle informazioni da estrarre.

I motori di riconoscimento possono essere sviluppati seguendo diversi approcci, o combinando più approcci insieme: reti neuronali, logica fuzzy, machine learning, deep learning. Senza scendere in dettagli tecnici, possiamo dire che i motori di riconoscimento sono frutto di complicati meccanismi di intelligenza artificiale in grado di determinare la più probabile associazione tra un’immagine (nel caso specifico l’immagine di un carattere) e un valore (cioè la lettera, il numero o il simbolo rappresentato da quell’immagine).

Si è già scritto più volte con riferimento al motore “OCR “, che indica la tecnologia utilizzata per convertire immagini di testo stampato o dattiloscritto in testo elaborabile (Optical Character Recognition) ; data la possibilità di leggere dati di altra natura, ecco l’esistenza di motori “ICR” (Intelligent Character Recognition) per il riconoscimento di caratteri manoscritti in stampatello, “OMR ” (Optical Mark Recognition) per il riconoscimento di caselle di marcatura, segni di spunta o check-box, “ BCR” (BarCode Recognition) per la lettura di codici a barre lineari o bidimensionali, “CHR” (Cursive Handwritten Recognition) per il riconoscimento di caratteri manoscritti in corsivo, e i meno noti (ma non per questo meno diffusi) “ OCR-A” e “OCR-B ” per il riconoscimento di caratteri stampati con font OCR-A o OCR-B, “CMC7” ed “ E13B” per il riconoscimento di codeline stampate con font CMC7 e E13B (per intenderci, si tratta dei caratteri usati per gli assegni bancari).


Principali motori di riconoscimento


Esiste poi un lungo elenco di motori specifici, per lo più derivazioni del motore OCR, addestrati in modo altamente specializzato su set di caratteri ben definiti, come ad esempio accade per la tecnologia ANPR (Automatic Number-Plate Recognition) in cui oggetto di lettura sono i caratteri delle TARGHE dei veicoli, o per altri sistemi custom volti a ottimizzare la lettura di uno o più font.

Alla luce della vastità di motori di riconoscimento oggi disponibili, è possibile affermare che attraverso le moderne tecnologie è possibile leggere – o almeno tentare di leggere – qualsiasi tipo di dato, stampato o manoscritto, da qualsiasi documento, strutturato o non strutturato.