Non è detto che tutti i documenti da sottoporre a lettura ottica siano orientati in modo corretto. Spesso capita che all’interno di un documento con orientamento “portrait” (verticale), le pagine contenenti grafici, tabelle, report ed elaborati simili siano stampate in modalità “landscape” (orizzontale), ossia – con riferimento a un foglio A4 – aventi il lato lungo quale base del foglio.
Ne deriva che effettuandone la scansione ci si troverà con alcune pagine correttamente ruotate per la lettura, e con altre no; inoltre, durante la fase di scansione, potrebbero aver luogo degli errori di inserimento che produrranno inevitabilmente immagini sotto-sopra.
Per evitare che, durante la successiva consultazione dei documenti, l’operatore debba ripetutamente usare funzioni di rotazione per poter leggere correttamente a schermo il documento, o semplicemente per raddrizzarlo manualmente, esistono apposite tecnologie di auto-orientamento (auto-orientation o auto-orient) che consentono di effettuare automaticamente tale operazione senza intervento umano.
Un’analisi del contenuto della pagina consente di individuare il corretto orientamento di lettura e di decidere autonomamente se il documento è dritto o se ruotare automaticamente le immagini di 90, 270 o 180 gradi. Tale tecnologia può basarsi sia su una analisi degli elementi grafici che compongono la pagina, quindi sul layout globale, sia sull’interpretazione dei caratteri vera e propria attraverso l’OCR.
Nel primo caso vengono applicate delle euristiche, delle regole implementate sulla scorta di una pregressa analisi di documenti eterogenei, oppure, quando possibile, viene fatto un confronto con un layout atteso dei moduli. Nel secondo caso invece l’approccio è quello di tentare di leggere il documento, o una porzione di esso, nei quattro orientamenti possibili, utilizzando poi i dati relativi alla confidenza di lettura per individuare qual è l’orientamento in cui si riesce a leggere più testo.
Ciascuno dei due approcci può essere più o meno rapido ed efficace: la scelta va fatta di volta in volta, in funzione delle esigenze specifiche e della natura dei documenti da processare. Naturalmente è fondamentale che il software di lettura ottica utilizzato abbia la possibilità di configurare e scegliere la modalità di orientamento più adatta.