Suggerimenti per ottenere ottime conversioni OCR


Per quanto impressionante sia il riconoscimento ottico dei caratteri, non è perfetto e occorre prestare attenzione per ottenere i risultati attesi. Analogamente al lavoro di preparazione necessario per convertire i PDF in Excel, esistono anche alcune regole non scritte per la conversione dei file scansionati. Di seguito troverete un pratico elenco di controllo che si applica anche a PDF to DOCX e PDF to XLSX.


Ottimizzare il documento ai fini dell'OCR:

  • Regolare manualmente la rotazione delle pagine, se necessario. Oltre a rendere il documento finale più leggibile, questo migliorerà anche la precisione del testo estratto.

  • Utilizzare immagini ad alta risoluzione. Le immagini dovrebbero essere in formato PNG e leggibili senza affaticare troppo gli occhi, ma anche i JPEG vanno bene. Più chiara è l'immagine, migliore sarà il risultato della conversione.

  • Includere una formattazione che corrisponda al formato di output (ad esempio, tabelle che assomiglino alla formattazione di Excel). Questo è probabilmente il fattore più importante per garantire la riproduzione fedele del PDF originale in DOCX o XLSX.