Suggerimenti per ottenere ottime conversioni OCR
Per quanto impressionante sia il riconoscimento ottico dei caratteri, non è perfetto e occorre prestare attenzione per ottenere i risultati attesi. Analogamente al lavoro di preparazione necessario per convertire i PDF in Excel, esistono anche alcune regole non scritte per la conversione dei file scansionati. Di seguito troverete un pratico elenco di controllo che si applica anche a PDF to DOCX e PDF to XLSX.
Ottimizzare il documento ai fini dell'OCR:
- Regolare manualmente la rotazione delle pagine, se necessario. Oltre a rendere il documento finale più leggibile, questo migliorerà anche la precisione del testo estratto.
- Utilizzare immagini ad alta risoluzione. Le immagini dovrebbero essere in formato PNG e leggibili senza affaticare troppo gli occhi, ma anche i JPEG vanno bene. Più chiara è l'immagine, migliore sarà il risultato della conversione.
- Includere una formattazione che corrisponda al formato di output (ad esempio, tabelle che assomiglino alla formattazione di Excel). Questo è probabilmente il fattore più importante per garantire la riproduzione fedele del PDF originale in DOCX o XLSX.