Conseils pour obtenir d'excellentes conversions OCR


Aussi impressionnante que soit la reconnaissance optique de caractères, elle n'est pas parfaite et certaines précautions doivent être prises pour obtenir les résultats escomptés. À l'instar du travail préparatoire nécessaire pour convertir votre PDF en Excel, il existe également quelques règles non écrites pour la conversion de fichiers numérisés. Vous trouverez ci-dessous une liste de contrôle pratique qui s'applique aussi bien aux fichiers PDF vers DOCX qu'aux fichiers PDF vers XLSX.


Optimisez votre document pour les besoins de l'OCR :

  • Ajustez manuellement la rotation des pages si nécessaire. Outre le fait que le document final sera plus facile à lire, cette opération améliorera également la précision du texte extrait.

  • Utilisez des images à haute résolution. Les images doivent idéalement être au format PNG et lisibles sans trop de fatigue visuelle, mais les JPEG fonctionnent tout aussi bien. Plus l'image est claire, meilleur est le résultat de la conversion.

  • Inclure un formatage qui correspond étroitement au format de sortie (par exemple, des tableaux qui ressemblent au formatage d'Excel). C'est probablement le facteur le plus important pour garantir la recréation fidèle de votre PDF original en DOCX ou XLSX.