Mükemmel OCR dönüşümleri elde etmek için ipuçları


Optik Karakter Tanıma her ne kadar etkileyici olsa da mükemmel değildir ve beklediğiniz sonuçları elde etmek için biraz özen gösterilmesi gerekir. PDF'nizi Excel'e dönüştürmek için gereken ön hazırlık çalışmasına benzer şekilde, taranmış dosyaları dönüştürmek için de yazılı olmayan birkaç kural vardır. Aşağıda, PDF'den DOCX'e ve PDF'den XLSX'e eşit derecede geçerli olan kullanışlı bir kontrol listesi bulacaksınız.


Belgenizi OCR amaçları doğrultusunda optimize etmek için:

  • Gerektiğinde sayfa rotasyonunu manuel olarak ayarlayın. Bu, nihai belgenin daha kolay okunmasını sağlamanın yanı sıra, çıkarılan metnin doğruluğunu da artıracaktır.

  • Yüksek çözünürlüklü görüntüler kullanın. Görüntüler ideal olarak PNG formatında ve çok fazla göz yorgunluğu olmadan okunabilir olmalıdır, ancak JPEG'ler de aynı şekilde çalışır. Görüntü ne kadar net olursa dönüştürme sonucu da o kadar iyi olur.

  • Çıktı formatıyla yakından eşleşen biçimlendirme ekleyin (örneğin Excel'deki biçimlendirmeye benzeyen tablolar). Bu, muhtemelen orijinal PDF'nizin DOCX veya XLSX'e aslına sadık bir şekilde yeniden oluşturulmasını sağlamadaki en büyük faktördür.