Dicas para obter ótimas conversões de OCR


Por mais impressionante que seja o reconhecimento óptico de caracteres, ele não é perfeito e é preciso tomar alguns cuidados para obter os resultados esperados. Da mesma forma que o trabalho de preparação inicial necessário para converter seu PDF em Excel, há também algumas regras não escritas para a conversão de arquivos digitalizados. A seguir, você encontrará uma lista de verificação útil que se aplica igualmente bem a PDF para DOCX e PDF para XLSX.


Para otimizar seu documento para fins de OCR:

  • Ajuste manualmente a rotação da página quando necessário. Além de tornar o documento final mais fácil de ler, isso também aumentará a precisão do texto extraído.

  • Use imagens de alta resolução. O ideal é que as imagens estejam no formato PNG e sejam legíveis sem muito cansaço visual, mas as JPEGs também funcionam bem. Quanto mais clara for a imagem, melhor será o resultado da conversão.

  • Inclua formatação que se aproxime do formato de saída (por exemplo, tabelas que se assemelhem à formatação do Excel). Esse é provavelmente o fator mais importante para garantir a recriação fiel de seu PDF original em DOCX ou XLSX.