无法从PDF

问题描述

我有一个包含以下示例文本的PDF文档(屏幕截图)-

Screenshot of the sample text from the PDF document

但是当我将其复制并粘贴到单词或其他文本编辑器中时,我看到的只是奇怪的字符:

        

我不太确定为什么会给我怪异的方形框,而不是粘贴清晰易读的字母(就像屏幕截图一样)。有人可以帮我摆脱这个问题吗?或者至少我应该怎么确定这个奇怪问题的根本原因?

解决方法

===================解决方法=================

  • 我尝试将文档损坏的unicode转换为标准ANSCI unicode格式。但是大多数在线服务都无法识别这些垃圾/怪异字符。
  • 可以通过一些编程来解决此问题,但我不想花时间在编程方法上,而是优先采用动态方法。
  • 最后,根据用户'mkl'的建议,使用问题解决的OCR服务(如“ Sedja” /“ Adob​​e OCR”)转换此文档。