使用带有不同PDF页面标签的iTextSharp提取文本

问题描述

我正在尝试使用iTextSharp从PDF提取文本,但是在尝试调用 GetTextFromPage 时出现空引用错误

Calling GetTextFromPage

Exception thrown

我的猜测是iTextSharp确实以某种方式错误地解释了页面标签,因为它确实很奇怪:

Strange page label

还是在文本中加上丹麦字母?

Danish letters

但是,我能够从不同的语言中提取文本。

谢谢。

编辑:该问题也可能是因为使用了字体及其自定义编码:

enter image description here

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)