问题描述
我正在尝试从具有2列(并排)文本的PDF中提取文本。我尝试使用pdfplumber
软件包,但它逐行不尊重列地读取pdf文本。
我的示例pdf文件在这里:https://www.ieee-pes.org/images/files/pdf/pg4-sample-conference-paper.pdf
预期行为(以上pdf中的“简介”部分):
此模板为作者提供了准备电子版PES所需的大多数格式规范。
实际行为:
此模板为作者提供了图形的大多数格式编号(图和表格),并确保准备电子版PES所需的规范包括所有适当的参考。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)