Pdfminer,pyinstaller后无法读取LTText

问题描述

我制作了一个可以使用 pdfminer 读取 PDF 的应用程序。

enter image description here


开发时应用正常。
之后,我使用 pyinstaller 打包为 .exe 文件。但是读取结果与开发中的结果不一样。
详细地说,它无法读取**LTText LTTextBoxHorizo​​ntal 所以我无法获取提取的文本。
谁知道这个问题,请帮帮我。


登录开发

Logs in development

我执行 pyinstaller 后的日志

Logs after I do pyinstaller

Python 3.9.1
Pyinstaller 4.2
pdfminer.six==20201018
six==1.15.0
Command: pyinstaller --onefile file.py

相关来源:

 for index,page in pdf_object:
            # TODO: Only read last page - maybe change if PDF file change
            if index == number_of_page - 1:
                # read the page into a layout object
                self.interpreter.process_page(page)
                layout = self.device.get_result()
                print("Size of this page (%d,%d)" % (layout.x1,layout.y1))
                print("len = %d" % len(layout._objs))
                self.parse_obj(layout._objs)


def parse_obj(self,lt_objs):
    # loop over the object list
    print("Go loop")
    print(lt_objs)
    i = 0
    for obj in lt_objs:
        i += 1
        print("In loop %d" % i)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)