python从在线网站读取pdf文本

问题描述

到目前为止,我已经通过以下方式从下载的 pdf 文件获取文本取得了巨大成功:

import fitz

with fitz.open("XYZ.pdf") as doc: text = "" for page in doc: text += page.getText()

我想跳过保存步骤,有谁知道我如何从在线网站上读取文本?

我曾尝试在 BeautifulSoup 上使用以下内容,但由于格式错误,我认为它无法读取

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)