问题描述
我有一个下载 pdf 作为响应的 URL。我想使用 python request 模块下载 pdf 文件,并想在 tabula 模块的函数 read_pdf 中加载相同的响应以提取pdf 文件中的 pdf。但是,我想在内存中执行此操作(不保存在磁盘中),但是 read_pdf 函数采用一个参数 input_path,该参数应该是 str、路径对象或类文件对象)。 任何人都可以提出一种将响应对象转换为类文件对象的方法吗?
附注:
- 我已经尝试过 io 模块的 BytesIO 和 StringIO,但是没有用。
- 在tabula doc 中,也提到了 pdf 文件的 URL,但我想在请求标头中传递一些附加参数以及代理,如果有,可以通过请求模块轻松完成有什么方法可以在 read_pdf 函数中传递所有这些参数。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)