将 python 请求响应加载到 tabula.read_pdf

问题描述

我有一个下载 pdf 作为响应的 URL。我想使用 python request 模块下载 pdf 文件,并想在 tabula 模块的函数 read_pdf 中加载相同的响应以提取pdf 文件中的 pdf。但是,我想在内存中执行此操作(不保存在磁盘中),但是 read_pdf 函数采用一个参数 input_path,该参数应该是 str、路径对象或类文件对象)。 任何人都可以提出一种将响应对象转换为类文件对象的方法吗?

附注

  1. 我已经尝试过 io 模块的 BytesIOStringIO,但是没有用。
  2. tabula doc 中,也提到了 pdf 文件的 URL,但我想在请求标头中传递一些附加参数以及代理,如果有,可以通过请求模块轻松完成有什么方法可以在 read_pdf 函数中传递所有这些参数。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)