将 python 请求响应加载到 tabula.read_pdf

问题描述

我有一个下载 pdf 作为响应的 URL。我想使用 python request 模块下载 pdf 文件,并想在 tabula 模块的函数 read_pdf 中加载相同的响应以提取pdf 文件中的 pdf。但是,我想在内存中执行此操作(不保存在磁盘中),但是 read_pdf 函数采用一个参数 input_path,该参数应该是 str、路径对象或类文件对象)。 任何人都可以提出一种将响应对象转换为文件对象的方法吗?

附注

  1. 我已经尝试过 io 模块的 BytesIOStringIO,但是没有用。
  2. tabula doc 中,也提到了 pdf 文件的 URL,但我想在请求标头中传递一些附加参数以及代理,如果有,可以通过请求模块轻松完成有什么方法可以在 read_pdf 函数中传递所有这些参数。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...