从pdf提取页面作为jpeg

问题描述

可以使用pdf2image库。

您可以使用以下方法简单地安装它：

pip install pdf2image

安装完成后，您可以使用以下代码获取图像。

from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)

以jpeg格式保存页面

for page in pages:
    page.save('out.jpg', 'JPEG')

编辑：Github仓库pdf2image也提到它使用pdftoppm并且需要其他安装：

pdftoppm是执行实际操作的软件。它作为更大的软件包poppler的一部分分发。Windows用户必须为Windows安装poppler。Mac用户必须为Mac安装poppler。如果发行版不存在，则Linux用户将预先安装pdftoppm（在Ubuntu和Archlinux上进行了测试），如果未运行，请运行sudo apt install poppler-utils。

您可以通过以下步骤使用anaconda在Windows下安装最新版本：

conda install -c conda-forge poppler

请注意：http：//blog.alivate.com.au/poppler- windows/上提供的Windows版本最高为0.67，但请注意，0.68已于2018年8月发布，因此您将无法获得最新功能或错误修复。

解决方法

在python代码中，如何有效地将pdf中的某个页面另存为jpeg文件？（用例：我有一个python
flask网络服务器，将在其中上传pdf-s，并存储与每个页面相对应的jpeg-s。）

该解决方案已经结束，但是问题在于它无法将整个页面转换为jpeg。

python