问题描述
可以使用pdf2image库。
您可以使用以下方法简单地安装它:
pip install pdf2image
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
以jpeg格式保存页面
for page in pages:
page.save('out.jpg', 'JPEG')
编辑:Github仓库pdf2image也提到它使用pdftoppm
并且需要其他安装:
pdftoppm是执行实际操作的软件。它作为更大的软件包poppler的一部分分发。Windows用户必须为Windows安装poppler。Mac用户必须为Mac安装poppler。如果发行版不存在,则Linux用户将预先安装pdftoppm(在Ubuntu和Archlinux上进行了测试),如果未运行,请运行
sudo apt install poppler-utils
。
您可以通过以下步骤使用anaconda在Windows下安装最新版本:
conda install -c conda-forge poppler
请注意:http://blog.alivate.com.au/poppler- windows/上提供的Windows版本最高为0.67,但请注意,0.68已于2018年8月发布,因此您将无法获得最新功能或错误修复。
解决方法
在python代码中,如何有效地将pdf中的某个页面另存为jpeg文件?(用例:我有一个python
flask网络服务器,将在其中上传pdf-s,并存储与每个页面相对应的jpeg-s。)
该解决方案已经结束,但是问题在于它无法将整个页面转换为jpeg。