Python将数百个PNG转换为单个PDF

问题描述

我有一个包含452张图像(.png)的文件夹,我正在尝试使用Python将其合并为一个PDF文件。每个图像都用其预期的页码标记,例如“ 1.png”,“ 2.png”,.....,“ 452.png”。

代码在技术上成功,但输入页面的顺序不正确。

import img2pdf
from PIL import Image    
with open("output.pdf",'wb') as f:
    f.write(img2pdf.convert([i for i in os.listdir('.') if i.endswith(".png")]))

我也尝试将数据读取为二进制数据,然后将其转换并写入PDF,但这会产生94MB的一页PDF。

import img2pdf
from PIL import Image

with open("output.pdf",'wb') as f:
    for i in range(1,453):
        img = Image.open(f"{i}.png")
        pdf_bytes = img2pdf.convert(img)
        f.write(pdf_bytes)

任何帮助将不胜感激,我已经做了大量的研究,但很快就没有了。预先感谢。

解决方法

但输入页面的顺序不正确

我怀疑预期的顺序是“按文件名的数字顺序”,即1.png,2.png,3.png等。

这可以通过以下方法解决:

with open("output.pdf",'wb') as f:
    f.write(img2pdf.convert(sorted([i for i in os.listdir('.') if i.endswith(".png")],key=lambda fname: int(fname.rsplit('.',1)[0]))))

这是您第一次尝试的稍作修改的版本,它仅在将文件批量写入PDF之前对文件名进行排序(以您的第二次尝试尝试的方式)