问题描述
我有一个包含452张图像(.png)的文件夹,我正在尝试使用Python将其合并为一个PDF文件。每个图像都用其预期的页码标记,例如“ 1.png”,“ 2.png”,.....,“ 452.png”。
import img2pdf
from PIL import Image
with open("output.pdf",'wb') as f:
f.write(img2pdf.convert([i for i in os.listdir('.') if i.endswith(".png")]))
我也尝试将数据读取为二进制数据,然后将其转换并写入PDF,但这会产生94MB的一页PDF。
import img2pdf
from PIL import Image
with open("output.pdf",'wb') as f:
for i in range(1,453):
img = Image.open(f"{i}.png")
pdf_bytes = img2pdf.convert(img)
f.write(pdf_bytes)
任何帮助将不胜感激,我已经做了大量的研究,但很快就没有了。预先感谢。
解决方法
但输入页面的顺序不正确
我怀疑预期的顺序是“按文件名的数字顺序”,即1.png,2.png,3.png等。
这可以通过以下方法解决:
with open("output.pdf",'wb') as f:
f.write(img2pdf.convert(sorted([i for i in os.listdir('.') if i.endswith(".png")],key=lambda fname: int(fname.rsplit('.',1)[0]))))
这是您第一次尝试的稍作修改的版本,它仅在将文件批量写入PDF之前对文件名进行排序(以您的第二次尝试尝试的方式)