使用 soffice 转换为 pdf 添加空白页

问题描述

我正在尝试使用 soffice 和 python 将 .ods 文件转换为 pdf:

import os
import subprocess

def ods_to_pdf(ods_filename):
    file = os.path.join(os.getcwd(),ods_filename)
    path_to_soffice = "path/to/soffice"
    subprocess.run([path_to_soffice,"--headless","--convert-to","pdf",file],check=True)

它工作正常,但生成的 pdf 最后有一个空白页(有时是两个)。有谁知道我如何防止这种行为?代码在 Docker 容器中运行,Ubuntu 18.04 作为基础镜像。 LibreOffice 版本:7.1.0(我也试过 6.1.6.3,结果一样)。

解决方法

我不知道如何阻止 LibreOffice 添加空白页,但通过在转换后删除空白页解决了该问题:

import PyPDF2

output = PyPDF2.PdfFileWriter()
    
input = PyPDF2.PdfFileReader(open("file.pdf","rb"))
number_of_pages = input.getNumPages()

for current_page_number in range(number_of_pages):
    page = input.getPage(current_page_number)
    if page.extractText() != "":
        output.addPage(page)
    
output_stream = open("output.pdf","wb")
output.write(output_stream)