使用Swift PDFKit进行PDF大小膨胀

问题描述

我使用Apple的基本PDF框架在Swift for MacOS中编写了一个小型PDF合并应用程序。基本策略是获取PDF文件列表,然后遍历第二个到第n个文件页面,并将每个页面追加到第一个文件的末尾。核心功能是以下代码

func openPDF(_ file: URL) throws -> PDFDocument {
    guard let pdata = try? NSData(contentsOf: file) as Data else {
        throw PDFMergeError.cannotOpenFile(filename: file.path)
    }
    guard let pdf = PDFDocument(data: pdata) else {
        throw PDFMergeError.fileNotValidPDF(filename: file.path)
    }
    return pdf
}

public func mergePDFs(files: [URL]) throws -> PDFDocument {
    if files.count == 1 {
        throw PDFMergeError.justOneInputFile
    }
    let first = files[0]
    let rest = files[1...]
    let pdf = try openPDF(first)
    var curpagenum = pdf.pageCount
    var cur2add: PDFDocument
    var curpage: pdfpage
    var lenOfCurAdd: Int
    for p2add in rest {
        cur2add = try openPDF(p2add)
        lenOfCurAdd = cur2add.pageCount
        for i in 0..<lenOfCurAdd {
            curpage = cur2add.page(at: i)!
            pdf.insert(curpage,at: curpagenum)
            curpagenum+=1
        }
    }
    return pdf
}

这通常可以很好地工作,而且我经常自己使用它(每隔一段时间,我会遇到一次神秘的崩溃,我还不想弄清楚如何解决,但是我今天不问这个问题)。

但是有时似乎过度膨胀了最终合并文件文件大小。例如,今天早上,我用它合并了我下载的电子书的各章。各个章节的总大小约为165mb。但是,在使用我的应用程序将其合并之后,我最终得到了一个超过500mb(!!!)的文件

当我尝试在其中漂浮的众多PDF合并网站之一时,最终得到了一个更合理的200mb以下文件

那么,有人可以帮我弄清楚我在做什么错吗?

更新

经过更多的工作,我开始认为这里的问题是Apple内部的。特别是,我使用与以前相同的PDF合并服务制作了一个不同的合并PDF(如果有人好奇,它是smallpdf.com)。它刚好不到40MB。然后,我在当前版本的Preview(内置于MacOS 10.15.6中)中编辑了该pdf文件删除了几页并重新保存。重新保存的文件(我只从中删除 数据)显示将近80MB。

因此,无论出于何种原因,无论是在我的代码中还是在苹果自己的代码中,Apple处理PDF的文件大小似乎都比原来大了一倍。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)