问题描述
当我将 pdf 文件转换为 JPG 格式时,图像顶部有额外的内容,但在 pdf 文件中找不到该内容。
上图为 jpg 文件(从 pdf 转换而来 - 第一张图片)。
知道为什么这个文件会有一些额外的内容吗?这只发生在这个文件中。对于我使用 pdf2image python 库(或任何方法)转换的所有其他文件,jpg 类似于 pdf。请帮忙?
解决方法
转换为图像格式时显示的额外区域称为不可打印区域。在 pdf 文件中,只有可打印区域可见。不可打印区域在 pdf 文件中将不可见。当转换为另一种格式(例如:jpeg/png)时,不可打印区域也会被转换并显示在图像文件中。您需要使用可打印区域 (+) 上方提供的标记裁剪图像。