问题描述
我有一个表单分成 3 个不同的 jpg 文件,每个页面一个文件,是否可以指示表单识别器将它们视为单个表单?
我应该先合并到一个文件中吗?在单个 PDF 文件中合并 3 个不同 jpg 的最佳免费 Java 库是哪个?
谢谢
解决方法
您需要将 3 个 jpg 文件合并为一个文件。
您可以尝试将其合并为 Az Form Recognizer 支持的 TIFF 文件,并且它支持多个图像/页面。
这在 Java 中似乎是可能的,无需任何额外的库。
检查 this post,因为它可能会给您一个想法。
此外,如果所有文档的页数和布局都相同,您可以使用自定义模型 trained without labels 来分析您的表单。
如果没有标签的模型不能给您带来好的结果,请尝试 training it with labels。