表单识别器带标签的自定义模型未获取正确的数据

问题描述

目前,我正在使用 Form Recognizer 2.1 版预览从包含扫描图像的 PDF 文件提取数据。文本被正确获取,但值与标签的映射不符合预期。我使用自定义模型 Train with labels文件提取数据并使用 FOTT website 标记数据,这提供了手动标记数据的功能。我已经用手动标记的数据训练了 5 页的模型,但没有给出正确的响应。也试过 Train without labels 没有给出正确的结果。但是,该模型没有给出确切的结果。有些标签没有被提取,有些标签在结果​​中有不完整的值。我已阅读 Microsoft Docs 的文档以了解有关此认知服务的信息。它没有按预期给出正确的结果,我不明白这有什么问题。所以,我想知道没有得到正确结果的可能原因是什么。

解决方法

在训练模型时,您是否使用了来自相同结构的 5 个文档?为了改进模型,您还可以添加一些额外的文档,以便您的训练数据代表您尝试从中提取数据的文档。在分析文档时,如果缺少键值对,您可以将该文档添加到训练数据中并训练模型,以便它也可以针对该文档进行改进。