问题描述
我构建了一个带有标签的自定义模型来读取表单。如果扫描只包含表单的一个实例,这会很有效。但是一旦扫描包含多个相同类型的表单,就会创建一个混杂。 (Azure Form Recognizer v2.1-preview3 with sample labeling tool)
我本希望在这种情况下,在结果 JSON 中的分析结果 / 文档结果(每个检测到的模型实例一个元素)中返回几个数组元素。但情况似乎并非如此。相反,这些字段部分从第一个实例中读取,部分从第二个实例中读取。结果完全错误。
问题: 我是否必须在预处理步骤中将扫描分成单独的文档?对于表单识别器来说,这难道不是一个注定的任务,因为它知道模型。
实际结果:
{
"status": "succeeded","createdDateTime": "2021-04-07T09:41:33Z","lastUpdatedDateTime": "2021-04-07T09:41:46Z","analyzeResult": {
"version": "2.1.0","readResults": []
"pageResults": []
"documentResults": [
{
"docType": "xxxxxxx","modelId": "xxxxxxx","pageRange": [
1,6
],"fields": {...}
"docTypeConfidence": 0.778
}
],"errors": []
}
预期结果:
{
"status": "succeeded","readResults": []
"pageResults": []
"documentResults": [
{
"docType": "xxxxxxxx","modelId": "xxxxxxxx",3
],"fields": {...}
"docTypeConfidence": 0.778
},{
"docType": "xxxxxxxx","pageRange": [
4,"errors": []
}
}
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)