Computer Vision 2.0 PDF到文本无法正常工作

问题描述

我正在尝试使用Computer Vision 2.0从PDF文件解析文本。我正在关注example,并将MediaTypeHeaderValue更改为“ application / pdf”。我收到一个错误,指出不支持内容类型。我将其更改为“ multipart / form-data”,并在处理中出现错误。如何使用Computer-Vision处理PDF文件

解决方法

Kevin, 您正在使用不支持PDF输入的旧版“ OCR” API。请使用"Read" API - see overview可用的新OCR技术处理PDF文档。自5月份起,GA中便已发布3.0版。 Read支持大图像以及长达2000页的多页和混合语言文档。 请参阅Read REST API QuickStart in C#

请注意,如果您不仅要提取文本,还希望从表单中提取表格见解(例如表格,复选框和键值对),使用预先构建的模型并构建自定义模型来处理文档,则Form Recognizer非常有用。 。现在在GA中。

,

看看用于从PDF提取数据的Form Recognizer服务。 https://azure.microsoft.com/en-us/services/cognitive-services/form-recognizer/