Computer Vision 2.0 PDF到文本无法正常工作

问题描述

我正在尝试使用Computer Vision 2.0从PDF文件解析文本。我正在关注example，并将MediaTypeHeaderValue更改为“ application / pdf”。我收到一个错误，指出不支持内容类型。我将其更改为“ multipart / form-data”，并在处理中出现错误。如何使用Computer-Vision处理PDF文件？

解决方法

Kevin，您正在使用不支持PDF输入的旧版“ OCR” API。请使用"Read" API - see overview可用的新OCR技术处理PDF文档。自5月份起，GA中便已发布3.0版。 Read支持大图像以及长达2000页的多页和混合语言文档。请参阅Read REST API QuickStart in C#。

请注意，如果您不仅要提取文本，还希望从表单中提取表格见解（例如表格，复选框和键值对），使用预先构建的模型并构建自定义模型来处理文档，则Form Recognizer非常有用。。现在在GA中。

看看用于从PDF提取数据的Form Recognizer服务。 https://azure.microsoft.com/en-us/services/cognitive-services/form-recognizer/

azure azure azure-cognitive-services computer-vision pdf