Google Vision是否检测到文本保留格式信息？

问题描述

我正在使用Google Vision API从旧报纸中提取数据。我想从每份报纸的最后一页中提取绩效数据。当我使用Google云端硬盘的OCR时，格式信息会保留（即粗体和斜体），但是当我查看Google Vision创建的json时，看不到任何格式信息。在async_detect_document（gcs_source_uri，gcs_destination_uri）函数中是否可以保留格式？

下面是pdf和Google云端硬盘渲染的示例。从示例中您将看到，格式信息是查找每个表演的戏剧场所，作品，作者和演员的捷径。

Original PDF of Newspaper

Google Drive OCR

解决方法

我在下面找到了答案。一位朋友建议我也可以尝试使用Google云端硬盘的API。

Does Google Cloud Vision API detect formatting in OCRed text like bold,italics,font name (helvetica or times new roman),etc?

json ocr ocr