Google Vision是否检测到文本保留格式信息?

问题描述

我正在使用Google Vision API从旧报纸中提取数据。我想从每份报纸的最后一页中提取绩效数据。当我使用Google云端硬盘的OCR时,格式信息会保留(即粗体和斜体),但是当我查看Google Vision创建的json时,看不到任何格式信息。在async_detect_document(gcs_source_uri,gcs_destination_uri)函数中是否可以保留格式?

下面是pdf和Google云端硬盘渲染的示例。从示例中您将看到,格式信息是查找每个表演的戏剧场所,作品,作者和演员的捷径。

Original PDF of Newspaper

Google Drive OCR

解决方法

我在下面找到了答案。一位朋友建议我也可以尝试使用Google云端硬盘的API。

Does Google Cloud Vision API detect formatting in OCRed text like bold,italics,font name (helvetica or times new roman),etc?