问题描述
我正在使用Google Vision API从旧报纸中提取数据。我想从每份报纸的最后一页中提取绩效数据。当我使用Google云端硬盘的OCR时,格式信息会保留(即粗体和斜体),但是当我查看Google Vision创建的json时,看不到任何格式信息。在async_detect_document(gcs_source_uri,gcs_destination_uri)函数中是否可以保留格式?
下面是pdf和Google云端硬盘渲染的示例。从示例中您将看到,格式信息是查找每个表演的戏剧场所,作品,作者和演员的捷径。
解决方法
我在下面找到了答案。一位朋友建议我也可以尝试使用Google云端硬盘的API。