视觉语言检测

问题描述

我正在使用 Apple 提供的 Vision 将一些图像转换为文本。 它运行良好,但我目前遇到的问题是汉字。

我目前正在这样做:

let request = VNRecognizeTextRequest(completionHandler: recognizeTextHandler)
request.recognitionLevel = .accurate
request.recognitionLanguages = try! VNRecognizeTextRequest.supportedRecognitionLanguages(for: .accurate,revision: request.revision)

而且看起来它支持一堆拉丁语言和中文

Vision 似乎能够自动检测到德语等语言就好了,但是我必须在 recognitionLanguages 属性的前面指定中文才能使用中文

有没有办法自动检测图片的语言?

解决方法

我必须在recognitionLanguages属性的前面指定中文才能使用中文

它是这样设计的。 .accurate 使用基于机器学习的识别器,由于中文非常复杂,所以必须放在第一位。在 8:02 观看 WWDC21 的 Extract document data using Vision

这也意味着无法自动检测图像的语言。