Google Vision OCR - 为什么阅读阿拉伯-印度数字如此糟糕并与波斯语混合?

问题描述

使用 Google Vision OCR 效果很好,但有一个非常大的问题!它将阿拉伯-印度语和波斯语数字混为一谈,以至于大多数读数(尽管图像非常清晰)都弄错了数字,并且混淆了(٢ 阿拉伯语或 2 到 4 的波斯语,很少读 ٦ 阿拉伯语是 6 ),还有很多非常严重的错误

我使用语言提示但没有运气,它根本没有帮助。

文本阅读还可以,虽然如果我深入挖掘,我发现阿拉伯语、波斯语和乌尔都语之间混杂着字母(就 UTF-8 ord 而言),但它没有数字那么糟糕。

对此有何改进建议?

我知道数字有时很接近且难以区分,但令人讨厌的是它正在获取波斯语数字而语言提示是阿拉伯语!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)