问题描述
我使用tesseract.js从图像中检测文本,并使用 tessedit_pageseg_mode:AUTO 模式,因此我可以从漫画中检测文本。由于这些文本随机放置在文本气泡内的不同位置。 / p>
我在使用英文文本识别时非常成功,并且在将HOCR转换为div时获得了非常好的结果。 例如。
In this image as you can see text was detected properly and i overlaped it with div and same text
但是当我更改英语以外的其他语言时,请说日语
Than HOCR gives huge blogs at a place where text is not there
1。因此,如果可能,我想解决上述错误,其中“自动:模式不适用于其他语言或。 2.一种在我的chrome扩展程序中添加语音气泡检测的方法,该方法会将检测到的博客发送到tesseract.js,从而解决整个问题。
非常感谢您
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)