android – 图像预处理步骤,以提高识别率

我正在为我的项目使用TessBaseAPI制作一个简单的OCR Android应用程序.我做了一些图像预处理步骤,如二值化和图像增强.但他们的结果是50%到60%.我们如何提高识别率?

包括两个样本图像.

http://imageshack.us/photo/my-images/94/1school.jpg/

http://imageshack.us/photo/my-images/43/15071917.jpg/

解决方法:

以上对上述命令的补充适用于您的第二个图像:

-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \

他们为结果添加适当水平的偏斜和裁剪,以便Tesseract的生活变得更容易……

所以完整的命令应该是以下内容,它会在我的系统上产生正确的结果:

convert 15071917.jpg            \
   -type grayscale              \
   -negate                      \
   -gamma 1                     \
   -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  \
   -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
   -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
   -negate                      \
   -deskew 40%                  \
   +repage                      \
   -crop 393x110+0+0            \
    15071917.png                \
&&                              \
tesseract 15071917.png OUT && cat OUT.txt

  Tesseract Open Source OCR Engine v3.01 with Leptonica
    Page 0
    TESCO

这是原始图片(左),带有修改后命令的结果图片(右):

相关文章

Android性能优化——之控件的优化 前面讲了图像的优化,接下...
前言 上一篇已经讲了如何实现textView中粗字体效果,里面主要...
最近项目重构,涉及到了数据库和文件下载,发现GreenDao这个...
WebView加载页面的两种方式 一、加载网络页面 加载网络页面,...
给APP全局设置字体主要分为两个方面来介绍 一、给原生界面设...
前言 最近UI大牛出了一版新的效果图,按照IOS的效果做的,页...