如何使用游戏中的像素化计算机字体对屏幕截图进行OCR

问题描述

我正在尝试对下面的图像进行OCR,但结果却很差。

我尝试OCR的图像仅包含一种字体。字母在一个部分中带有下划线,并且某些单词可以显示为不同的颜色。单词之间有时也有一些我不希望在最终文本中使用的图标。文本出现在图像的特定有界框中。

这是我第一次尝试这种方法,因此我不确定哪种方法是好的,欢迎大家提出建议。我使用了tesseract,因为它涉及到我所做的所有搜索。鉴于只使用一种字体,并且没有手写或背景材料,所以我希望能够通过某种方法获得非常高的准确性。

您可以在以下位置找到完整的代码和原始的,无损的图像:https://github.com/KostasKgr/siralim-ultimate-ocr

示例图片https://raw.githubusercontent.com/KostasKgr/siralim-ultimate-ocr/master/mainPage.png

Sample image

完整图像的OCR(使用阈值设置):

US ert ste
Chaos *Wuyvern

or car
Sas ta} Br a.
veers rT aes a
Pash ae Ks ae
AM) 15 a oh
Sey 20 eas i

{fetes ital ek

Arter an eneny *. Casts a spell on all your
creatures,this creature has a 50¢ chance ta
+. Cast the spell on the enemy creatures as
ee
♀

我手动裁剪的仅统计部分的OCR,不包含图像/图标/颜色(使用阈值设置):

Health
Attack
Intelligence
Wetted et)
Speed

Bay

fe}
ay
rl}
♀

使用的Tesseract版本:

tesseract v5.0.0-alpha.20200328
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE
 Found libarchive 3.3.2 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5
 Found libcurl/7.59.0 OpenSSL/1.0.2o (WinSSL) zlib/1.2.11 WinIDN libssh2/1.7.0 nghttp2/1.31.0

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)