获取图像中每个字母的矩形边界 一个像素的能量计算

问题描述

所以我试图用图像文件中每个字母的边界填充ArrayList<Rectangle>

例如,给定这张.png图片

enter image description here

我想用14个ArrayList<Rectangle>(每个字母一个矩形)填充一个Rectangle

我们可以假设图像仅包含两种颜色,一种用于背景,一种用于字母,在这种情况下,像素将是白色或红色。

起初,我以为我可以搜索字母之间的白列,然后,如果我发现了一个全白列,我可以通过获取最低的红色像素值和最高的红色像素值来获得宽度,{ 1}},依此类推:

width = maxX-minX

问题在于字母之间没有空格,甚至没有1个像素:

enter image description here

我的下一个想法是,对于找到的每个红色像素,寻找一个尚未被发现的邻居,然后,如果我找不到一个邻居,我将拥有所有像素来获取该字母的边界。但是通过这种方法,我将获得2个矩形,用于像“ i”这样的字母,然后我可以编写一些算法来合并这些矩形,但是我不知道如何将其与其他多部分字母合并,在尝试之前,我想在这里问更多的想法

那么你们有什么想法吗?

解决方法

您可以使用OpenCV cv2.findContours()函数。不用使用cv2.drawcontours()函数绘制轮廓(突出显示字母的轮廓),而是可以使用cv2.rectangle并从{{1 }}功能。

,

如果不使用像OpenCV这样的库,我认为两步算法就足以解决问题。

  1. 直方图
  2. 接缝计算

1。直方图

C.....C..C...
.C.C.C...C...
. C.C....CCCC
1111111003111
  • 点(.)表示背景颜色(白色)
  • C表示背景颜色以外的任何颜色(在您的情况下为红色)

累计非背景颜色的垂直像素数会生成直方图。

        *
        *
******..****
0123456789AB

很明显,边界存在于6和7

2。接缝计算

由于完全没有空的垂直线,因此无法通过直方图解决We之类的情况。

接缝雕刻算法为我们提供了一些提示

更详细的实现见

一个像素的能量计算

enter image description here

红色数字不是像素的颜色值,而是从相邻像素计算出的能量值。

能量最小的垂直路径为我们提供了每个字符的边界。 enter image description here

3。在更多...

需要统计数据来确定是否应用接缝雕刻。

  • 最大和最小字符宽度

即使直方图为我们提供了垂直边界,也不清楚一个组中是否有两个或多个字符。