检测窗口的起始大小是多少?

问题描述

使用cv2.HOGDescriptor().detectMultiScale时,所使用的检测窗口的起始大小是多少?它和我的训练数据大小一样吗? 例如,如果我的训练数据都是64 * 128图像,则检测窗口从64 * 128开始?

以及如何使用比例因子?例如,如果我想在尺寸为640 * 512的图像上检测到人,并且设置了scale=1.05,那么如何使用1.05?

解决方法

默认情况下,检测窗口始终为 64 x 128。为了适应多尺度,图像将逐渐缩放以创建图像金字塔,同时保持64 x 128的检测窗口不变。这实现了在较大尺寸的搜索窗口中搜索人员以保持搜索窗口大小相同的效果。通过按比例因子逐渐减小图像大小,直到64 x 128搜索窗口不再适合重新缩放的图像,即可构建图像金字塔。因此,如果您的搜索图像已经包含64 x 128张图像,那么将只有一个比例尺。

这将转到您的下一个问题,如果class="MainPanel",我们将通过scale=1.05rows / (scale ** i)逐步将输入图像行和列的大小调整为cols / (scale ** i),从而生成图像金字塔提供图像金字塔。对于金字塔中的每个图像,我们使用64 x 128搜索窗口查找感兴趣的对象。