问题描述
我正在尝试使用 OpenCV 2.4 训练一个 HAAR 分类器来检测壁球拍的头部。 不幸的是,准确性方面的结果相当糟糕,我想了解我的过程的哪一部分存在缺陷。在这一点上,我不担心性能,因为我不会将其用作实时检测器。
负样本
正样本
我一共创建了4168个正样本,其中
- 168 是手动注释的游戏记录镜头
- 4000 是使用 opencv_createsamples 创建的样本
opencv_createsamples -img img/sample/r2_white.png -bg img/neg.txt -info img/generated/info.txt -pngoutput img/generated -maxxangle 0.85 -maxyangle -0.85 -maxzangle 0.85 -num 4000
我使用了相对较高的最大角度,因为我觉得这更能代表壁球拍在比赛录音中的表现。
矢量
将手动标注的和生成的样本的标注合并后,我创建了带有以下参数的向量:opencv_createsamples -info img/pos_all.txt -num 4168 -w 25 -h 25 -vec model/vector/positives_all.vec -maxxangle 0.85 -maxyangle -0.85 -maxzangle 0.85
培训
我使用以下参数训练了模型。再次添加 -mode ALL 因为我觉得功能的旋转会更能代表现实世界的壁球游戏。opencv_traincascade -data ../model -vec ../model/vector/positives_all.vec -bg neg.txt -numPos 3900 -numNeg 7000 -numStages 10 -w 25 -h 25 -numThreads 12 -maxFalseAlarmRate 0.3 -mode ALL -precalcValBufSize 3072 -precalcIdxBufSize 3072
训练总共花费了大约 10 个小时,但即使在最后阶段的第 100 个样本中,误报仍然是 0.84(前提是我正确解释了训练输出)。 在第 5 阶段结束时最低为 0.74。
====== 9 阶段训练 =====
POS 数量:消耗 3900:4095
NEG 计数:acceptanceRatio 7000:0.0304295
预计算时间:16
N | 人力资源 | FA |
---|---|---|
1 | 1 | 1 |
2 | 1 | 1 |
3 | 1 | 1 |
4 | 1 | 1 |
5 | 1 | 1 |
6 | 1 | 1 |
7 | 1 | 0.998857 |
... | ... | ... |
98 | 0.995128 | 0.840857 |
99 | 0.995128 | 0.850571 |
100 | 0.995128 | 0.842714 |
结束>
结果
分类器似乎做得不好,也有大量的误报和漏报。
我尝试了 minNeighbors 和 scaleFactor 参数,但无济于事。在下面的情况下,我使用的是 detectMultiScale(gray,2,75)
:
问题
- 我的用例是否现实?是否有任何原因使球拍特别难以被发现?
- 我的阳性样本是否足够?
- 用于训练的正负样本比例 (3900:7000) 是否足够?
- 我的培训方法是否合适?
- 我的训练参数(例如球拍形状中的特征高度/宽度)有什么问题吗?
- 我的误报率在训练期间停滞不前的原因是什么?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)