自训练 HAAR 分类器导致准确率低得令人失望 负样本正样本矢量培训结果问题

问题描述

我正在尝试使用 OpenCV 2.4 训练一个 HAAR 分类器来检测壁球拍的头部。 不幸的是,准确性方面的结果相当糟糕,我想了解我的过程的哪一部分存在缺陷。在这一点上,我不担心性能,因为我不会将其用作实时检测器。

负样本

  • 我使用了一些在线图像数据库获取随机图片(不同宽度和高度)。

    negative 1

    enter image description here

  • 我还添加了一些与壁球相关的负面图像,例如空荡荡的球场,或球场上看不到球拍头的球员照片(总共不到 20 个)。

    negative manual

正样本

我一共创建了4168个正样本,其中

  • 168 是手动注释的游戏记录镜头

    manually annotated 1

    manually annotated 2

  • 4000 是使用 opencv_createsamples 创建的样本
    opencv_createsamples -img img/sample/r2_white.png -bg img/neg.txt -info img/generated/info.txt -pngoutput img/generated -maxxangle 0.85 -maxyangle -0.85 -maxzangle 0.85 -num 4000
    我使用了相对较高的最大角度,因为我觉得这更能代表壁球拍在比赛录音中的表现。

    generated 1

    generated 2

矢量

将手动标注的和生成的样本的标注合并后,我创建了带有以下参数的向量:
opencv_createsamples -info img/pos_all.txt -num 4168 -w 25 -h 25 -vec model/vector/positives_all.vec -maxxangle 0.85 -maxyangle -0.85 -maxzangle 0.85

培训

我使用以下参数训练了模型。再次添加 -mode ALL 因为我觉得功能的旋转会更能代表现实世界的壁球游戏。
opencv_traincascade -data ../model -vec ../model/vector/positives_all.vec -bg neg.txt -numPos 3900 -numNeg 7000 -numStages 10 -w 25 -h 25 -numThreads 12 -maxFalseAlarmRate 0.3 -mode ALL -precalcValBufSize 3072 -precalcIdxBufSize 3072

训练总共花费了大约 10 个小时,但即使在最后阶段的第 100 个样本中,误报仍然是 0.84(前提是我正确解释了训练输出)。 在第 5 阶段结束时最低为 0.74。

====== 9 阶段训练 =====
POS 数量:消耗 3900:4095
NEG 计数:acceptanceRatio 7000:0.0304295
预计算时间:16

N 人力资源 FA
1 1 1
2 1 1
3 1 1
4 1 1
5 1 1
6 1 1
7 1 0.998857
... ... ...
98 0.995128 0.840857
99 0.995128 0.850571
100 0.995128 0.842714

结束>

结果

分类器似乎做得不好,也有大量的误报和漏报。 我尝试了 minNeighbors 和 scaleFactor 参数,但无济于事。在下面的情况下,我使用的是 detectMultiScale(gray,2,75)

outcome

问题

  1. 我的用例是否现实?是否有任何原因使球拍特别难以被发现?
  2. 我的阳性样本是否足够?
    • 生成的样本中的角度或缺少透明背景是否有问题?
    • 还是手动注释到生成的样本 (168:4000) 的比例不够?
  3. 用于训练的正负样本比例 (3900:7000) 是否足够?
  4. 我的培训方法是否合适?
    • 我的训练参数(例如球拍形状中的特征高度/宽度)有什么问题吗?
    • 我的误报率在训练期间停滞不前的原因是什么?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...