问题描述
我正在训练 SSD 模型来检测图像中的人脸,最大人脸数量为 20。 我使用 VGG16 作为模型的主干(带有预训练的权重)。 在 SSD 层之后,我为每张脸的位置和每张脸实际上是一张脸的概率添加了密集层:
#ssd is the last ssd layer
flt = keras.layers.Flatten()(ssd)
class_output = keras.layers.Dense(20,activation='sigmoid',name='output_class')(flt)
loc = keras.layers.Dense(20,activation='relu')(ssd)
loc_output = keras.layers.Reshape((20,2,2),name='output_loc')(loc)
class_output
的损失函数和度量函数是 binary_crossentropy
我有几个问题: 这是我应该做的方式吗?还是有另一种方法? 我应该为位置输出使用什么损失和度量函数?我考虑过使用 IoU 来衡量指标,但我不确定应该用什么来衡量损失...
非常感谢帮助者!!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)