为什么在训练Tensorflow对象检测ssd mobilenet模型时我的训练损失很高?

问题描述

我正在尝试使用tensorflow api模型ssd移动网络创建自己的自定义对象检测器,但是问题是当模型开始训练时,损耗非常高,如700-800,并且损耗不断波动,我看到的是相同的损失的价值不断重复,有人可以向我解释一下。我最初训练了7000个步骤的模型,但是损失并没有减少,然后我又开始训练模型。我正在分享新培训的屏幕截图。我已经坚持了将近两天,非常感谢您的帮助。 我的火车数据集中有16482张图像,并且图像尺寸为64x64

loss

解决方法

请检查所有图像应为相同格式(JPG或JPEG)的图像格式,删除PNG图片,然后尝试进行培训

,

如果你确定你的数据集没问题,那么这个问题可能与你的模型的学习率有关。如果您使用 tensorflow 对象检测器,您可以在基本迁移学习模型的配置文件中更改此学习率