解释验证损失

问题描述

我是神经网络的新手,我不知道如何将我得到的结果解释为验证损失的结果。我正在尝试使用张量流对图像进行分类。如果绘制每个时期后得到的结果,则会得到以下结果: enter image description here

我的训练准确度和验证准确度提高了,训练损失减少了,但是验证损失虽然有所下降,但与训练损失不是很接近,虽然有些刺耳。

我应该如何解释?我不了解验证损失中的更改。验证损失没有像训练损失那样减少的事实是否表示我过拟合?

(以防万一,我正在做25个纪元,批大小:128,学习率:0.0001,训练/验证拆分:0.4)

感谢您的帮助

解决方法

在验证丢失中加标并不是很常见,尤其是在早期。通常,过度拟合是由您的训练损失减少但每个时期的验证损失平稳期开始增加的情况表示的。通常,训练精度通常高于验证精度,而训练损耗则低于验证损耗。您可以做一些事情来帮助改善验证损失。如果模型过度拟合,则添加辍学层,或者如果您具有多个隐藏的密集层,则最初仅使用1,然后在训练精度较差的情况下添加更多。模型越复杂,过度拟合的机会就越少。此外,使用可调学习率也有帮助。可以设置Keras回调ReduceLROnPlateau来监视验证损失,如果损失无法减少,则可以降低学习率。文档为here.。使用回调ModelCheckpoint可以保存验证损失最少的模型,并使用该模型对测试集进行预测。文档为here.

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...