问题描述
我使用 keras
嵌入层的特征构建了一个 1D CNN 回归模型,以预测某些序列的分数。
我的模型在训练后的典型性能如下:
如您所见,预测训练数据的性能非常好,但似乎不能推广到预测验证和测试数据。
您对如何提高验证/测试集预测性能有任何建议,可能是通过交易训练数据的预测性能吗?(这可能吗?)
谢谢!
解决方法
这种差异可以用过度拟合来解释(很可能)。我要说的是,在拆分为训练、测试和验证之前的数据似乎没有被正确地打乱。否则,您的机器似乎足够强大,可以学习,因为您对它在训练集中的性能感到满意,所以只需尝试调整其超参数以平衡偏差-方差权衡。我不能肯定地告诉你它的过度拟合的原因是因为你的指标存在平均绝对误差,所以尽管这些曲线看起来非常不同,但差异可以通过涉及百分比这一事实来解释。
避免过度拟合的方法是 Dropout 层、权重正则化等。