问题描述
我对训练回归模型以预测价格(数值)感兴趣,我有两个数据源。一个来自2019年,另一个年份是2020年。2019年的数据比2020年多3倍。我知道我可以做过抽样以调整这种不平衡数据。
但是,有什么方法可以在完全连接的中性网络中调整训练权重?像class_weight还是sample_weight?
顺便说一句,该模型中将不使用年份(2019年和2020年)。 谢谢。
解决方法
看看https://datascience.stackexchange.com/questions/31129/sample-importance-training-weights-in-keras。他们详细解释了您要寻找的东西。
无论如何,如果年份信息无用,为什么还要调整权重?如果实际上没有用,则无需关心。
,TensorFlow还撰写了有关如何处理不平衡数据的指南,您可以阅读它here