问题描述
朋友,
我尝试训练神经网络进行回归。在使用 Keras 的 SGD 优化器类时,我突然在第一步后从我的网络中获得了 NAN 值作为预测。在我使用 Adam 优化器类进行培训之前,一切正常。我已经尝试改变 SGD 的学习率,但在第一步和编译后仍然出现 NAN 值作为模型预测。
由于我的训练使用了 Adam 优化器,我不相信我的输入会导致 NAN。我已经检查了 NaN 的输入值并删除了所有这些值。那么是什么导致了这种行为?
这是我的代码:
from keras.optimizers import Adam
from keras.optimizers import SGD
model = Sequential()
model.add(Dense(300,input_shape=(50,),kernel_initializer='glorot_uniform',activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(300,activation='relu')) model.add(Dropout(0.3))
model.add(Dense(500,activation='relu')) model.add(Dropout(0.3))
model.add(Dense(400,activation='relu')) model.add(Dense(1,activation='linear'))
opt = SGD(lr=0.001,decay=1e-6)
model.compile(loss='mse',optimizer=opt)
model.fit(x_train,y_train,epochs=100,batch_size=32,verbose=0,validation_data=(x_test,y_test))
#print(type(x_train)) ='pandas.core.frame.DataFrame'>
#print( x_train.shape) = (10000,50)
感谢您的建议。
问候 ML 学生
解决方法
使用人工神经网络进行回归有点棘手,因为输出没有上限。
损失函数中的 NaN 很可能是因为梯度爆炸。 使用 Adam 时不显示 NaN 的原因是 Adam 调整了学习率。 Adam 大部分时间都在工作,因此只要没有特定原因,请避免使用 SGD。
我不确定您的数据集包含什么,但是您可以尝试:
- 添加 L2 正则化
- 规范化输入
- 增加批量大小。