Keras 模型形状不兼容/ValueError:Shapes (None, 3) 和 (None, 3, 3) 不兼容

问题描述

我正在尝试训练我的 keras 模型,但形状不兼容。 错误

ValueError: Shapes (None,3) and (None,3,3) are incompatible

我的训练集的形状是 (2000,768),标签的形状是 (2000,3)。

有什么问题吗?

模型定义和拟合代码

input_shape = x_train.shape[1:]
model = my_dnn(input_shape,3)
model.fit(x_train,y_train,epochs=25,verbose=1)

型号代码

def my_dnn(input,num_classes):

    model = Sequential()
    model.add(tf.keras.Input(input))
    model.add(Dense(1024))
    model.add(Activation('relu'))
    model.add(Dropout(0.5))
    model.add(Dense(512))
    model.add(Activation('relu'))
    model.add(Dense(225))
    model.add(Activation('relu'))
    model.add(Dense(100))
    model.add(Activation('relu'))
    model.add(Dense(num_classes))
    model.add(Activation('sigmoid'))


    model.compile( loss='categorical_crossentropy',optimizer='adam',metrics=[tf.keras.metrics.SparseCategoricalAccuracy()])

    return model

解决方法

除此之外,您似乎还携带输入数据的第二个维度,直到模型结束。所以你的模型摘要是这样的:

Layer (type)                 Output Shape              Param #   
=================================================================
dense_1 (Dense)              (None,3,1024)           787456    
_________________________________________________________________
activation_1 (Activation)    (None,1024)           0         
_________________________________________________________________
dropout_1 (Dropout)          (None,1024)           0         
_________________________________________________________________
dense_2 (Dense)              (None,512)            524800    
_________________________________________________________________
activation_2 (Activation)    (None,512)            0         
_________________________________________________________________
dense_3 (Dense)              (None,225)            115425    
_________________________________________________________________
activation_3 (Activation)    (None,225)            0         
_________________________________________________________________
dense_4 (Dense)              (None,100)            22600     
_________________________________________________________________
activation_4 (Activation)    (None,100)            0         
_________________________________________________________________
dense_5 (Dense)              (None,3)              303       
_________________________________________________________________
activation_5 (Activation)    (None,3)              0         
=================================================================
Total params: 1,450,584
Trainable params: 1,584
Non-trainable params: 0

如您所见,模型 (None,3) 的输出形状与标签的形状 (None,3) 不兼容,在某些时候,您需要使用 Flatten 层。

,

有两个可能的原因:

  1. 您的问题是多类分类,因此您需要 softmax 而不是 sigmoid + accuracyCategoricalAccuracy() 作为指标。
  2. 您的问题是多标签分类,因此您需要 binary_crossentropytf.keras.metrics.BinaryAccuracy()

根据您的数据集的构建方式/您尝试解决的任务,您需要选择其中之一。

对于案例 1,请确保您的数据是 OHE(one-hot 编码)。

此外,Marco Cerliani 和 Amir(在下面的评论中)指出数据输出需要采用 2D 格式而不是 3D 格式:您应该在将数据提供给网络之前相应地预处理数据或按照建议使用在下面的评论中,一个 Flatten()(可能在最后一个 Dense() 之前)