问题描述
我正在尝试构建一个像这样的模型。
请注意,填充层的输出形状为1 * 48 * 48 * 32
。填充层的输入形状为1 * 48 * 48 * 16
。哪种填充操作?
我的代码:
prelu3 = tf.keras.layers.PReLU(shared_axes = [1,2])(add2)
deptconv3 = tf.keras.layers.DepthwiseConv2D(3,strides=(2,2),padding='same')(prelu3)
conv4 = tf.keras.layers.Conv2D(32,1,strides=(1,1),padding='same')(deptconv3)
maxpool1 = tf.keras.layers.MaxPool2D()(prelu3)
pad1 = tf.keras.layers.ZeroPadding2D(padding=(1,1))(maxpool1) # This is the padding layer where problem lies.
这是试图复制该块的代码的一部分。但是,我得到的模型看起来像这样。
解决方法
默认情况下,keras maxpool2d接受:
Input shape : 4D tensor with shape (batch_size,rows,cols,channels).
Output shape : (batch_size,padded_rows,padded_cols,chamels)
请在此处查看keras中的zero_padding2d层文档。
从这方面来说,您正在尝试将此处被视为频道的内容加倍。 您的输入看起来更像(batch,x,y,z),而您想要一个(batch,x,y,2 * z) 为什么要用零填充将z翻倍?我宁愿建议您使用像
tf.keras.layers.Dense(32)(maxpool1)
这会使z形状从16增加到32。
编辑:
我有一些可以帮助您的东西。
tf.keras.layers.ZeroPadding2D(
padding=(0,8),data_format="channels_first"
)(maxpool1)
这是将y,z视为(x,y),将x视为通道,并在(y,z)周围填充(0,8)以得到(y,32)
演示:
import tensorflow as tf
input_shape = (4,28,3)
x = tf.keras.layers.Input(shape=input_shape[1:])
y = tf.keras.layers.Conv2D(16,3,activation='relu',dilation_rate=2,input_shape=input_shape[1:])(x)
x=tf.keras.layers.ZeroPadding2D(
padding=(0,data_format="channels_first"
)(y)
print(y.shape,x.shape)
(None,24,16) (None,32)