奇怪的填充层输出

问题描述

我正在尝试构建一个像这样的模型。

请注意，填充层的输出形状为1 * 48 * 48 * 32。填充层的输入形状为1 * 48 * 48 * 16。哪种填充操作？

我的代码：

    prelu3 = tf.keras.layers.PReLU(shared_axes = [1,2])(add2)
    deptconv3 = tf.keras.layers.DepthwiseConv2D(3,strides=(2,2),padding='same')(prelu3)
    conv4 = tf.keras.layers.Conv2D(32,1,strides=(1,1),padding='same')(deptconv3)
    maxpool1 = tf.keras.layers.MaxPool2D()(prelu3)
    pad1 = tf.keras.layers.ZeroPadding2D(padding=(1,1))(maxpool1) # This is the padding layer where problem lies.

这是试图复制该块的代码的一部分。但是，我得到的模型看起来像这样。

我在这里丢失了某些东西还是使用了错误的图层？

解决方法

默认情况下，keras maxpool2d接受：

Input shape : 4D tensor with shape (batch_size,rows,cols,channels).
Output shape : (batch_size,padded_rows,padded_cols,chamels)

请在此处查看keras中的zero_padding2d层文档。

从这方面来说，您正在尝试将此处被视为频道的内容加倍。您的输入看起来更像（batch，x，y，z），而您想要一个（batch，x，y，2 * z）为什么要用零填充将z翻倍？我宁愿建议您使用像

tf.keras.layers.Dense(32)(maxpool1)

这会使z形状从16增加到32。

编辑：

我有一些可以帮助您的东西。

tf.keras.layers.ZeroPadding2D(
    padding=(0,8),data_format="channels_first"
)(maxpool1)

这是将y，z视为（x，y），将x视为通道，并在（y，z）周围填充（0，8）以得到（y，32）

演示：

import tensorflow as tf
input_shape = (4,28,3)
x = tf.keras.layers.Input(shape=input_shape[1:])
y = tf.keras.layers.Conv2D(16,3,activation='relu',dilation_rate=2,input_shape=input_shape[1:])(x)
x=tf.keras.layers.ZeroPadding2D(
    padding=(0,data_format="channels_first"
)(y)
print(y.shape,x.shape)

(None,24,16) (None,32)

keras keras-layer python tensorflow