使用 pytorch 预训练模型进行预测时所需的图像大小

问题描述

我使用 PyTorch 的 resnet-18 来预测图像。我读过 (224,224) 是此模型的图像大小。但是当我尝试将图像大小调整为 (124,124)(324,324) 时,它仍然有效。谁能告诉我为什么?

解决方法

在 pytorch 上实现 ResNet 变体在全连接层之前带有一个 AdaptiveAvgPool2D 层,确保输出特征始终为 fc 层的正确形状,无论输入大小如何。

此外,建议输入大小为 224x224,以防止填充量不理想。