TensorFlow：如何将图像转换为一维张量？

问题描述

我最近使用mnist数据集建立了一个用于预测手写整数的模型。我现在想使用自己的图像。我的图像是28x28像素（如mnist集），但是当我尝试使用tf.image.decode_png将它们转换为张量时，我得到了3D张量[28，28，4]。通过阅读，我相信额外的4个与RGB有关。我该如何转换为[28，28]而忽略任何色阶（如果这是实际的问题，也许我完全错过了某些东西）。

谢谢！

解决方法

正如您正确地说的那样，您获得了3D张量，因为您的图像具有3个RGB通道。您可以使用类似tf.image.rgb_to_grayscale之类的东西来获取想要的东西。

mnist png tensorflow tensorflow tensorflow