问题描述
我有一个包含RGB图像的图像数据集:img1.png,img2.png ... img250.png。我从每个图像中提取了大小为[64,64,3]
的100个小补丁。所以,我现在有了 img1_1.png,img1_2.png ... img1_100.png,img2_1.png,img2_2.png,... img2_100.png,img3_1,.... 的数据集。
我想用tf.data.dataset.from_tensor_slices
创建一个数据生成器,以将每个图像的所有补丁传递给RNN模型。因此,我想生成器创建如下输出:[batch_size,100,3]
我该怎么做?
250:是图像数, 100:是从每个图像中提取的补丁数量, 64,3:每个补丁的大小
例如,对于每个迭代,我想例如从250张图像中随机选择32张,并将它们的全部100个色块放在一起,并创建以下格式(32,3)
由于内存的使用,我无法将所有数据加载到变量中。我只有25000个名为 img1_1.png,img1_2.png ... img1_100.png,img2_1.png,img2_2.png,... img2_100.png,img3_1,..... img250_1.png的补丁,img250_2.png ... img250_100.png。
我认为最好使用格式
tf.data.dataset.from_tensor_slices((patch_files,labels)),but I don't kNow how.
还要注意,标记向量的大小为(250,1)。如果批次大小为32,则生成器应输出大小为(32,1)的标签批次
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)