关于张量流数据集的等号并没有真正为变量分配值

问题描述

使用tensorflow数据集操作时,我发现了一些有趣的东西。让我先向您展示代码:

import tensorflow as tf
dataset = tf.data.Dataset.range(10)
dataset1=dataset.shuffle(10,reshuffle_each_iteration=False) 
dataset2=dataset.shuffle(10,reshuffle_each_iteration=True)

ds11=dataset1.take(7)
ds12=dataset1.skip(7)
ds21=dataset2.take(7)
ds22=dataset2.skip(7)
ds22s=ds22.shuffle(7)
print(list(dataset2.as_numpy_iterator()))
print(list(ds11.as_numpy_iterator()))
print(list(ds12.as_numpy_iterator()))
print(list(ds21.as_numpy_iterator()))
print(list(ds22.as_numpy_iterator()))
print(list(ds22s.as_numpy_iterator()))

输出:

[3,0,7,9,8,5,4,1,6,2]

[2,0,4,8,8,5,6]

[1,9,7]

[2,6,8,0,7,3,9]

[2,8,5]

[1、0、2]

因此,问题在于最后两个打印结果应具有相同的元素(当然顺序不相同);但是,正如您所看到的,事实并非如此。

我的猜测是 ds22 并没有真正分配,而是我们定义了如何获取它的操作,因此当我们使用它时,所需的数据可以由数据库自动生成。定义的操作。

或者,有人可以解释吗?

解决方法

考虑此代码

import tensorflow as tf
dataset = tf.data.Dataset.range(10)
dataset1=dataset.shuffle(10,reshuffle_each_iteration=False) 
dataset2=dataset.shuffle(10,reshuffle_each_iteration=True)

ds11=dataset1.take(7)
ds12=dataset1.skip(7)
ds21=dataset2.take(7)

ds22=dataset2.skip(7)
ds22s=ds22 #.shuffle(7)
print(list(dataset2.as_numpy_iterator()))
print(list(ds11.as_numpy_iterator()))
print(list(ds12.as_numpy_iterator()))
print(list(ds21.as_numpy_iterator()))
print(list(ds22.as_numpy_iterator()))
print(list(ds22s.as_numpy_iterator()))

结果相同。 背后的原因是,当您编写ds22=dataset2.skip(7)时,您的意思是先获取7个样本,然后丢弃并再显示一个样本。 因此,当您编写print(list(ds22.as_numpy_iterator()))时,将从该数据集中读取所有剩余数据,并将其作为列表返回。 现在,如果您进行分配,则意味着ds22s中的对象与ds22中的对象完全相同。因此,通过编写print(list(ds22s.as_numpy_iterator())),您可以再次遍历整个数据集,这次应用了不同的改组。如果禁用reshuffle_each_iteration,则结果将相同,因为在数据集的第二次迭代中,改组对齐方式完全相同。 我希望这回答了你的问题。随时询问详细信息。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...