标准Torchvision数据集索引是否必须是确定性的?

问题描述

我正在研究开放集检测,这意味着我必须按类别将数据集拆分(例如,将一个数据集拆分为两个数据集;某些类进入一个拆分数据集中,而其余的类进入其他)。我想构建一个简化该机制的机制,但是与其遍历整个数据集以发现每次需要拆分数据集的每个类相关联的索引,而是可以持久保留索引,那将是一个很好的选择与每个类相关联的磁盘,只需在需要拆分数据集时重新加载它们即可。

对于几个Torchvision标准数据集,似乎样本的索引是确定性的(由此,我的意思是每次实例化数据集类时,任何给定的索引i都将始终对应于同一幅图像)。通常,这似乎是数据集对象的一个​​非常有用的属性,并且肯定有必要将索引持久保存到磁盘以供以后使用。但是,在torchvision.datasets文档中没有提到任何内容,它为标准数据集提供了有关此属性的任何保证。

我在文档中缺少什么吗?我可以期望所有标准的Torchvision数据集类都具有此属性,并且可以期望此属性在将来的Torchvision版本中保持不变吗?还是我应该考虑随机样本指数?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)