问题描述
因此,我一直在使用TensorFlow数据集构建模型,并且试图观察模型对不平衡数据的影响。首先,我想创建不平衡版本的Dogs vs Cats。因此,基本上,每只猫和狗都有12500只,但是在加载数据集时,我只想占用cat类的10%。如何在split
函数中为数据集配置load
参数?
tfds.load('cats_vs_dogs')
谢谢!
解决方法
看着 https://www.tensorflow.org/datasets/splits 和 https://www.tensorflow.org/datasets/catalog/cats_vs_dogs 似乎没有办法用split选项来做你想做的事情。您必须加载数据集,然后手动删除一些猫/添加多余的狗。