问题描述
我是神经网络的新手。我刚开始使用CNN进行一个项目,该项目使用的数据集是从同一协方差矩阵生成的200万个案例。 当我尝试5倍交叉验证时,报告的4个验证的准确性约为.9。但是,一项验证仅报告了.1的准确性。我不明白为什么会这样。我认为,因为所有数据都是从相同的协方差矩阵生成的,所以所有验证的准确性都应该低或全部高。我使用下面的train_test_split函数进行折叠:
for I in range(0,n_folds):
t_x,val_x,t_y,val_y = train_test_split(flat_act_list,flat_act_list_T,test_size=0.2,shuffle=False)
我犯了一些错误吗? 有人请解释这种情况(每次验证的准确性差异很大)何时发生?
解决方法
您的数据集似乎已排序。尝试将shuffle=False
更改为shuffle=True
,您的交叉验证应该更加接近。