问题描述
我正在使用称为PurgedKFold交叉验证(https://mlfinlab.readthedocs.io/en/latest/implementations/cross_validation.html#implementation)的概念。
我有一个带有open_datetime属性和一个close_datetime属性的数据帧,该属性具有当前操作的打开和关闭时间间隔。我有下一个代码片段:
cv = PurgedKFold(
n_splits=5,samples_info_sets=pd.Series(df['close_datetime'].values,index = df['open_datetime'].values),pct_embargo=0.2,)
该想法是为交叉验证过程生成5个不同的折叠。
for a,(b,c) in enumerate(cv.split(X,y)):
...
a->折数 b和c是我不了解的元素。
我想将在每个折叠中选择的数据集的行提取为训练广告测试子集。我该怎么办?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)