功能选择:嵌套交叉验证

问题描述

我想选择功能,并使用嵌套交叉验证评估模型性能。 但是,我无法判断以下方法是否合适。

  1. 通过5倍交叉验证(训练外和测试外)将数据拆分为训练并在外环进行测试
  2. 将火车外部分割成火车,并通过5倍交叉验证(火车内部和内部有效)在内部循环中有效
  3. 使用train-inner通过相关系数(例如,阈值保持:0.95)选择特征
  4. 使用train-inner和valid-inner通过网格搜索来调整机器学习模型(例如支持向量机)的参数
  5. 使用训练外来训练机器学习模型,并使用测试外来评估模型性能

以上方法正确且通用吗?

此外,过程3意味着每次折叠都会选择不同的功能。 我应该如何确定哪些功能很重要?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)