使用交叉验证时如何计算预测区间在 R 中?

问题描述

我想为我的回归模型找到预测区间。这是一个多元自适应回归样条 (MARS) 模型。

R 中的 earth 包提供了一个方差模型来估计预测区间。但是,我不清楚这里的正确程序是什么。我的观察相对较少,因此最终没有单一的测试集来评估性能。在第一步中,我使用交叉验证(在 caret 包中)来确定最佳超参数并估计预测误差(在我的情况下为 RMSE)。之后,我可以使用在完整输入数据集上估计的最终模型来估计预测间隔。但是,我觉得这样我会得到有偏见的结果,因为我没有估计未见数据的预测区间。

这里的合法方法是什么?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)