使用交叉验证时如何计算预测区间在 R 中？

问题描述

我想为我的回归模型找到预测区间。这是一个多元自适应回归样条 (MARS) 模型。

R 中的 earth 包提供了一个方差模型来估计预测区间。但是，我不清楚这里的正确程序是什么。我的观察相对较少，因此最终没有单一的测试集来评估性能。在第一步中，我使用交叉验证（在 caret 包中）来确定最佳超参数并估计预测误差（在我的情况下为 RMSE）。之后，我可以使用在完整输入数据集上估计的最终模型来估计预测间隔。但是，我觉得这样我会得到有偏见的结果，因为我没有估计未见数据的预测区间。

这里的合法方法是什么？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

caret cross-validation prediction