问题描述
我正在使用 scikit-learn 进行高斯过程回归建模。我的数据没有标准化。该模型总是返回0到1之间的标准偏差值,这与我的数据不符。有谁知道如何重新调整标准偏差值以获得实际标准偏差?
解决方法
我使用的一种方法是在 scikit-learn 中使用标准缩放器。在训练模型之前对数据集进行标准化是很自然的。
流程如下:
- 使用您的训练数据拟合缩放器(将缩放器表示为 SC)
- 转换您的数据集(使用 SC 进行训练和测试集)
- 使用标准化训练集训练您的 GPR 模型
- 使用 GPR 模型预测您的标准化测试集并获得输出
- 使用 SC 对您的均值和标准输出进行逆变换
希望对您有所帮助:)