如何使用scikit-learn高斯过程回归器重现GPy GPRegression的结果?

问题描述

GPRegression(GPy)和高斯过程回归器(scikit-learn)都使用相似的初始值和相同的优化器(lbfgs)。为什么结果差异很大?

#!pip -qq install pods
#!pip -qq install GPy
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF,ConstantKernel as C
from sklearn.preprocessing import StandardScaler
import pods
data = pods.datasets.olympic_marathon_men()
X = StandardScaler().fit_transform(data['X'])
y = data['Y']
# scikit-learn
model = GaussianProcessRegressor(C()*RBF(),n_restarts_optimizer=20,random_state=0)
model.fit(X,y)
print(model.kernel_)

# GPy
from GPy.models import GPRegression
from GPy.kern import RBF as GPyRBF
model = GPRegression(X,y,GPyRBF(1))
model.optimize_restarts(20,verbose=0)
print(model.kern)

结果

2.89**2 * RBF(length_scale=0.173)
  rbf.         |               value  |  constraints  |  priors
  variance     |  25.399509298957504  |      +ve      |        
  lengthscale  |   4.279767394389103  |      +ve      |        

解决方法

GPy RBF()内核等效于scikit-learn ConstantKernel()*RBF() + WhiteKernel()。使用此工具,我可以在两者中获得可比的结果。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...