问题描述
我正在尝试保存优化的高斯过程模型以用于其他脚本中。我目前的思路是利用GPy内置的to_dict
和from_dict
函数将模型信息存储在json文件中。类似于:
import GPy
import numpy as np
import json
X = np.random.uniform(-3.,3.,(20,1))
Y = np.sin(X) + np.random.randn(20,1)*0.05
kernel = GPy.kern.RBF(input_dim=1,variance=1.,lengthscale=1.)
m = GPy.models.GPRegression(X,Y,kernel)
m.optimize(messages=True)
m.optimize_restarts(num_restarts = 10)
jt = json.dumps(m.to_dict(save_data=False),indent=4)
with open("j-test.json",'w') as file:
file.write(jt)
此步骤没有问题,但是当我尝试使用:加载模型信息时遇到了问题。
with open("j-test.json",'r') as file:
d = json.load(file) # d is a dictionary
m2 = GPy.models.GPClassification.from_dict(d,data=None)
这给了我一个断言错误,因为“数据不是无”(或者至少我是这样认为的)。
我对GPy真的很陌生,并且使用jsons,所以我真的不确定我误入歧途了。我尝试查看文档,但是文档有点含糊,我找不到使用它的示例。 我错过了一个步骤/概念吗?另外,这是存储和重新加载模型的最佳方法吗?任何帮助,将不胜感激!谢谢!
解决方法
泡菜模块是您的朋友!
import pickle
with open('save.pkl','wb') as file:
pickle.dump(m,file)
您可以在以后的脚本中使用以下命令对其进行回调:
with open('save.pkl','rb') as file:
loaded_model = pickle.load(file)