gpflow 分类实现

问题描述

我想用高斯过程实现一个二元分类模型。根据{{​​3}},我的代码如下。

X 有 2048 个特征,Y 是 0 或 1。优化模型后,我尝试评估性能

然而,predict_y 方法产生了一个奇怪的结果;预期的 pred 应该具有类似 (n_test_samples,2) 的形状,它表示属于 0 类和 1 类的概率。但我得到的结果是 (n_test_samples,n_training_samples)。

出了什么问题?

def model(X,Y):
  '''
    X: (n_training_samples,n_features),my example is (n,2048)
    Y: (n_training_samples,),binary classification
  '''
  m = gpflow.models.VGP(
      (X,Y),likelihood=gpflow.likelihoods.Bernoulli(),kernel=gpflow.kernels.SquaredExponential()
  )

  opt = gpflow.optimizers.Scipy()
  opt.minimize(m.training_loss,variables=m.trainable_variables)

  return m

def evaluate(model,X,Y,accuracy,MCC,Kappa):
  '''
    X: (n_test_samples,2048)
    Y: (n_test_samples,binary classification
  '''
  pred,_ = model.predict_y(X)
  print('pred.shape is {}'.format(pred)) # I got wired result (num of test samples <X.shape[0]>,num of training samples)
  accuracy += [accuracy_score(Y,pred)]
  MCC += [matthews_corrcoef(Y,pred)]
  Kappa += [cohen_kappa_score(Y,pred)]
  return accuracy,Kappa

解决方法

我终于明白了。原因是 VGP 模型的 Y 形状应该类似于 (n_training_samples,1) 而不是 (n_training_samples,)。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...