问题描述
让我有一个输入特征 X = {X1,X2}
。其中 X1 是实值(也考虑它遵循高斯分布)但 X2
是一个分类特征。现在如果我想使用朴素贝叶斯算法。我应该使用哪一种?
GaussianNB 在分类特征中是否完美工作?
解决方法
使用 get_dummies()
(熊猫库)转换您的分类特征 X2。然后训练模型。
我建议先尝试 GaussianNB,评估他的准确性。然后尝试 sklearn 拥有的其他朴素贝叶斯模型。如果没有看到数据(即使有数据),也很难预测哪种模型在每种情况下效果更好。评估每一项。