MultinomialNB 或 GaussianNB 或 CategoricalNB 在这里使用什么?

问题描述

我有一个输入特征 X = {X1,X2}。其中 X1 是实值(也考虑它遵循高斯分布)但 X2一个分类特征。现在如果我想使用朴素贝叶斯算法。我应该使用哪一种? GaussianNB 在分类特征中是否完美工作?

解决方法

使用 get_dummies()(熊猫库)转换您的分类特征 X2。然后训练模型。

我建议先尝试 GaussianNB,评估他的准确性。然后尝试 sklearn 拥有的其他朴素贝叶斯模型。如果没有看到数据(即使有数据),也很难预测哪种模型在每种情况下效果更好。评估每一项。