问题描述
我正在尝试使用带有 dask 的 GaussianNb 分类器来预测我的测试集。这是我的设置的样子:
filter(Accuracy == "TRUE") %>%
ggplot(.) + aes(x = Author,y = mean_unsu,fill= Author) +
geom_bar(stat = "summary",fun.y = mean,position = "dodge") +
xlab("Race of Author") + ylab("Proportion Unsure Reported") +
theme(panel.grid.major = element_blank(),panel.grid.minor =
element_blank(),panel.background = element_blank(),axis.line = element_line(colour =
"black")) +
geom_errorbar(aes(ymin= mean_unsu - se_unsu,ymax= mean_unsu + se_unsu),position=position_dodge(width=0.9),width=.1) +
geom_text(aes(label=round(mean_err,digits=2)),position=position_dodge(width=.9),vjust=5) + scale_fill_manual(values=wes_palette("GrandBudapest2"))
我所有的 X 和 y 变量都是 dask DataFrames,但是,我收到以下错误:
X_train = pd.DataFrame.sparse.from_spmatrix(vectorizer.fit_transform(training['X_trn']))
y_train = encoder.fit_transform(training['y_trn'])
X_tst = pd.DataFrame.sparse.from_spmatrix(vectorizer.transform(testing['X_tst']))
y_tst = encoder.transform(testing['y_tst'])
clf = GaussianNB()
clf.fit(X_train,y_train)
clf.predict(X_tst)
我小心地将 fit_transform 用于我的训练集并适合我的测试集,但我没有运气。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)