Dask ML - GaussianNB 返回长度不匹配错误

问题描述

我正在尝试使用带有 dask 的 GaussianNb 分类器来预测我的测试集。这是我的设置的样子:

      filter(Accuracy == "TRUE") %>%
      ggplot(.) + aes(x = Author,y = mean_unsu,fill= Author) +
      geom_bar(stat = "summary",fun.y = mean,position = "dodge") + 
      xlab("Race of Author") + ylab("Proportion Unsure Reported")  +
      theme(panel.grid.major = element_blank(),panel.grid.minor = 
      element_blank(),panel.background = element_blank(),axis.line = element_line(colour = 
      "black")) +
       geom_errorbar(aes(ymin= mean_unsu - se_unsu,ymax= mean_unsu + se_unsu),position=position_dodge(width=0.9),width=.1) +  
       geom_text(aes(label=round(mean_err,digits=2)),position=position_dodge(width=.9),vjust=5) + scale_fill_manual(values=wes_palette("GrandBudapest2"))

我所有的 X 和 y 变量都是 dask DataFrames,但是,我收到以下错误

X_train = pd.DataFrame.sparse.from_spmatrix(vectorizer.fit_transform(training['X_trn']))
y_train = encoder.fit_transform(training['y_trn'])
X_tst = pd.DataFrame.sparse.from_spmatrix(vectorizer.transform(testing['X_tst']))
y_tst = encoder.transform(testing['y_tst'])

clf = GaussianNB()
clf.fit(X_train,y_train)
clf.predict(X_tst)

我小心地将 fit_transform 用于我的训练集并适合我的测试集,但我没有运气。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)