问题描述
首先,我要说我不是一名程序员,并且我对Python和ML的了解很少,因为我正试图学习了解大学项目的新研究方法,请理解我缺乏AI /编程知识。
我用sklearn(和linearSVM:linearSVC)训练了一个模型。输入数据是文本数据(X),我已对其进行了完全清洗并带有7个标签(y)。之后,我评估了模型并创建了混淆矩阵。
目标是了解我的模型如何(很好)对训练后的数据集中不存在的新引入的样本进行响应。我已经知道新引入的数据样本/实例带有的真实标签,因此我将其引入了模型并让其预测了标签。在引入之前,进行与训练后的数据集相同的数据/文本清理步骤。 对新引入的数据的预测有效,因此我正在深入研究输出。
我的问题是: 有没有一种简单的方法可以量化/查看模型如何评估不在训练数据集中的单个引入样本的标签分数(以及它选择了哪个,而没有选择)?尽管出现此错误,我还是尝试为此实例使用另一个混淆矩阵:
"Found input variables with inconsistent numbers of samples: [908,1]"
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)