在python sklearn,混淆矩阵中量化每个标签的模型预测得分

问题描述

首先,我要说我不是一名程序员,并且我对Python和ML的了解很少,因为我正试图学习了解大学项目的新研究方法,请理解我缺乏AI /编程知识。

我用sklearn(和linearSVM:linearSVC)训练了一个模型。输入数据是文本数据(X),我已对其进行了完全清洗并带有7个标签(y)。之后,我评估了模型并创建了混淆矩阵。

目标是了解我的模型如何(很好)对训练后的数据集中不存在的新引入的样本进行响应。我已经知道新引入的数据样本/实例带有的真实标签,因此我将其引入了模型并让其预测了标签。在引入之前,进行与训练后的数据集相同的数据/文本清理步骤。 对新引入的数据的预测有效,因此我正在深入研究输出

我的问题是: 有没有一种简单的方法可以量化/查看模型如何评估不在训练数据集中的单个引入样本的标签分数(以及它选择了哪个,而没有选择)?尽管出现此错误,我还是尝试为此实例使用另一个混淆矩阵:

"Found input variables with inconsistent numbers of samples: [908,1]"

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)