如何对未标记的测试数据进行文本分类?

问题描述

我正在使用 TF-IDF 执行特征提取,然后传递稀疏矩阵以与文本数据一起执行训练,文本数据也转换为稀疏矩阵。我知道用于训练和测试的分类器的输入需要文本和标签。 由于训练和测试数据集都被标记,这是执行分类以稍后使用统计度量检查模型有多好的常用方法

但是如果我们想对未标记的测试数据进行分类,我们如何以同样的方式进行分类?例如,应用 TF-IDF,然后使用分类器。

请提供任何指导。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)