我如何将词汇特征中的 TF 权重与向量结果形式连接起来,用他们的情感替换单词?

问题描述

我有一个标记的数据集(阿拉伯语推文)和标记的词典,我想通过机器学习算法检测情绪。

我做了预处理步骤和其他功能。只是我想应用这些步骤:

  1. 计算 TF 方案以获得表达式(术语、单词)在文档中出现的频率。

  2. 为了合并情感词汇特征,我们检查句子中词汇术语的存在情况,并获得一个表示每个情感类别(愤怒、恐惧、悲伤和喜悦)的向量。

  3. 最后,为了进行分类,将 TF 句子表示和基于词的特征的串联用作不同算法(SVM、LR、MLP、MultinomialNB)的输入。

我是情感分析和 Python 的初学者,我该如何执行这些步骤:

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)