情绪分析:评论库

问题描述

我打算对从用户那里收到的评论进行有监督的机器学习情绪分析。因此,我将评论分为正面,负面或中立。但是,我的数据中没有标签

通常,我应该使用无监督的ML情感分析,但我想使用有监督的模型。

在Python中是否有任何在线注释(而非单词)存储库,可用作我的训练集。我期望存储库采用这种格式或附近格式-

“产品不好”-负数 “我喜欢”-正面 “没关系”-中性

让我知道是否有这样的在线存储库可以用作Python的训练集。

解决方法

您描述的确切数据可能不容易找到。 但是,其他数据集可以轻松转换为所需的数据。

例如,Amazon Product Data 包含 text ratings ,以及用于通过数据帧中的数据帧处理此类数据的即用型代码段。熊猫图书馆。

文本代表您要查找的注释,评分可以轻松转换为不良中性分类(例如,如果评分从0开始到10(以1为增量),则0-3范围内的评分不佳,4-6范围内的评分为7-10)。

可以找到here广泛使用的情感分析数据集。