如何从 vaderSentiment 获取更好的数据?

问题描述

我知道我可以从维达那里得到这个: {'neg':0.071,'neu':0.895,'pos':0.034,'复合':-0.296}

但他们是获得整体结果的一种方式吗?比如说 {'Positive'} 或 {'Negative'}

还有……我要看看我可以用维达做什么?比如函数列表什么的。

解决方法

复合分数是通过将词典中每个词的效价分数相加来计算的,根据规则进行调整,然后归一化在-1(最极端的负面)和+1(最极端的正面)之间。如果您想对给定的句子进行单一的单维情绪度量,这是最有用的指标。​​

然后您可以为负[-1,0)、中性[0,0.5)和正[0.5,1]设置阈值以将它们分类。例如:

def get_category(compounded):
if compounded < 0:
    return 'negative'
elif compounded < 0.5:
    return 'neutral'
else:
    return 'positive'

选择最适合您的数据和用例的阈值。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...