java – 计算文本之间相似性的算法

我试图在社交网络的帖子之间得分相似,但没有找到任何好的算法,思想?

我只是尝试过Levenshtein,JaroWinkler和其他人,但是那些人更习惯于比较没有情感的文本.在帖子中我们可以得到一个文字“我真的爱狗”和另一个说“我真的很讨厌狗”,我们需要将这个案例归类为完全不同.

谢谢

解决方法

您可能希望查看 Opinion mining and sentiment analysis以了解任务的复杂性.

简短的回答:对此没有“好的算法”,只有平庸的算法.这是一个非常难的问题.祝好运.

相关文章

Java中的String是不可变对象 在面向对象及函数编程语言中,不...
String, StringBuffer 和 StringBuilder 可变性 String不可变...
序列化:把对象转换为字节序列的过程称为对象的序列化. 反序...
先说结论,是对象!可以继续往下看 数组是不是对象 什么是对...
为什么浮点数 float 或 double 运算的时候会有精度丢失的风险...
面试题引入 这里引申出一个经典问题,看下面代码 Integer a ...