问题描述
我有一个标题列表。我通过在 spacy 中使用 word2vec 发现了它们之间的语义相似性。现在我希望标题的相似度超过 83% 是否在同一个集群中。例如我有:
titles= [art teacher,gym teacher,basketball teacher,painting teacher]
art teacher=[1,0.7,0.6,0.91]
这意味着 art teacher
与 titles
的第一个元素之间的相似度为 1 ,第二个元素为 0.7 并且 ...
gym teacher=[0.7,1,0.9,0.5]
basketball teacher=[0.6,0.55]
painting teacher=[0.91,0.5,0.55,1]
我想要具有超过 85% 相似度的名称聚集在一起。所以我们将有:
cluster1:美术老师、绘画老师
cluster2:篮球老师、体育老师
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)