如何对高于某个相似性阈值的项目进行聚类

我有一个标题列表。我通过在 spacy 中使用 word2vec 发现了它们之间的语义相似性。现在我希望标题的相似度超过 83% 是否在同一个集群中。例如我有：

titles= [art teacher,gym teacher,basketball teacher,painting teacher]
art teacher=[1,0.7,0.6,0.91]

这意味着 art teacher 与 titles 的第一个元素之间的相似度为 1 ，第二个元素为 0.7 并且 ...

gym teacher=[0.7,1,0.9,0.5]

basketball teacher=[0.6,0.55]

painting teacher=[0.91,0.5,0.55,1]

我想要具有超过 85% 相似度的名称聚集在一起。所以我们将有：

cluster1：美术老师、绘画老师

cluster2：篮球老师、体育老师

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）