给定任意两点之间的距离时,如何对点进行聚类?

问题描述

我有一组可以说的100分。并给出了一个点到任何其他点的距离。这意味着我有100x100的数据集,该数据集为我提供了所有其他100点与100点之间的距离。我要基于以下条件从该数据集中形成集群:集群中任意两个点之间的距离不应大于x(其中x可以是例如25kms。)。

我是集群和数据科学的新手。请指导我如何解决此问题。哪些库可以最有效地解决此问题。任何帮助将不胜感激。 :)

解决方法

这可以使用sklearn的聚集聚类来解决,方法是将相似性设置为“预先计算”

Refer this link for the solution.