问题描述
我有一组可以说的100分。并给出了一个点到任何其他点的距离。这意味着我有100x100的数据集,该数据集为我提供了所有其他100点与100点之间的距离。我要基于以下条件从该数据集中形成集群:集群中任意两个点之间的距离不应大于x(其中x可以是例如25kms。)。
我是集群和数据科学的新手。请指导我如何解决此问题。哪些库可以最有效地解决此问题。任何帮助将不胜感激。 :)
解决方法
这可以使用sklearn的聚集聚类来解决,方法是将相似性设置为“预先计算”
Refer this link for the solution.