dbscan
hdbscan
当我尝试使用其中一种算法时,出现内存错误。
如果你数据集中的特征数量不是太多(低于20-25),你可以考虑使用BIRCH。这是一种迭代方法,可用于大型数据集。在每次迭代中,它构建一棵仅包含少量数据样本的树,并将每个实例放入集群中。