HDBSCAN 近似预测总是返回 0 的概率

问题描述

我正在使用 HDBSCAN 为给定的集群模型生成预测数据。然后我尝试使用 approximate_predict 函数对新点进行分类,以找到新点的正确聚类。该模型为新点返回正确的聚类,但概率/强度始终为 0.0。为了生成模型并对我使用的新点进行分类

# Generate the model
cluster_model = hdbscan.HDBSCAN(metric='euclidean',min_cluster_size=3,cluster_selection_epsilon=0.4,prediction_data=True).fit(data)

# Classify new point
cluster,prob = hdbscan.approximate_predict(cluster_model,new_point)
print(cluster,prob)

据我所知,如果强度/概率为 0.0,则该点已被归类为噪声。通过对新点的手动分析,我可以看到它们确实适合原始集群的核心,所以我不明白为什么概率总是 0.0?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)