问题描述
我正在使用 HDBSCAN 为给定的集群模型生成预测数据。然后我尝试使用 approximate_predict
函数对新点进行分类,以找到新点的正确聚类。该模型为新点返回正确的聚类,但概率/强度始终为 0.0。为了生成模型并对我使用的新点进行分类:
# Generate the model
cluster_model = hdbscan.HDBSCAN(metric='euclidean',min_cluster_size=3,cluster_selection_epsilon=0.4,prediction_data=True).fit(data)
# Classify new point
cluster,prob = hdbscan.approximate_predict(cluster_model,new_point)
print(cluster,prob)
据我所知,如果强度/概率为 0.0,则该点已被归类为噪声。通过对新点的手动分析,我可以看到它们确实适合原始集群的核心,所以我不明白为什么概率总是 0.0?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)