问题描述
我将使用 AHC 对我的数据(轨迹数据)进行聚类。你能告诉我如何确定 AHC 的水平吗?
解决方法
聚类的目的应该是簇本身应该远离彼此,簇内的点应该尽可能彼此靠近。
目标:这是我们必须最小化集群内距离和最大化集群间距离的另一种说法。
为此,我们使用了各种纯度措施,例如:
- Davies-Boulding 指数:https://en.wikipedia.org/wiki/Davies%E2%80%93Bouldin_index
- 轮廓值:https://en.wikipedia.org/wiki/Silhouette_(clustering) 或者,您可以在实现 AIM 的地方使用您的功能。
每次迭代后,您可以计算您制作的簇的纯度,并在达到最小值时停止