层次聚类输出比输入少一

问题描述

因此,我的聚类输入具有分类数据,这就是为什么我计算行进距离并使用矩阵作为距离数组的输入的原因,我曾用它来计算聚类。问题在于,在我的原始数据以及矩阵中,我有707个实例,但是输出只有706个。我在做什么错了?

data_gower = gower.gower_matrix(original_data)

distArray = ssd.squareform(data_gower)

dendrogram = sch.dendrogram(sch.linkage(distArray,method  = "ward"))

clusters_hier = scipy.cluster.hierarchy.linkage(distArray,method='single',metric='euclidean')
cluster = AgglomerativeClustering(n_clusters=7,affinity='euclidean',linkage='ward')  
clusters_hierarchical = cluster.fit_predict(clusters_hier) 


# Output
# AgglomerativeClustering(affinity='euclidean',compute_full_tree='auto',connectivity=None,distance_threshold=None,linkage='ward',memory=None,n_clusters=7,pooling_func='deprecated')
# Out[143]:
# {0: 163,1: 96,2: 80,3: 81,4: 58,5: 106,6: 122} # instances per clusters
# 706 rows

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)