问题描述
我有一个来自 RandomForest 的距离矩阵,我想使用分层聚类与 Ward 的链接来通过 Sci-Kit learn AgglomerativeClustering
寻找聚类。我知道 Ward 链接仅适用于欧几里得距离,而 RandomForest 距离矩阵由(平方)欧几里得距离组成。我也知道我可以使用 affinity = 'precomputed'
并输入我的距离矩阵,但是我不能使用 Ward 的链接(根据 Sci-Kit learn 的文档)。那么我是否应该只输入我的平方距离矩阵 (n x n) 并使用 affinity = 'euclidean'
和 linkage = 'ward'
代替,因为在我看来,我没有违反任何数学假设?
我还读到我可以对距离矩阵执行 PCA(在双中心化之后),然后在 Kmeans 中使用它,因为 Kmeans 不处理(隐式)距离矩阵。通常,它以样本 x 特征矩阵(数据矩阵)作为输入。与距离矩阵相比,此后 PCA 矩阵是否是使用 Ward 进行 AgglomerativeClustering 的更好输入?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)