缺少值且没有重叠值的向量之间的距离

问题描述

我正在尝试使用Python在预先计算的距离矩阵上使用聚集聚类对一些稀疏数据进行聚类。 我的数据是缺少(NaN)值的向量。 当两个向量有一些重叠的值时,我可以计算出两个向量之间的距离,这些值或多或少像R中的here。 但是,我对某些向量没有重叠的非nan数据的情况感到困惑:

A = np.array([5,4,3,2,1,nan,nan])
B = np.array([nan,3])

然后,A和B之间的距离也是nan,这给了我稀疏的距离矩阵。

尽管矢量之间的距离未知,我是否可以对数据进行聚类?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)