问题描述
我正在尝试在人体关节的人体姿势数据集上使用来自 faiss 的 KMeans 聚类。我有 16 个身体部位,所以尺寸为 32。关节在 0 和 1 之间的范围内缩放。我的数据集包含约 900.000 个实例。正如 faiss (faiss_FAQ) 所提到的:
根据经验,超过 20 次迭代和 1000 * k 个训练点后,k 均值量化器没有持续改进
将此应用于我的问题,我随机选择 50000 个实例进行训练。因为我想检查 1 到 30 之间的多个簇 k。
现在我的“问题”:
随着集群数量的增加,惯性直接增加(x轴上的n_cluster):
我尝试改变迭代次数、重做次数、详细和球形,但结果保持不变或变得更糟。我不认为这是我实施的问题;我在一个带有 2D 数据和非常清晰的集群的小示例上对其进行了测试,并且成功了。
是数据聚集不好还是我遗漏了另一个问题/错误?也许值在 0 和 1 之间缩放?我应该尝试另一种方法吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)