R 中正确的方法和代码来完成 PCA 以确定我是否可以在执行 k-means 聚类之前减少变量

问题描述

我提前为这里的问题道歉,因为它相当模糊。我一直在寻找的是在具有 30 万条记录和 30 多个变量的数据集上完成 PCA 的正确方法。我的最终目标是进行聚类分析。我这样做了,结果相对较好。我想完成 PCA 以确定是否可以减少变量的数量。我已经在互联网上搜索了一段时间,但没有找到 100% 的答案 - 一些很好的信息,但没有让我到达那里。我想做的是使用 PCA 来确定最重要的变量,以支持简化我的聚类分析。我还想确定我可以避免的变量中是否存在多重共线性。我完成了 PCA,但努力将其与数据中的实际变量联系起来。通过链接对资源的任何帮助或建议都很棒!!谢谢!!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)