我应该如何管理调查数据中的相关性?

问题描述

我对大约 1100 名受访者进行了一项用户调查,目的是更好地了解我的用户以及他们对我们产品的重视程度。我清理了数据并有大约 40 个变量(调查响应)。我正在尝试探索数据并找出人们的偏好与他们对我们服务的满意度之间的相关性。

我创建了一个相关性矩阵,我发现 10 个问题之间存在很强的相关性,其中我询问人们对我们服务的不同属性的满意度(即,评价您对我们设备的满意度,物有所值,包装,交付等)。

我现在想知道这些相关性对我的回归/PCA/聚类分析有什么影响。我总是了解到在运行回归时合并或删除高度相关的变量很重要,但我想避免这种情况,因为这些是我感兴趣的主要变量。

我在下面包含了相关矩阵。蓝色的大方块是我感兴趣的变量集。

Correlation matrix

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)