在分层模型中检测共线性

问题描述

我在R中略看一眼,有几个解释变量(分类的和连续的),分布在3个不同的级别(级别3 =图表,级别2 =距离点,级别1 =采样数)。 >

在建模之前,我想测试变量之间的相关性。但是我不确定如何包括模型的嵌套结构。

我的想法是,计算同一级别(使用cor)的连续变量之间的皮尔逊相关性,并测试连续变量和同一级别的类别变量之间的成对关系(使用lm())。 / p>

但这不考虑层次结构,也不包括不同级别变量之间的相关性。

我将不胜感激,因为我自己没有找到解决方法

示例数据:

daten <- data.frame(plot_nr = as.factor(rep(c(1:4),each=8)),distance_meter = c(rep(rep(c(80,450),each=4),4)),sampling_number = c(as.factor(rep(c(1,2,3,4),8))),level_3_var_foresttype = c(rep(c("decidous","conifer"),each=16)),level_3_var_forestarea = c(rep(c(50,32,46,13),level_3_var_elevation = c(rep(c(133,422,523,456),level_2_var_vegetationhet = c(rep(c(1.4,2.5,1.56,2.1,1.8,1.6,2.4,1.3),each=4)),level_2_var_distanceedge = c(rep(c(20,43,52,25,16,35,32),level_1_var_temperature = c(rnorm(32,mean=16.3,sd=4.3)),level_1_var_volume = c(rnorm(32,mean=42.3,sd=18.2)),count_data = c(1,5,1,9,6,4,2))

我的想法是,通过以下方式解决该问题:

关联级别3:

vars_level_3 <- daten[,c(4,6)]
cor(vars_level_3[,-1],method="pearson") # continuous 


summary(lm(vars_level_3$level_3_var_forestarea~vars_level_3$level_3_var_foresttype)) # categorical 
summary(lm(vars_level_3$level_3_var_elevation~vars_level_3$level_3_var_foresttype)) # categorical

关联级别2:

vars_level_2 <- daten[,7,8)]

library(lme4)
summary(lmer(level_2_var_vegetationhet~level_2_var_distanceedge + (1|plot_nr),data=vars_level_2 ))

关联级别1:

vars_level_1 <- daten[,c(3,8,10)]


summary(lmer(level_1_var_temperature~level_1_var_volume + (1|plot_nr/sampling_number),data=vars_level_1 ))

但是我敢肯定,这是不对的。

非常感谢:-)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)