多元数据集中对总异质性的变量贡献

问题描述

我想找到一种统计方法(在R中),以评估多元数据集中一个(或多个)变量对同一数据集的总异质性的贡献。

在下面,我尝试用ade4 R包中的“ doubs”数据集的环境部分作为玩具数据集来制作一个可重现的示例。

library(ade4)
# This data set gives environmental variables,fish species and spatial coordinates for 30 sites.
data("doubs")

# extacting the environmental variables
env_heterogeneity <- doubs$env
head(env_heterogeneity)

# selecting 2 groups of environmental parameters
env_heterogeneity_physical <- env_heterogeneity[,1:4] # physical/morphology parameters
env_heterogeneity_chemical <- env_heterogeneity[,5:11] # chemical parameters

考虑这个数据集,我考虑了两组环境参数,它们收集了法国河流的物理(PH)和化学(CH)参数。我想评估总异质性的哪一部分(CH + PH)由一组(CH或PH)的异质性解释。我首先考虑在vegan R包中使用冗余分析,将一组参数(X = PH)与整个数据集(Y = PH + CH)进行比较。我得到以下结果:

# how physical parameters can describe the total variability of chemical and physical parameters ?
library(vegan)
RDA_1 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity[,1:11],scale = T)
summary(RDA_1)
# Call:
#   rda(X = env_heterogeneity_physical,Y = cbind(env_heterogeneity_physical,env_heterogeneity_chemical),scale = T) 
# 
# Partitioning of correlations:
#   Inertia Proportion
# Total               4          1
# Constrained         4          1
# Unconstrained       0          0

这个结果是出乎意料的,因为如果我们运行另一个RDA比较两组参数(X = PH,Y = CH),我可以看到这两组参数确实是不同的并且具有一定的特异性:

RDA_2 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
summary(RDA_2)
# 
# Call:
#   rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical) 
# 
# Partitioning of variance:
#   Inertia Proportion
# Total         5300660     1.0000
# Constrained   3786549     0.7144
# Unconstrained 1514111     0.2856 

我得出的结论是,我只是错误地使用了RDA,因此我应该找到另一种统计方法。与我发现的大多数研究相比,我没有反应矩阵,而且我认为这很不寻常...

您认为统计方法可以做到我想解释的吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)