问题描述
我想找到一种统计方法(在R
中),以评估多元数据集中一个(或多个)变量对同一数据集的总异质性的贡献。
在下面,我尝试用ade4
R
包中的“ doubs”数据集的环境部分作为玩具数据集来制作一个可重现的示例。
library(ade4)
# This data set gives environmental variables,fish species and spatial coordinates for 30 sites.
data("doubs")
# extacting the environmental variables
env_heterogeneity <- doubs$env
head(env_heterogeneity)
# selecting 2 groups of environmental parameters
env_heterogeneity_physical <- env_heterogeneity[,1:4] # physical/morphology parameters
env_heterogeneity_chemical <- env_heterogeneity[,5:11] # chemical parameters
考虑这个数据集,我考虑了两组环境参数,它们收集了法国河流的物理(PH)和化学(CH)参数。我想评估总异质性的哪一部分(CH + PH)由一组(CH或PH)的异质性解释。我首先考虑在vegan
R
包中使用冗余分析,将一组参数(X = PH)与整个数据集(Y = PH + CH)进行比较。我得到以下结果:
# how physical parameters can describe the total variability of chemical and physical parameters ?
library(vegan)
RDA_1 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity[,1:11],scale = T)
summary(RDA_1)
# Call:
# rda(X = env_heterogeneity_physical,Y = cbind(env_heterogeneity_physical,env_heterogeneity_chemical),scale = T)
#
# Partitioning of correlations:
# Inertia Proportion
# Total 4 1
# Constrained 4 1
# Unconstrained 0 0
这个结果是出乎意料的,因为如果我们运行另一个RDA比较两组参数(X = PH,Y = CH),我可以看到这两组参数确实是不同的并且具有一定的特异性:
RDA_2 <- rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
summary(RDA_2)
#
# Call:
# rda(X = env_heterogeneity_physical,Y = env_heterogeneity_chemical)
#
# Partitioning of variance:
# Inertia Proportion
# Total 5300660 1.0000
# Constrained 3786549 0.7144
# Unconstrained 1514111 0.2856
我得出的结论是,我只是错误地使用了RDA,因此我应该找到另一种统计方法。与我发现的大多数研究相比,我没有反应矩阵,而且我认为这很不寻常...
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)