问题描述
我有一个从正常数据帧生成的数据帧矢量列表,如下所示。基因表达包含识别每个观察者的细胞系,基因,染色体区域和表达水平的列-多个基因可能属于特定的染色体区域,我想将一个染色体区域中的表达与其他所有染色体进行比较。看起来像这样:
gene region cell_line expression
A X Joe 1
B X Joe 2
C Y Joe 2
D Z Joe 3
E Z Joe 0
A X Claire 2
B X Claire 1
C Y Claire 3
D Z Claire 3
E Z Claire 1
我根据细胞系将其拆分。
gene_expression_groups <- gene_expression %>%
group_by(cell_line) %>%
group_split()
接下来,我尝试通过以下方式获得除所有区域中所述区域以外的所有染色体区域的均值表达
for (i in seq_along(gene_expression_groups)){
gene_expression_groups[[i]] <- as_tibble(gene_expression_groups[[i]]) %>%
group_by(chromosomal_region) %>%
group_modify(~anti_join(gene_expression_groups[[i]],.) %>%
summarize(muG = mean(expression),sigma2G = var(expression),NG = n()))
}
理想情况下,最终产品将是一个新的向量列表,每个拆分组现在看起来都像这样。
region cell_line mean_other standard_deviation_other
X Joe 1.67 some number
Y Joe 1.5 some number
Z Joe 1.67 some number
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)