问题描述
我需要有关列特定值总和的基于 R 的问题的帮助(在此环境中相对较新)
df <- data.frame(gene = c("A","B","C","C"),value = c(2,3,4,9,8,7,2,0)
我的目标是在“gene”中匹配基因之后对第二列(值)的部分求和。
输出如下:
df <- data.frame(gene = c("A",23,16)
(我也不知道如何在这个论坛中嵌入 df)
解决方法
我们可以在aggregate
中使用base R
aggregate(value ~ gene,df,sum)
或者用dplyr
library(dplyr)
df %>%
group_by(gene) %>%
summarise(value = sum(value),.groups = 'drop')