问题描述
我在弄清楚如何使用包含R数据帧列名称的字符串进行一些基本计算以突变为新列时遇到麻烦。例如,我有基线值列,其他列有后处理时间点。我想为此使用列名称字符串,因为我将使用指定了不同时间点的数据,并且需要一个编程解决方案。
例如,我有这个数据框,我想我需要在下面的mutate行中使用一些语法,但无法弄清楚确切的写法。我希望名为“ day1_fc”和“ day2_fc”的列代表day1 / baseline和day2 / baseline的倍数变化。
df <- data.frame(day0 = c(1,1,1),day1 = c(2,3,4),day2 = c(3,4,5))
baseline = 'day0'
sym_baseline <- sym(baseline)
post = c('day1','day2')
post1 <- post[1]
post2 <- post[2]
df %>%
mutate(!!paste0(post1,'_fc' := ?????),!!paste0(post2,'_fc') := ?????)
我希望结果看起来像这样
df <- data.frame(day0 = c(1,0.5,2),5),day1_fc = c(2,6,day2_fc = c(3,8,2.5))
解决方法
您可以使用:
library(dplyr)
library(rlang)
df %>%
mutate(!!paste0(post1,'_fc') := !!sym(post[1])/!!sym_baseline,!!paste0(post2,'_fc') := !!sym(post[2])/!!sym_baseline)
# day0 day1 day2 day1_fc day2_fc
#1 1.0 2 3 2 3.0
#2 0.5 3 4 6 8.0
#3 2.0 4 5 2 2.5
对于许多post
值的一般解决方案是使用map
:
bind_cols(df,purrr::map_dfc(post,~df %>% transmute(!!paste0(.x,'_fc') := !!sym(.x)/!!sym_baseline)))