R中的正则表达式列名和分组?

问题描述

我有这个数据框:

id <- c(0,1,2,3,4)
groupA_sample1_values <- c(10,11,12,13,14)
groupA_sample2_values <- c(20,21,22,23,24)
groupA_sample3_values <- c(30,31,32,33,34)
groupB_sample1_values <- c(40,41,42,43,44)
groupB_sample2_values <- c(50,51,52,53,54)
groupB_sample3_values <- c(60,61,62,63,64)

df <- data.frame(id,groupA_sample1_values,groupA_sample2_values,groupA_sample3_values,groupB_sample1_values,groupB_sample2_values,groupB_sample3_values)

df

我正在尝试获取包含这些列的另一个表: id、组、样本、值。 我相信我必须使用正则表达式提取名称 groupA/groupB,对于样本编号也是如此,然后将其融合为一个新的数据框,但我不确定如何处理它。 有什么帮助吗?

解决方法

试试

library( tidyverse )
df %>%
  pivot_longer( -id,names_to = c("group","sample" ),names_pattern = "group(.)_sample(.)_values",values_to = "value" )

# # A tibble: 30 x 4
#      id group sample value
#   <dbl> <chr> <chr>  <dbl>
# 1     0 A     1         10
# 2     0 A     2         20
# 3     0 A     3         30
# 4     0 B     1         40
# 5     0 B     2         50
# 6     0 B     3         60
# 7     1 A     1         11
# 8     1 A     2         21
# 9     1 A     3         31
#10     1 B     1         41