在R中应用数据帧的层级改组/排序

问题描述

我有一个数据帧,我想在其中进行洗牌或更一般地对值进行分层排序,但是我被卡住了。这是我的示例:

library(plyr)
set.seed(123)
df <- data.frame(a = rep(letters[1:4],each = 10),b = rnorm(40))
> head(df)
  a          b
1 a -0.1264280
2 a  0.7284234
3 a -1.8782385
4 a  0.2530623
5 a  0.7577013
6 a -0.9339964

在此示例中,我想仅对字母内的值进行混合(采样),以便不能将在列a中分配给字母a的值分配给其他任何字母,而只能将其分配给其他行而不是b ,c或d。

我已经尝试过这个ddply(df,c('a'),b = sample(b)),但这没用。

解决方法

使用dplyrgroup_by(a)然后使用mutate(b = sample(b))

library(dplyr)
head(df,10)
   a           b
1  a -0.56047565
2  a -0.23017749
3  a  1.55870831
4  a  0.07050839
5  a  0.12928774
6  a  1.71506499
7  a  0.46091621
8  a -1.26506123
9  a -0.68685285
10 a -0.44566197

df %>% group_by(a) %>% mutate(b = sample(b))
# A tibble: 40 x 2
# Groups:   a [4]
   a           b
   <chr>   <dbl>
 1 a      1.56  
 2 a      0.461 
 3 a      0.0705
 4 a      1.72  
 5 a     -0.560 
 6 a     -0.446 
 7 a     -1.27  
 8 a      0.129 
 9 a     -0.230 
10 a     -0.687 
# ... with 30 more rows