R中有限制的组合数

问题描述

尊敬的R and stats社区,

从3个所选对象在一个外部特征中不重复自身的方式,可以从9个对象中选择3个对象有多少种组合?

在我的示例中,三个选定的标本的 species 属性必须始终不同。也就是说,在选择3个物种时,应该始终有一个代表A的物种,一个代表B的物种,一个代表C的物种,并且此选择的顺序无关紧要。

> mydata <- data.frame(specimens = paste("s",1:9,sep = ""),species = LETTERS[1:3])
> mydata
  specimens species
1        s1       A
2        s2       B
3        s3       C
4        s4       A
5        s5       B
6        s6       C
7        s7       A
8        s8       B
9        s9       C

有多少种组合? 我知道如何计算三个对象的任何集合的组合,例如arrangements::ncombinations(9,3)choose(9,3)

我已经看到了一种生成组合的方法,该方法允许粘贴自定义函数,这可以帮助选择具有所需属性的组合。

library(utils)
combn(mydata$specimens,3,FUN)

我不能自己设计这样的功能。不成功的审判之一是

library(utils)
outp <- combn(as.character(mydata$specimens),function(x) !duplicated(mydata$species))
> outp[,1:10]
       [,1]  [,2]  [,3]  [,4]  [,5]  [,6]  [,7]  [,8]  [,9] [,10]
 [1,]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
 [2,]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
 [3,]  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE  TRUE
 [4,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [5,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [6,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [7,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [8,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [9,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

预先感谢您的帮助。

解决方法

必须有A,B和C。可能有3种。这些中的每一个必须与一个B一起出现,因此有3 * 3 = 9对可能的As和B。这些对中的每对都可以与3个C之一进行分组,因此共有3 * 3 * 3 = 27个可能的组合。

您可以使用这种一线式查看它们:

expand.grid(split(mydata$specimens,mydata$species))
#>     A  B  C
#> 1  s1 s2 s3
#> 2  s4 s2 s3
#> 3  s7 s2 s3
#> 4  s1 s5 s3
#> 5  s4 s5 s3
#> 6  s7 s5 s3
#> 7  s1 s8 s3
#> 8  s4 s8 s3
#> 9  s7 s8 s3
#> 10 s1 s2 s6
#> 11 s4 s2 s6
#> 12 s7 s2 s6
#> 13 s1 s5 s6
#> 14 s4 s5 s6
#> 15 s7 s5 s6
#> 16 s1 s8 s6
#> 17 s4 s8 s6
#> 18 s7 s8 s6
#> 19 s1 s2 s9
#> 20 s4 s2 s9
#> 21 s7 s2 s9
#> 22 s1 s5 s9
#> 23 s4 s5 s9
#> 24 s7 s5 s9
#> 25 s1 s8 s9
#> 26 s4 s8 s9
#> 27 s7 s8 s9
,

您可以像下面那样在interaction上尝试split

> levels(interaction(with(mydata,split(specimens,species))))
 [1] "s1.s2.s3" "s4.s2.s3" "s7.s2.s3" "s1.s5.s3" "s4.s5.s3" "s7.s5.s3"
 [7] "s1.s8.s3" "s4.s8.s3" "s7.s8.s3" "s1.s2.s6" "s4.s2.s6" "s7.s2.s6"
[13] "s1.s5.s6" "s4.s5.s6" "s7.s5.s6" "s1.s8.s6" "s4.s8.s6" "s7.s8.s6"
[19] "s1.s2.s9" "s4.s2.s9" "s7.s2.s9" "s1.s5.s9" "s4.s5.s9" "s7.s5.s9"
[25] "s1.s8.s9" "s4.s8.s9" "s7.s8.s9"

其中显示了来自不同specimens的组件species的所有组合