R中数据帧之间的对称百分比变化

问题描述

我有两个数据帧。像这样很容易计算从t1到t2的百分比变化:

t1 <- data.frame("gene1" = c(1,5,10),"gene2" = c(1,1,1),"gene3" = c(5,20))
row.names(t1) <- c("patient1","patient2","patient3")
t2 <- data.frame("gene1" = c(0.5,20),"gene2" = c(2,4,8),"gene3" = c(2.5,20,5))
row.names(t2) <- c("patient1","patient3")

t3 <- (t2-t1)/t1 *100

t3
#>             gene1      gene2      gene3
#> patient1      -50        100        -50
#> patient2        0        300        300
#> patient3      100        700        -75

但是如果我想做对称百分比变化,以使值从20变为5不会是-75,而是-300。我尝试过:

t3 <- ifelse(t2 > t1,((t2-t1)/t1) * 100,((t2-t1)/t2) * 100)

但这给了我一些奇怪的3x9列表。

原则上,使用ifelse应该可以。如果我降低了复杂性,那就很好了

t3 <- ifelse(t2 > t1,"a","b")
t3
#>             gene1      gene2      gene3
#> patient1        b          a          b
#> patient2        b          a          a
#> patient3        a          a          b

理想情况下,我的输出是:

t3
#>             gene1      gene2      gene3
#> patient1     -100       100        -100
#> patient2        0       300         300
#> patient3      100       700        -300

解决方法

这个怎么样?

# recreate your data
t1 <- data.frame("gene1" = c(1,5,10),"gene2" = c(1,1,1),"gene3" = c(5,20))
row.names(t1) <- c("patient1","patient2","patient3")
t2 <- data.frame("gene1" = c(0.5,20),"gene2" = c(2,4,8),"gene3" = c(2.5,20,5))
row.names(t2) <- c("patient1","patient3")

t1
#>          gene1 gene2 gene3
#> patient1     1     1     5
#> patient2     5     1     5
#> patient3    10     1    20

t2
#>          gene1 gene2 gene3
#> patient1   0.5     2   2.5
#> patient2   5.0     4  20.0
#> patient3  20.0     8   5.0

# iterate over each column and compute the ifelse...
res <- lapply(seq_len(ncol(t1)),function(i) {
  x <- t2[,i]
  y <- t1[,i]
  diff <- x - y
  ifelse(x > y,diff / y,diff / x) * 100
})
# convert to data.frame and reset the names and rownames
res <- as.data.frame(res)
rownames(res) <- rownames(t1)
names(res) <- names(t1)
res
#>          gene1 gene2 gene3
#> patient1  -100   100  -100
#> patient2     0   300   300
#> patient3   100   700  -300

reprex package(v0.3.0)于2020-10-14创建

编辑

更好甚至更快:

t3 <- (t2 - t1) / pmin(t1,t2) * 100
t3
#>          gene1 gene2 gene3
#> patient1  -100   100  -100
#> patient2     0   300   300
#> patient3   100   700  -300

请注意,pminifelse类似,将min函数元素明智地应用于其输入元素的每次迭代,因此pmin(t1,t2)返回该元素的data.frame每个位置的最小值,为我们节省了ifelse语句。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...