计算数据框多列之间的百分比变化

问题描述

我有一个数据框如下:

id <- c(1,2,3,4,5)
week1 <- c(234,567456,134123,13412421,2345245)
week2 <- c(4234,5123456,454123,12342421,8394545)
week3 <- c(1234,234124,12348,9348522,134534)
data <- data.frame(id,week1,week2,week3)

我想找到第 1 周和第 2 周之间的百分比变化,然后是第 2 周和第 3 周等(我的数据框要大得多,大约有 27 列)。

我试过了:

data$change1 <- (data$week2-data$week1)*100/data$week1

但是,对于更大的数据集,这将是广泛的。

解决方法

尝试以下操作:

library(tidyverse)

df <- gather(df,key='week',value='value',-id)

df$week <- as.integer(as.character((gsub('week','',df$week))))
df %>% group_by(id) %>% arrange(week) %>% mutate(perc_change = (value-lag(value,1))/lag(value,1)*100)
# A tibble: 15 x 4
# Groups:   id [5]
      id  week    value perc_change
   <dbl> <int>    <dbl>       <dbl>
 1     1     1      234       NA   
 2     2     1   567456       NA   
 3     3     1   134123       NA   
 4     4     1 13412421       NA   
 5     5     1  2345245       NA   
 6     1     2     4234     1709.  
 7     2     2  5123456      803.  
 8     3     2   454123      239.  
 9     4     2 12342421       -7.98
10     5     2  8394545      258.  
11     1     3     1234      -70.9 
12     2     3   234124      -95.4 
13     3     3    12348      -97.3 
14     4     3  9348522      -24.3 
15     5     3   134534      -98.4 

这相当有效,但假设每周都有一次观察,否则您的百分比变化将基于最后可用的一周(因此,如果缺少第 3 周,则第 4 周的值将是第 1 周周变化以第 2 周为基础)。

(编辑:将 substr 替换为 gsub

感觉检查:

对于第 6 行,您会看到 id 1。这是第 2 周,值为 4234。在第 1 周,id 1 的值为 234。不同之处在于

(4234-234)/234
[1] 17.09402

所以,这是对齐的。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...