dplyr:使用mutate创建具有复杂操作的新列

问题描述

我想使用一个原始的new.df创建一个新的数据框(df),但是使用一个复杂的{{1 }}函数放在Age包中。我的步骤是:

mutate

在每个dplyr中:

  1. 每个# Artificial dataframe IDtest<-c(1,1,2,3,3) Class<-c(1,3) Day<-c(0,47,76,100,150,173,100) Area<-c(0.45,0.85,1.50,1.53,1.98,5.2,0.36,0.58,1.2,1.36,2.26,3.59) df<-data.frame(cbind(IDtest,Class,Day,Area)) str(df) #Split each IDtest df[df[,1]==1,] # IDtest Class Day Area #1 1 1 0 0.45 #2 1 1 47 0.85 #3 1 2 76 1.50 #4 1 2 100 1.53 #5 1 2 150 1.98 #6 1 3 173 5.20 内的最后IDtest减去系数(如果Area 25 = 25);和
  2. 大于1)除以最后一个Area和最后一个Class之间的减号,然后除以每个Area内部的Day
  3. 每个Class内的Day减去最后一个Class,比1)和2)多。最后,将所有的总和除以365,然后创建新列Day
Age

有什么想法吗?

解决方法

这很棘手,因此我将所有步骤分开进行,以使您更容易发现任何可能的误解。 您的这一行是否可能存在错误?

(1.98-1)/((1.98-0.85)/150) + (157 - 47) # 157? wouldn't it be 150?

也就是说,我对第1类的结果与您的结果相同,但是请对第2类和第3类小心,因为我不确定是否正确地理解了第二和第三步,因此我不确定您的使用“最后一个”(即类或“上一个”类中的“最后一个”)。

第二步,在类中使用“ last”,第三步中,使用for循环使用“ previous”。我想你可以适应这个想法

df2 <- df %>% 
  group_by(IDtest,Class) %>%
    mutate(
      DayOrder = row_number() 
    )

df2 <- df2 %>%
  mutate(step1a = Area[max(DayOrder)],# I divide step1 in several steps to make it clearer
     minus =  # what you want to substract
       case_when(
         step1a < 1 ~ 0,step1a < 2.9 ~ 1,step1a < 8.9 ~ 3,step1a < 24.9 ~ 9,step1a > 25 ~ 25
       ),step1done = step1a - minus,step2a = Area[max(DayOrder)] - Area[min(DayOrder)],# "Last" inside the same Class (as it is inside mutate,which is under group_by)
     step2b = Day[max(DayOrder)],step2done = step2a / step2b,step1by2 = step1done / step2done
     )


df2$step3 <- NA 
for (i in 1:max(df2$Class)){
  if(i == 1){
     df2$step3[Class == i] <- max(df2$Day[df2$Class == i]) - 0 # quite silly
     }else{
     df2$step3[Class == i] <- max(df2$Day[df2$Class == i]) - max(df2$Day[df2$Class == i - 1]) # "Last" as the "previous" Class,not inside the same Class
 }}


df2 %>%
  mutate(
    step3done = step1by2 + step3,Age = step3done / 365 # Do you want "age" as a unique value?? not a value for each person? This case I would do this outside mutate and add as a new column
  )

如果我误解了你,我希望你至少可以有一些想法!

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...