问题描述
这是我的具有预期输出的示例数据框。
ASP.NET
@H_502_5@当我沿着列向下时,我想匹配倒数第三个水果。如果前面没有三个水果,它应该返回 NA。出现第 4 个苹果后,它与前面的苹果 3 匹配,然后出现第 5 个苹果,它匹配第一个 3 之前的苹果,依此类推。
我试图使用 rollapply、match 和 tail 来完成这项工作,但我不知道如何引用当前行进行匹配。在 excel 中,我将使用 large、if 和 row 函数来执行此操作。 Excel 使我的计算机花费数小时来计算所有内容,我知道 R 可以在几分钟(几秒?)内完成。
解决方法
你可以这样做:
library(dplyr) df %>% mutate(fruit = gsub("[0-9]","",index)) %>% group_by(fruit) %>% mutate(new_output = lag(index,3)) %>% select(-fruit) %>% ungroup
对于每组
fruit
,您的new_output
为您提供滞后 3 的index
值。我保留了output
列并将我的结果保存在 {{1} } 这样你就可以比较了。