问题描述
这是我的具有预期输出的示例数据框。
ASP.NET
当我沿着列向下时,我想匹配倒数第三个水果。如果前面没有三个水果,它应该返回 NA。出现第 4 个苹果后,它与前面的苹果 3 匹配,然后出现第 5 个苹果,它匹配第一个 3 之前的苹果,依此类推。
我试图使用 rollapply、match 和 tail 来完成这项工作,但我不知道如何引用当前行进行匹配。在 excel 中,我将使用 large、if 和 row 函数来执行此操作。 Excel 使我的计算机花费数小时来计算所有内容,我知道 R 可以在几分钟(几秒?)内完成。
解决方法
你可以这样做:
library(dplyr)
df %>%
mutate(fruit = gsub("[0-9]","",index)) %>%
group_by(fruit) %>%
mutate(new_output = lag(index,3)) %>%
select(-fruit) %>%
ungroup
对于每组 fruit
,您的 new_output
为您提供滞后 3 的 index
值。我保留了 output
列并将我的结果保存在 {{1} } 这样你就可以比较了。