如何在 R 中以滚动方式从底部匹配第三个或其他?

问题描述

这是我的具有预期输出的示例数据框。

ASP.NET@H_502_5@

当我沿着列向下时,我想匹配倒数第三个水果。如果前面没有三个水果,它应该返回 NA。出现第 4 个苹果后,它与前面的苹果 3 匹配,然后出现第 5 个苹果,它匹配第一个 3 之前的苹果,依此类推。

我试图使用 rollapply、match 和 tail 来完成这项工作,但我不知道如何引用当前行进行匹配。在 excel 中,我将使用 large、if 和 row 函数来执行此操作。 Excel 使我的计算机花费数小时来计算所有内容,我知道 R 可以在几分钟(几秒?)内完成。

解决方法

你可以这样做:

library(dplyr) 

df %>% 
  mutate(fruit = gsub("[0-9]","",index)) %>% 
  group_by(fruit) %>% 
  mutate(new_output = lag(index,3)) %>% 
  select(-fruit) %>%
  ungroup

对于每组 fruit,您的 new_output 为您提供滞后 3 的 index 值。我保留了 output 列并将我的结果保存在 {{1} } 这样你就可以比较了。