在 R 中使用 tapply(dataframe , index, function) 作为函数 2 列的参数

问题描述

我想在数据帧上使用 tapply() 函数,将行与索引分组。我的问题是我要传递给函数的参数不是单列,而是一对列。这是因为数据框的 2 列代表 x-y 点,它们是成对的。运行 tapply(dataframe,index,function) 给我一个错误,即索引的长度与 tapply 不同。我该如何解决这个问题? 谢谢!

解决方法

如果要汇总的列不止一列,请使用 aggregate 而不是 tapply(因为 tapply 适用于单列)

aggregate(.~ indexes,transform(df1,indexes = indexes),FUN = yourfun)

或者另一个选项是by

by(df1,list(indexes),FUN = yourfun)

或者它可能更灵活 tidyverse

library(dplyr)
df1 %>%
    group_by(indexes) %>%
    summarise(across(c(x,y),yourfun),.groups = 'drop')

使用一个可重现的小例子

indexes = rep(1:2,c(3,2))
by(mtcars[1:5,1:5],indexes,FUN = sum)