问题描述
我有一个大型美巡赛数据集(2312 个观测值。18 个变量),其中包含 2010 年至 2018 年的所有球员统计数据。看起来像这样:
Player.Name | Rounds | Fairway.Percentages | Year | Avg. distance
Henrick Stenson 60 75.19 2018 291.50
Henrick Stenson 65 70.09 2013 290.90
而且它对每个球员都如此,所以每一行都是那个特定年份的球员统计数据。我想累计每个玩家的数据,所以每个玩家只出现一次,并显示2010-2018年期间每个统计数据的8年平均值,看起来像这样
Player.Name | Rounds| Fairway.Percentages | Year | Avg. distance
Henrick Stenson *8yr avg *8yr avg *8yr avg
Jordan Spieth *8yr avg *8yr avg *8yr avg
Rickie Fowler *8yr avg *8yr avg *8yr avg
我想这样做,以便我可以执行聚类分析并根据球员的统计数据(长球击球手、短距离准确击球手、最佳推杆等...)对球员进行聚类。
我知道有一个 rollmean 函数,但希望我不必为每个单独的列都这样做
解决方法
library(tidyverse)
data %>%
group_by(Player.Name) %>%
summarize(across(-Year,mean))
,
我们可以使用 $ scala3-repl
scala> :load hello.scala
def m(): Unit
scala> m()
Hello,world! I'm a script
中的 aggregate
base R