在 R 中积累数据

问题描述

我有一个大型美巡赛数据集（2312 个观测值。18 个变量），其中包含 2010 年至 2018 年的所有球员统计数据。看起来像这样：

Player.Name      | Rounds | Fairway.Percentages |  Year   | Avg. distance 
Henrick Stenson      60           75.19            2018        291.50
Henrick Stenson      65           70.09            2013        290.90

而且它对每个球员都如此，所以每一行都是那个特定年份的球员统计数据。我想累计每个玩家的数据，所以每个玩家只出现一次，并显示2010-2018年期间每个统计数据的8年平均值，看起来像这样

Player.Name      | Rounds| Fairway.Percentages |  Year   | Avg. distance 
Henrick Stenson   *8yr avg      *8yr avg                      *8yr avg 
Jordan Spieth     *8yr avg      *8yr avg                      *8yr avg 
Rickie Fowler     *8yr avg      *8yr avg                      *8yr avg

我想这样做，以便我可以执行聚类分析并根据球员的统计数据（长球击球手、短距离准确击球手、最佳推杆等...）对球员进行聚类。

我知道有一个 rollmean 函数，但希望我不必为每个单独的列都这样做

解决方法

library(tidyverse)
data %>%
  group_by(Player.Name) %>%
  summarize(across(-Year,mean))

我们可以使用 $ scala3-repl scala> :load hello.scala def m(): Unit scala> m() Hello,world! I'm a script 中的 aggregate

base R

accumulate cluster-analysis r r

在 R 中积累数据

问题描述

解决方法

相关问答