问题描述
假设我有以下 R 数据框:
Peril 和 Range 列都是因素。我想为计数和值创建一个累积分布列,如下所示:
我该怎么做?如果有帮助,我正在使用 dplyr。
解决方法
假设您将数据存储在 df
中,这应该可以:
df %>%
group_by(Peril) %>%
mutate(
'Count CDF' = cumsum(Counts) / sum(Counts),'Values CDF' = cumsum(Values) / sum(Values)
)
但是,您的第一个和第二个表似乎对“其他”危险具有不同的计数和值。