问题描述
我需要将weighted.mean
函数包含在另一个函数中,作为我正在处理的项目的一部分。我在使w
参数在我正在使用的功能中无法正常工作时遇到了麻烦。
为了使我的整体功能正常工作,我需要开会使weights参数成为可选参数。如果没有给出权重,则需要默认使用某种wt = 1
。这可能很容易通过条件语句完成,在该条件语句中,我用1填充了一个虚拟列,但我想知道这是否是最好的方法。
library(tidyverse)
my_weighted_mean <- function(var,wt) {
var = enquo(var)
mtcars %>%
summarise_at(vars(!!var),~weighted.mean(.,w = wt))
}
## wrong output
my_weighted_mean(cyl,wt = "hp")
#> cyl
#> 1 6.599231
## expected output
weighted.mean(mtcars$cyl,mtcars$hp)
#> [1] 6.860673
由reprex package(v0.3.0)于2020-10-27创建
解决方法
最终更新
使wt
为可选参数(wt = NULL
)比我预期的要复杂。以下是使用tryCatch
的方法。一旦知道wt
是否为NULL
,我们就可以用长度为1
的向量data.frame
替换它。否则,我们只能将其与curl-curly运算符一起使用。在OP的注释之后,新功能仅使用一个参数x
来汇总一个变量,并且可以将多个分组变量放入省略号...
中。
library(dplyr)
library(rlang)
my_weighted_mean <- function(.dat,x,...,wt = NULL) {
.pred <- tryCatch(
is.null(wt),error = function(e) {
is.null(rlang::eval_tidy(enquo(wt),data = mtcars))
})
.dat %>%
group_by(...) %>%
summarise(
{{x}} := weighted.mean({{x}},w = if (.pred) rep(1,length({{x}})) else {{wt}} ))
}
mtcars %>%
my_weighted_mean(mpg)
#> # A tibble: 1 x 1
#> mpg
#> <dbl>
#> 1 20.1
mtcars %>%
my_weighted_mean(mpg,cyl)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#> cyl mpg
#> <dbl> <dbl>
#> 1 4 26.7
#> 2 6 19.7
#> 3 8 15.1
mtcars %>%
my_weighted_mean(mpg,cyl,wt = disp)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#> cyl mpg
#> <dbl> <dbl>
#> 1 4 25.8
#> 2 6 19.8
#> 3 8 14.9
mtcars %>%
my_weighted_mean(mpg,gear,wt = disp)
#> `summarise()` regrouping output by 'cyl' (override with `.groups` argument)
#> # A tibble: 8 x 3
#> # Groups: cyl [3]
#> cyl gear mpg
#> <dbl> <dbl> <dbl>
#> 1 4 3 21.5
#> 2 4 4 25.9
#> 3 4 5 27.9
#> 4 6 3 19.9
#> 5 6 4 19.7
#> 6 6 5 19.7
#> 7 8 3 14.8
#> 8 8 5 15.4
由reprex package(v0.3.0)于2020-10-28创建
旧答案
您还需要enqou()
wt
,或者只使用curl-curly运算符。如果您想在var
中插入多个变量,则可以使用省略号...
而不是将变量名包装在curl-curly中。
library(tidyverse)
my_weighted_mean <- function(var,wt) {
mtcars %>%
summarise_at(vars({{var}}),~weighted.mean(.,w = {{wt}}))
}
my_weighted_mean(cyl,wt = hp)
#> cyl
#> 1 6.860673
my_weighted_mean <- function(...,wt) {
mtcars %>%
summarise_at(vars(...),disp,wt = hp)
#> cyl disp
#> 1 6.860673 275.1096
由reprex package(v0.3.0)于2020-10-27创建
旧答案的原始更新(已更正)正如@Konrad Rudolph正确指出的那样,summarise_at
被取代了,您无需为单个变量使用-在这里{{1} } 足够的。如果要汇总许多变量,则新的正式方法是使用summarise
,如下所示:
across()
,
正如Tim所提到的,您需要以与wt
相同的方式处理var
,即,将其作为未引用的表达式传递,并在函数内部将其引用。
此外,由于我们已经在使用整洁的评估功能,因此不需要summarize_at
(顺便说一下,superseded)。
my_weighted_mean = function (.data,var,wt) {
dplyr::summarize(.data,{{var}} := weighted.mean({{var}},w = {{wt}}))
}
my_weighted_mean(mtcars,hp)
# cyl
# 1 6.860673