函数中带有可选参数的“ weighted.mean”？

问题描述

我需要将weighted.mean函数包含在另一个函数中，作为我正在处理的项目的一部分。我在使w参数在我正在使用的功能中无法正常工作时遇到了麻烦。

为了使我的整体功能正常工作，我需要开会使weights参数成为可选参数。如果没有给出权重，则需要默认使用某种wt = 1。这可能很容易通过条件语句完成，在该条件语句中，我用1填充了一个虚拟列，但我想知道这是否是最好的方法。

library(tidyverse)

my_weighted_mean <- function(var,wt) {
  var = enquo(var)
  
  mtcars %>%
    summarise_at(vars(!!var),~weighted.mean(.,w = wt))
  
}

## wrong output
my_weighted_mean(cyl,wt = "hp")
#>        cyl
#> 1 6.599231

## expected output
weighted.mean(mtcars$cyl,mtcars$hp)
#> [1] 6.860673

^{由reprex package（v0.3.0）于2020-10-27创建}

解决方法

最终更新
使wt为可选参数（wt = NULL）比我预期的要复杂。以下是使用tryCatch的方法。一旦知道wt是否为NULL，我们就可以用长度为1的向量data.frame替换它。否则，我们只能将其与curl-curly运算符一起使用。在OP的注释之后，新功能仅使用一个参数x来汇总一个变量，并且可以将多个分组变量放入省略号...中。

library(dplyr)
library(rlang)

my_weighted_mean <- function(.dat,x,...,wt = NULL) {
  
  .pred <- tryCatch(
    is.null(wt),error = function(e) {
      is.null(rlang::eval_tidy(enquo(wt),data = mtcars))
    })
  
  .dat %>% 
    group_by(...) %>% 
    summarise(
      {{x}} := weighted.mean({{x}},w = if (.pred) rep(1,length({{x}})) else {{wt}} ))
  
}

mtcars %>% 
  my_weighted_mean(mpg)
#> # A tibble: 1 x 1
#>     mpg
#>   <dbl>
#> 1  20.1

mtcars %>% 
  my_weighted_mean(mpg,cyl)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#>     cyl   mpg
#>   <dbl> <dbl>
#> 1     4  26.7
#> 2     6  19.7
#> 3     8  15.1

mtcars %>% 
  my_weighted_mean(mpg,cyl,wt = disp)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#>     cyl   mpg
#>   <dbl> <dbl>
#> 1     4  25.8
#> 2     6  19.8
#> 3     8  14.9

mtcars %>% 
  my_weighted_mean(mpg,gear,wt = disp)
#> `summarise()` regrouping output by 'cyl' (override with `.groups` argument)
#> # A tibble: 8 x 3
#> # Groups:   cyl [3]
#>     cyl  gear   mpg
#>   <dbl> <dbl> <dbl>
#> 1     4     3  21.5
#> 2     4     4  25.9
#> 3     4     5  27.9
#> 4     6     3  19.9
#> 5     6     4  19.7
#> 6     6     5  19.7
#> 7     8     3  14.8
#> 8     8     5  15.4

^{由reprex package（v0.3.0）于2020-10-28创建}

旧答案
您还需要enqou() wt，或者只使用curl-curly运算符。如果您想在var中插入多个变量，则可以使用省略号...而不是将变量名包装在curl-curly中。

library(tidyverse)

my_weighted_mean <- function(var,wt) {
  
  mtcars %>%
    summarise_at(vars({{var}}),~weighted.mean(.,w = {{wt}}))
  
}

my_weighted_mean(cyl,wt = hp)
#>        cyl
#> 1 6.860673


my_weighted_mean <- function(...,wt) {

  mtcars %>%
    summarise_at(vars(...),disp,wt = hp)
#>        cyl     disp
#> 1 6.860673 275.1096

^{由reprex package（v0.3.0）于2020-10-27创建}

旧答案的原始更新（已更正）正如@Konrad Rudolph正确指出的那样，summarise_at被取代了，您无需为单个变量使用-在这里{{1} } 足够的。如果要汇总许多变量，则新的正式方法是使用summarise，如下所示：

across()

正如Tim所提到的，您需要以与wt相同的方式处理var，即，将其作为未引用的表达式传递，并在函数内部将其引用。

此外，由于我们已经在使用整洁的评估功能，因此不需要summarize_at（顺便说一下，superseded）。

my_weighted_mean = function (.data,var,wt) {
    dplyr::summarize(.data,{{var}} := weighted.mean({{var}},w = {{wt}}))
}

my_weighted_mean(mtcars,hp)
#        cyl
# 1 6.860673

dplyr dplyr function function function r r tidyeval

函数中带有可选参数的“ weighted.mean”？

问题描述

解决方法

相关问答