函数中带有可选参数的“ weighted.mean”?

问题描述

我需要将weighted.mean函数包含在另一个函数中,作为我正在处理的项目的一部分。我在使w参数在我正在使用的功能中无法正常工作时遇到了麻烦。

为了使我的整体功能正常工作,我需要开会使weights参数成为可选参数。如果没有给出权重,则需要认使用某种wt = 1。这可能很容易通过条件语句完成,在该条件语句中,我用1填充了一个虚拟列,但我想知道这是否是最好的方法

library(tidyverse)

my_weighted_mean <- function(var,wt) {
  var = enquo(var)
  
  mtcars %>%
    summarise_at(vars(!!var),~weighted.mean(.,w = wt))
  
}

## wrong output
my_weighted_mean(cyl,wt = "hp")
#>        cyl
#> 1 6.599231

## expected output
weighted.mean(mtcars$cyl,mtcars$hp)
#> [1] 6.860673

reprex package(v0.3.0)于2020-10-27创建

解决方法

最终更新
使wt为可选参数(wt = NULL)比我预期的要复杂。以下是使用tryCatch的方法。一旦知道wt是否为NULL,我们就可以用长度为1的向量data.frame替换它。否则,我们只能将其与curl-curly运算符一起使用。在OP的注释之后,新功能仅使用一个参数x来汇总一个变量,并且可以将多个分组变量放入省略号...中。

library(dplyr)
library(rlang)

my_weighted_mean <- function(.dat,x,...,wt = NULL) {
  
  .pred <- tryCatch(
    is.null(wt),error = function(e) {
      is.null(rlang::eval_tidy(enquo(wt),data = mtcars))
    })
  
  .dat %>% 
    group_by(...) %>% 
    summarise(
      {{x}} := weighted.mean({{x}},w = if (.pred) rep(1,length({{x}})) else {{wt}} ))
  
}

mtcars %>% 
  my_weighted_mean(mpg)
#> # A tibble: 1 x 1
#>     mpg
#>   <dbl>
#> 1  20.1

mtcars %>% 
  my_weighted_mean(mpg,cyl)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#>     cyl   mpg
#>   <dbl> <dbl>
#> 1     4  26.7
#> 2     6  19.7
#> 3     8  15.1

mtcars %>% 
  my_weighted_mean(mpg,cyl,wt = disp)
#> `summarise()` ungrouping output (override with `.groups` argument)
#> # A tibble: 3 x 2
#>     cyl   mpg
#>   <dbl> <dbl>
#> 1     4  25.8
#> 2     6  19.8
#> 3     8  14.9

mtcars %>% 
  my_weighted_mean(mpg,gear,wt = disp)
#> `summarise()` regrouping output by 'cyl' (override with `.groups` argument)
#> # A tibble: 8 x 3
#> # Groups:   cyl [3]
#>     cyl  gear   mpg
#>   <dbl> <dbl> <dbl>
#> 1     4     3  21.5
#> 2     4     4  25.9
#> 3     4     5  27.9
#> 4     6     3  19.9
#> 5     6     4  19.7
#> 6     6     5  19.7
#> 7     8     3  14.8
#> 8     8     5  15.4

reprex package(v0.3.0)于2020-10-28创建

旧答案
您还需要enqou() wt,或者只使用curl-curly运算符。如果您想在var中插入多个变量,则可以使用省略号...而不是将变量名包装在curl-curly中。

library(tidyverse)

my_weighted_mean <- function(var,wt) {
  
  mtcars %>%
    summarise_at(vars({{var}}),~weighted.mean(.,w = {{wt}}))
  
}

my_weighted_mean(cyl,wt = hp)
#>        cyl
#> 1 6.860673


my_weighted_mean <- function(...,wt) {

  mtcars %>%
    summarise_at(vars(...),disp,wt = hp)
#>        cyl     disp
#> 1 6.860673 275.1096

reprex package(v0.3.0)于2020-10-27创建

旧答案的原始更新(已更正)正如@Konrad Rudolph正确指出的那样,summarise_at被取代了,您无需为单个变量使用-在这里{{1} } 足够的。如果要汇总许多变量,则新的正式方法是使用summarise,如下所示:

across()
,

正如Tim所提到的,您需要以与wt相同的方式处理var,即,将其作为未引用的表达式传递,并在函数内部将其引用。

此外,由于我们已经在使用整洁的评估功能,因此不需要summarize_at(顺便说一下,superseded)。

my_weighted_mean = function (.data,var,wt) {
    dplyr::summarize(.data,{{var}} := weighted.mean({{var}},w = {{wt}}))
}
my_weighted_mean(mtcars,hp)
#        cyl
# 1 6.860673

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...