润滑周期的绝对值

问题描述

我正在尝试使用lubridate确定两个日期之间的绝对天数。

library(lubridate)

dates <- data.frame(
  time1 = date(c("2011-01-01","2012-01-01","2013-01-01")),time2 = date(c("2011-01-02","2011-12-31","2013-01-01"))
)

dates$diff <- days(dates$time1 - dates$time2)
dates$diff
[1] "-1d 0H 0M 0S" "1d 0H 0M 0S"  "0S" 
abs(dates$diff)
[1] "-1d 0H 0M 0S" "1d 0H 0M 0S"  "0S" 

我希望所有值都是正的。此外,minmax不会返回最小值和最大值。

min(dates$diff)
[1] 0
max(dates$diff)
[1] 0

为什么这些函数lubridate间的行为不同于数字/整数对象?

解决方法

简单的答案是,来自lubridate的period类对象不是简单的数字对象。它们是S4对象。它们的主要数据成员是 seconds 的数字矢量,其中分钟,小时,天和年均存储为属性。当您尝试在period对象上应用数学运算符时,这些运算符不会应用于属性,而只会应用于主要的数字矢量(秒部分)。

如果我们创建-1秒的period,我们可以看到以下内容:

library(lubridate)

p <- as.period(diff(as.POSIXct(c("2020-09-24 21:00:01","2020-09-24 21:00:00"))))

p
#> [1] "-1S"

abs(p)
#> [1] "1S"

现在让我们检查对象的属性:

attributes(p)
#> $year
#> [1] 0
#> 
#> $month
#> [1] 0
#> 
#> $day
#> [1] 0
#> 
#> $hour
#> [1] 0
#> 
#> $minute
#> [1] 0
#> 
#> $class
#> [1] "Period"
#> attr(,"package")
#> [1] "lubridate"

对于S4对象,您需要通过编写“ Math”和“ Summary”组泛型来定义类似absmin的功能。但是,尚未为类“ period”定义它们,因此它们在主数据向量(仅是秒向量)上被调用。 Ops组通用 已被定义,这就是为什么您可以执行类似dates$diff / 2之类的事情并获得明智答案的原因。

为什么未定义它们?那是作者要回答的问题。同时,您可以通过将abs设为S3方法并专门编写一个abs.period方法来获得所需的功能,如下所示:

abs         <- function(x) UseMethod("abs")
abs.default <- function(x) base::abs(x)
abs.Period  <- function(out) 
{
   new("Period",abs(out$second),year = abs(out$year),month = abs(out$month),day = abs(out$day),hour = abs(out$hour),minute = abs(out$minute))
}

将提供您预期的行为:

dates <- data.frame(
  time1 = date(c("2011-01-01","2012-01-01","2013-01-01")),time2 = date(c("2011-01-02","2011-12-31","2013-01-01"))
)

dates$diff <- days(dates$time1 - dates$time2)

abs(dates$diff)
#> [1] "1d 0H 0M 0S" "1d 0H 0M 0S" "0S"

但是,这可能不是一个好主意。最好使用difftimes进行算术运算,并在需要时转换为周期。

我希望这可以澄清一些事情。