问题描述
我正在尝试使用lubridate确定两个日期之间的绝对天数。
library(lubridate)
dates <- data.frame(
time1 = date(c("2011-01-01","2012-01-01","2013-01-01")),time2 = date(c("2011-01-02","2011-12-31","2013-01-01"))
)
dates$diff <- days(dates$time1 - dates$time2)
dates$diff
[1] "-1d 0H 0M 0S" "1d 0H 0M 0S" "0S"
abs(dates$diff)
[1] "-1d 0H 0M 0S" "1d 0H 0M 0S" "0S"
我希望所有值都是正的。此外,min
和max
不会返回最小值和最大值。
min(dates$diff)
[1] 0
max(dates$diff)
[1] 0
为什么这些函数在lubridate
期间的行为不同于数字/整数对象?
解决方法
简单的答案是,来自lubridate的period
类对象不是简单的数字对象。它们是S4对象。它们的主要数据成员是 seconds 的数字矢量,其中分钟,小时,天和年均存储为属性。当您尝试在period
对象上应用数学运算符时,这些运算符不会应用于属性,而只会应用于主要的数字矢量(秒部分)。
如果我们创建-1秒的period
,我们可以看到以下内容:
library(lubridate)
p <- as.period(diff(as.POSIXct(c("2020-09-24 21:00:01","2020-09-24 21:00:00"))))
p
#> [1] "-1S"
abs(p)
#> [1] "1S"
现在让我们检查对象的属性:
attributes(p)
#> $year
#> [1] 0
#>
#> $month
#> [1] 0
#>
#> $day
#> [1] 0
#>
#> $hour
#> [1] 0
#>
#> $minute
#> [1] 0
#>
#> $class
#> [1] "Period"
#> attr(,"package")
#> [1] "lubridate"
对于S4对象,您需要通过编写“ Math”和“ Summary”组泛型来定义类似abs
和min
的功能。但是,尚未为类“ period”定义它们,因此它们在主数据向量(仅是秒向量)上被调用。 Ops
组通用 已被定义,这就是为什么您可以执行类似dates$diff / 2
之类的事情并获得明智答案的原因。
为什么未定义它们?那是作者要回答的问题。同时,您可以通过将abs
设为S3方法并专门编写一个abs.period
方法来获得所需的功能,如下所示:
abs <- function(x) UseMethod("abs")
abs.default <- function(x) base::abs(x)
abs.Period <- function(out)
{
new("Period",abs(out$second),year = abs(out$year),month = abs(out$month),day = abs(out$day),hour = abs(out$hour),minute = abs(out$minute))
}
将提供您预期的行为:
dates <- data.frame(
time1 = date(c("2011-01-01","2012-01-01","2013-01-01")),time2 = date(c("2011-01-02","2011-12-31","2013-01-01"))
)
dates$diff <- days(dates$time1 - dates$time2)
abs(dates$diff)
#> [1] "1d 0H 0M 0S" "1d 0H 0M 0S" "0S"
但是,这可能不是一个好主意。最好使用difftimes进行算术运算,并在需要时转换为周期。
我希望这可以澄清一些事情。