选择多个日期列并将因子变量转换为日期

问题描述

我有一个data.frame，其中有多个包含日期的列。目前，它们被认为是“要素”类。 我想选择所有应为日期的列（其中有10列，它们的名称都带有“ Date”，例如Date_Construc，Date_use，Comp_date ...），然后将它们从要素转换为日期。

这是我尝试过的：首先，我要选择向量中的相关列

library(tidyselect)
date_vars <- vars_select(names(df1),contains("Date",ignore.case = TRUE))

然后

library(lubridate)
date_vars <- dmy(date_vars)

也尝试过

date_vars <- vars_select(names(df1),ignore.case = TRUE))
df1[date_vars] <- lapply(df1[date_vars],as.Date)

我明白了

 Error in as.Date.numeric(X[[i]],...) : 'origin' must be supplied

也

date_vars <- vars_select(names(df1),ignore.case = TRUE))
df1[date_vars] <- dmy(as.character(df1[date_vars])

有结果

 Warning message:
All formats Failed to parse. No formats found.

这是当前格式的示例数据：

Date_Construct= c("10/03/2018 00:00","21/03/2015 00:00","20/02/2012 00:00")
Date_use = c("02/08/2007 00:00","31/10/2007 00:00","13/08/2008 00:00")
ID = c("0001","34560","100041531")
Comp = c("Revis","Succ","Revis")

dfq= data.frame(`ID`,`Date_Construct`,`Date_use`,`Comp`)



    ID      Date_Construct     Date_use            Comp
1   0001    10/03/2018 00:00    02/08/2007 00:00    Revis
2   34560   21/03/2015 00:00    31/10/2007 00:00    Succ
3   100041531   20/02/2012 00:00    13/08/2008 00:00    Revis

解决方法

根据提供的新数据更新答案。

尝试以下方法。无需删除日期时间字符串的时间部分。您可以使用与数据匹配的lubridate函数（在本例中为dmy_hm()）对其进行解析，然后忽略它。

dfq_parsed <- dfq %>%
  mutate(across(contains("date",ignore.case = TRUE),dmy_hm))

这将产生：

         ID Date_Construct   Date_use  Comp
1      0001     2018-03-10 2007-08-02 Revis
2     34560     2015-03-21 2007-10-31  Succ
3 100041531     2012-02-20 2008-08-13 Revis

日期与POSIXct相同，但这很容易使用：

'data.frame':   3 obs. of  4 variables:
 $ ID            : chr  "0001" "34560" "100041531"
 $ Date_Construct: POSIXct,format: "2018-03-10" "2015-03-21" "2012-02-20"
 $ Date_use      : POSIXct,format: "2007-08-02" "2007-10-31" "2008-08-13"
 $ Comp          : chr  "Revis" "Succ" "Revis"

date date date multiple-columns r r select select select tidyselect

选择多个日期列并将因子变量转换为日期

问题描述

解决方法

相关问答