如果 Excel 中的日期列为空,则 R 在 read_excel() 期间将 Excel 日期列的数据类型更改为 Logical

问题描述

所以我有 2 个 excel VIN1.xlsx 和 VIN2.xlsx 需要比较。

VIN1 excel 有一个 Dale 列 OUTGATE_DT,它至少填充了 1 行。

VIN2 excel 有一个日期列 OUTGATE_DT,对于所有行都完全为空。

当我使用 read_excel 导入 VIN1.xlsx excel 时,它会创建对象,当我检查 OUTGATE_DT 列时,它说它的数据类型为 POSIXct[1:4](我认为这对日期列是正确的。)

但是当我使用 read_excel 导入 VIN2.xlsx excel 时,它会创建对象,当我检查 OUTGATE_DT 列时,它说它的数据类型是逻辑 [1:4](这样做是因为该列完全是空的).

这就是我的 compare_df(vin1,vin2) 函数失败的原因 说明 -

rbindlist(l,use.names,fill,idcol) 中的错误: 第 2 项第 80 列的类属性与第 1 项第 80 列不匹配。

我对 R 完全陌生,非常感谢您的帮助。 TIA

请查看屏幕截图以供参考。

enter image description here

解决方法

你应该使用 read_excel() 作为下面的 read_excel(,col_types = "text")

您的所有列都将被视为文本,因此您不会有任何比较或任何问题。

,

或者,如果您想在原始 df 中保留列类型,您可以执行以下操作:

library(dplyr)
library(readxl)

VIN2 <- read_excel(VIN2.xlsx) %>%
 mutate(OUTGATE_DT = as.Date(OUTGATE_DT))

那么使用 rbind 中的 bind_rowsdplyr 应该没有问题。