问题描述
我正在尝试使用 daff 库来观察两个数据集之间的任何差异。一个数据集是 Netflix 内容的数据库,而另一个是缺少多个条目和其他数据质量问题的数据集。
library(daff)
library(htmltools)
library(readxl)
bad_netflix_titles <- read_excel("C:/Users/CK199WL/New_Docs/Commercial Credit/Dummy Files/bad_netflix_titles.xlsx",guess_max = 21474836)
netflix_titles <- read_excel("C:/Users/CK199WL/New_Docs/Commercial Credit/Dummy Files/netflix_titles.xlsx",guess_max = 21474836 )
d1<-diff_data(bad_netflix_titles,netflix_titles,show_unchanged = TRUE,show_unchanged_columns = TRUE)
data<-patch_data(netflix_titles,d1)
write.csv(data,file="File.csv")
运行上述代码(data<-patch_data(netflix_titles,d1)
)后,这行代码报错:
Warning message:
In storage.mode(new_data[[n]]) <- mode[n] : NAs introduced by coercion .
虽然仔细观察,但最终数据集没有适当的日期值。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)