在 r 中的数据框中估算缺失值

问题描述

我正在处理具有缺失值的数据集,因为某些公司(列)在某个时间点(行)之前没有该变量的值。数据集是:

Data

我一直在寻找可以处理这些缺失的一些方法。一些插补技术很有吸引力,但在应用它们时,我收到一个错误。我将我的数据集称为 fund1。我首先应用了missForest,它是随机森林算法的一个实现:

install.packages("missForest")
library(missForest)
fund1.imp <- missForest(fund1)

但我收到了:

Error in sample.int(length(x),size,replace,prob) : 
primer argumento inválido

然后我尝试使用 Hmisc,它是一个多用途包,可用于数据分析、高级图形、输入缺失值、高级表格制作、模型拟合和诊断。具体来说,我使用了 aregImpute(),它允许使用加性回归、引导和预测均值匹配进行均值插补。我只为 5 个变量做了:

impute_arg <- aregImpute(~ LYB_UN_Equity + AXP_UN_Equity + VZ_UN_Equity + Avgo_UW_Equity +                            
 BA_UN_Equity,data = fund1,n.impute = 5)

错误是:

Error in rcspline.eval(z,knots = parms,nk = nk,inclx = TRUE)

我希望有人告诉我在我的情况下我可以做些什么来处理缺失值。如果有人有更好的选择或可以告诉我如何使用我正在使用的选项,我将不胜感激

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)