在虚拟变量之后或之前估算missForest?

问题描述

我遇到了这种情况

# library(missForest)
set.seed(0)
df_imp <- missForest(df,verbose=TRUE,variablewise = TRUE)
df <- df_imp$ximp 

print(sum(is.na(df)))   # 0 NA (as expected)
print(df_imp$OOBerror)  # error of the missForest algorithm in each variable

它向我发出这样的警告:

missForest 迭代 1 正在进行中...响应有五个或更少 独特的价值。您确定要进行回归吗?响应 具有五个或更少的唯一值。你确定你想做吗 回归?响应具有五个或更少的唯一值。你确定吗 你想做回归?响应有五个或更少的唯一 值。您确定要进行回归吗?完成!

这当然是因为我创建了具有 0-1 值的虚拟变量。这不正确吗?算法没有完成他的工作吗?保持分类变量先插补值然后虚拟它们会更好吗?我知道这可能是一个统计问题,但它与 R 代码混合在一起,所以我将两者都放在描述中。

提前致谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)