MissForest 中的并行化

问题描述

我有一个包含 54 个因子和数值变量以及 285331 条记录的数据框 data3。我即将用 MissForest 包填充 NA,并尝试并行化以减少处理时间,但是如果我使用以下代码

library(missForest)
library(doParallel)
library(foreach)
data4 <- missForest(data3,maxiter = 10,ntree = 100,mtry = 100,variablewise = T,parallelize = "forests")
data4$OOBerror
apply(data3,2,var,na.rm=TRUE) 
apply(is.na(data4$ximp),sum) 
data3 <- data4$ximp

我收到此错误

Error in missForest(data3,: You must register a 'foreach' parallel backend to run 'missForest' in parallel. Set 'parallelize' to 'no' to compute serially.

缺少什么才能让它发挥作用?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)