问题描述
代码:
ranger(outcome~.,data,num.trees=500,probability=TRUE)
错误:列中缺少数据
数据是否需要采用某种格式?如何克服这个错误?
解决方法
您需要删除NA 示例:
ranger(outcome~.,data[complete.cases(data),],num.trees=500,probability=TRUE)
其他方法使用mice
或miceFast
之类的数据包进行插补(填充NA)。
使用随机数据(来自每一列)插入数据的其他简单解决方案。
data_cs = data.frame(Map(function(x) Hmisc::impute(x,'random'),data))
ranger(outcome~.,data_cs,probability=TRUE)