问题描述
是否有可能使用task <- TaskRegr$new("data",data,"y")
过滤器或管道删除任务--- mlr3
---中的不完整观察?
解决方法
我认为没有用于删除观测值的预处理运算符。
我要做的是在任务中使用(i+1)
方法。
示例:
filter
t = tsk("pima")
ids = complete.cases(t$data())
# number of incomplete observations
sum(!ids)
t$filter(which(ids))
# number of incomplete observations
# should be zero now
ids = complete.cases(t$data())
sum(!ids)
提供了布尔向量,该向量指示哪些行包含完整的观察值(无NA)。
complete.cases
通过参数中提供的行ID将任务的数据子集化。参数中未给出的行ID会被就地删除。
如果您想插补不完整的观测值,可以使用一些插补运算符(例如PipeOpImputeConstant)按常数插补要素。