问题描述
数据: https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data
我尝试在应用as.factor之后在数据集上使用mouses包
train_df<-data.frame(read.csv("train.csv",header = TRUE) %>%
mutate(
source="train"
))
train_df$MSSubClass<- as.factor(train_df$MSSubClass)
imp_train_df <-mice(train_df,m=2,method='cart')
reg1 <- with(imp_train_df,lm(SalePrice ~ MSSubClass))
head(summary(pool(reg1))$term)
我最终得到类似的东西:
[1] (Intercept) MSSubClass30 MSSubClass40 MSSubClass45 MSSubClass50 MSSubClass60
316 Levels: (Intercept) MSSubClass30 MSSubClass40 MSSubClass45 MSSubClass50 MSSubClass60 MSSubClass70 MSSubClass75 MSSubClass80 MSSubClass85 MSSubClass90 ... SaleConditionPartial
这似乎是在计算列中每个因子的p值,但我只对整个列感兴趣。
我实际期望的位置:
MSSubClass
我做错了什么?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)