不同数据集上的线性回归拟合增强

问题描述

我只是想在使用 dplyr 和增强函数构建回归模型的不同数据集上计算预测(拟合值)。但是我不断收到错误。即使不使用 dplyr,增强函数似乎也只接受模型所建立的数据集。有什么解决方案可以解决吗?下面是我的尝试之一。谢谢。

data1 <- head(mtcars,20)

model <- mtcars %>%
  group_by(cyl) %>%
  do(fit = lm(wt ~ mpg,.),data = (.)) %>%
  augment(fit,data1)

解决方法

augment 中使用 mutate 并在 map 中使用 augment 一次传递一个模型。

library(broom)
library(dplyr)
library(purrr)

mtcars %>%
  group_by(cyl) %>%
  do(fit = lm(wt ~ mpg,.),data = (.)) %>%
  ungroup() %>%
  mutate(col   = map(fit,augment,newdata = data1))

此外,由于 do 已被取代,您可以在 summarise 中拟合模型。

mtcars %>%
  group_by(cyl) %>%
  summarise(fit = list(lm(wt ~ mpg)),data = list(cur_data())) %>%
  mutate(col   = map(fit,newdata = data1))

#    cyl fit    data               col               
#  <dbl> <list> <list>             <list>            
#1     4 <lm>   <tibble [11 × 11]> <tibble [20 × 14]>
#2     6 <lm>   <tibble [7 × 11]>  <tibble [20 × 14]>
#3     8 <lm>   <tibble [14 × 11]> <tibble [20 × 14]>