使用公式预测R函数内部会生成“找不到对象”错误

问题描述

让我在开头说我在Stackoverflow上有与我类似的问题,但是我还没有看到它们让我满意,并且给出的答案对我遇到的问题没有帮助。同样,这是一个很长的问题,但是我试图使每个部分简单易懂。

这是一个概念证明,您可以为全局环境中的变量分配公式,然后将公式变量传递给lm函数并使用predict进行预测。我通过多种方式做到这一点:

fake_data_1 <- data.frame(
  ecks = c(-19:20,-19:20,-19:20),why = c((-19:20)^2,(-19:20)^3/40,abs(-19:20))
)

fake_data_2 <- data.frame(
  ecks =runif(22) 
)

#using basic formula
formula_used <- why ~ ecks 
lm_model <- lm(formula = formula_used,data = fake_data_1)
predict(lm_model,newdata = fake_data_2)


#converting string to formula
formula_used <- as.formula("why ~ ecks")
lm_model <- lm(formula = formula_used,newdata = fake_data_2)


#can use a basic string as well
formula_used <- "why ~ ecks"
lm_model <- lm(formula = formula_used,newdata = fake_data_2)

以下是概念证明,可以在功能内部执行这些过程:

#can run this as a function
make_prediction <- function(data_in,y_var,x_var,new_data){
  formula_used <- as.formula(paste(y_var,sep = " ~ "))
  lm_model <- lm(formula = formula_used,data = data_in)
  predict(lm_model,newdata = data_in)
}
make_prediction(data_in = fake_data_1,y_var = "why",x_var = "ecks",new_data = fake_data_2)


#can explicitly set the environment of the formula: will make sense why I show this later
make_prediction_2 <- function(data_in,new_data){
  local_env = environment()
  formula_used <- as.formula(paste(y_var,sep = " ~ "),env = local_env)
  lm_model <- lm(formula = formula_used,newdata = new_data)
}

make_prediction_2(data_in = fake_data_1,new_data = fake_data_2)

正如我在评论中所说,为什么以后再尝试对环境进行明确分配是很有意义的。

现在,我尝试使用lme包中的nlme函数进行预测。顺便说一句,我不了解该函数统计信息,只是根据实验室中其他人编写的代码来使用它。

这里有一个概念证明,您可以使用此函数通过将公式分配给变量来进行预测(暂时不处理称为“随机”的公式:

library(nlme)
#fake data for making model
fake_data_complicated_1 <- data.frame(ecks = c(-19:20,why = c((-19:20)^3,(-19:20)^4/40,abs(-19:20)*100),treatment = c(rep("a",times = 40),rep("b",rep("control",times = 40)),ID = c(rep(c("q","w","e","r"),times = 10),rep(c("t","y","u","i"),rep(c("h","j","k","l"),times = 10))
)

#fake data for making prediction
fake_data_complicated_2 <- data.frame(ecks = runif(120),times = 10))
)

可以用一个基本公式做到这一点:

#can use basic formula as before
fixed_formula <- why ~ ecks * treatment
random_formula <- ~1|ID #not sure what this does in the model but that's not importante


lme_model <- lme(fixed = fixed_formula,random = random_formula,data = fake_data_complicated_1)


predict(lme_model,newdata = fake_data_complicated_2)

可以将字符串转换为公式:

#can use a pasted/converted formula as before
fixed_formula <- as.formula(
  paste("why",paste("ecks","treatment",sep = " * "),sep = " ~ ")
)

lme_model <- lme(fixed = fixed_formula,newdata = fake_data_complicated_2)

除了lme函数外,它不会使用原始字符串,但这不是我的主要问题:

#can't use a raw string,this code generates an error
# fixed_formula <-  paste("why",sep = " ~ ")
# 
# 
# lme_model <- lme(fixed = fixed_formula,#                  random = random_formula,#                  data = fake_data_complicated_1)
# 
# 
# predict(lme_model,newdata = fake_data_complicated_2)

这是问题所在:当我尝试将此lme代码放入函数中时,出现object 'xxxxx' not found错误


#this function does not work!
make_prediction_nlm <- function(data_in,treatment_var,id_var,new_data){
  
  formula_used_nlm <- as.formula(paste(y_var,paste(x_var,sep = " ~ "))
  random_used <-  as.formula(paste("~1|",sep = ""))
  
  lme_model <- lme(fixed = formula_used_nlm,random = random_used,data = data_in)
  
  predict(lme_model,newdata = new_data)
}

make_prediction_nlm(data_in = fake_data_complicated_1,treatment_var = "treatment",id_var = "ID",new_data = fake_data_complicated_1)

具体地说,错误Error in eval(mCall$fixed) : object 'formula_used_nlm' not found

这里的答案是:Object not found error when passing model formula to another function建议像我在上面所做的那样,我在函数中显式设置了公式的环境。我尝试了一下,但没有成功,并产生了相同的错误

#neither does this one!
make_prediction_2 <- function(data_in,id_var){
  local_env = environment()
  formula_used_nlm <- as.formula(paste(y_var,env = local_env)
  
random_used <- as.formula(paste("~1|",sep = ""),env = local_env)
  
  lme_model <- lme(fixed = formula_used_nlm,newdata = data_in)
}

make_prediction_2(data_in = fake_data_complicated_1,id_var = "ID")

我也许可以通过使用宏而不是函数解决这个问题,但是如果我能帮上忙,即使它可以工作,那也不是我想要的。现在,我将仅复制和粘贴代码,而不是编写函数。感谢那些阅读过这篇文章的人。

解决方法

由于某种原因,lme函数期望文字公式出现在调用中。它不希望在那里看到变量。它使用非标准评估来尝试将响应与固定效应项分开。在这种情况下,它实际上与公式的环境无关。

最简单的方法是使用do.call将公式注入到调用中。这应该工作

make_prediction_nlm <- function(data_in,y_var,x_var,treatment_var,id_var,new_data){
  
  formula_used_nlm <- as.formula(paste(y_var,paste(x_var,sep = " * "),sep = " ~ "))
  random_used <-  as.formula(paste("~1|",sep = ""))
  
  lme_model <- do.call("lme",list(fixed = formula_used_nlm,random = random_used,data = quote(data_in)))
  
  predict(lme_model,newdata = new_data)
}

这仅在您传递predict时才真正影响newdata=函数,因为它可以返回原始调用内容。

,

如果您查看nlme:::predict.lmenlme包名称空间中的隐藏函数),则会注意到这一行:

fixed <- eval(eval(mCall$fixed)[-2])

该函数试图提取固定的分量,去掉左侧([-2]的作用),然后重新求值。 @MrFlick的解决方案有效,并且可能比我发现的用于插入行的解决方案更原则化

lme_model$call$fixed <- formula_used_nlm

在函数中predict()调用之前。这会用计算值显式替换符号...

如果fixed <- eval(...)行被替换为eval()的适当变体(在父框架或公式或...的环境中起作用),也有可能。