具有 cauchit 链接函数的二项式广义线性模型的置信区间

问题描述

Gavin Simpson hereherehere 已充分讨论了计算广义线性模型 (GLM) 置信区间 (CI) 的正确方法。但是,提供的二项式示例始终涉及 logit 链接函数,即逻辑回归。我想使用 cauchit 链接函数为我的数据建模,该函数基于 Cauchy distribution (y = atan(ax + b)/pi + 0.5) 的累积分布函数 (CDF)。此链接功能很少使用,但在我的情况下非常适合。所以我在 cauchit 二项式 GLM 上尝试了 Gavin Simpson 的方法。这是在 R 中使用 these data 的最小可重现示例。

wasp <- read.csv("wasp.csv",skip = 1)
mod <- glm(visited ~ leafHeight,data = wasp,family = binomial(link = "cauchit"))
summary(mod)

new <- with(wasp,data.frame(leafHeight = seq(min(leafHeight),max(leafHeight),by = 1)))
inv <- family(mod)$linkinv # extract the inverse of the cauchit link function
predicted <- predict(mod,type = "link",se.fit = TRUE,newdata = new)
# fit
new$fit <- inv(predicted$fit)
# 99% CI
new$upper <- inv(new$fit + predicted$se.fit * qnorm(0.995)) 
new$lower <- inv(new$fit - predicted$se.fit * qnorm(0.995))

require(ggplot2)
ggplot(new,aes(leafHeight,fit)) +
  geom_line() +
  geom_ribbon(aes(ymin = lower,ymax = upper),alpha = 0.5) +
  theme_minimal()

enter image description here

显然,这看起来不对!我也对其他数据尝试了这种方法,但总是得到相同的无法使用的 CI。使用反向链接函数的方法似乎不适用于 cauchit GLM。

本质上,我想围绕 cauchit GLM 的预测值计算 95% 和 99% 的 Wilson 得分 CI,以避免 normal approximation intervals 的已知问题。 This answer 表明可以使用 binom::binom.confint(method = "wilson") 计算 Wilson CI。但是,我不知道如何将这个 R 函数应用于具有连续预测变量的示例。是否有一种简单的方法可以使用 cauchit 链接函数计算和绘制二项式 GLM 的可用 CI?还是唯一的解决方案是自举 CI?如果是,我将如何在 R 中实现这一点?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...