不同的 Kaplan-Meier 结果与 Interval2

问题描述

当我使用“interval2”类型的生存对象时,我注意到 survfit间的细微差别。我首先注意到 interval2 拟合的风险数字不是整数。我已经完成了 survfit.formulasurviftKM,但我仍然不清楚到底发生了什么以及为什么。有人会向我解释其中的区别吗?调试时似乎 survfitKM 使用了一些 .05 权重(casewt 变量),但我没有明确设置。

MRE:

library('survival')
surv_obj <- with(lung,Surv(time = time,event = status == 1))

left <- lung$time
right <- ifelse(lung$status == 1,lung$time,NA) 
surv_obj_int <- Surv(time = left,time2 = right,type = 'interval2')

surv_fit <- survfit(surv_obj~1,type = 'kaplan-meier')
surv_fit_int <- survfit(surv_obj_int~1,type = 'kaplan-meier')

解决方法

repo 所有者很好地解释了。

当存在区间删失数据时,代码使用 Turnbull 估计 (survfitTurnbull)。在这种情况下,风险数字没有明确定义,代码使用“工作”值。在您的特定示例中,没有间隔删失观察,如果更聪明,代码会注意到这一点并使用 survfitKM:更准确,速度更快。但是用户不会倾向于使用 interval2 样式,除非他们需要它。

尽管我将肺视为间隔审查,但没有实际的间隔。如果有一个右边的值,它总是等于左边的。