如何找到生存分析的最佳分类?

问题描述

我有一个关于生存分析的问题。但是,我有以下数据(只是摘录):

enter image description here

现在我正在尝试使用 Python 生命线包进行生存分析。例如,我想知道 T 细胞是否会影响整体存活率 (OS)。但据我所知,我需要对不同类别的 T 细胞数量进行分类,例如高 T 细胞和低 T 细胞……是吗?但是我如何找到最合适的切口呢? 我的计划是证明,高 T 细胞的肿瘤比低 T 细胞具有更好的存活率。但是我怎么能从我这里的数据中找到区分高和低 T 细胞的最佳截止值。

有人有想法吗?我的一个朋友说了一些关于“ROC”-分析的事情,但我现在真的很困惑......我很高兴能得到任何帮助!

解决方法

连续变量向分类变量的转化远非明显。第一种方法可以基于现有文献,尤其是在医学/生物学方面。对现有文献的回顾可能足以创建这些类。另一种方法可以基于 T 细胞变量的经验分布,有时会突出“明显”的分类。使用 ROC 曲线可能是一个好主意,但不知何故,我认为没有必要。在 Kaplan-Meier 类型生存分析中对变量进行分类是必要的,但如果您使用 Cox 模型,则无需对该变量进行分类。所以我建议你转向 Cox 回归来进行你的生存分析。 Cox 回归允许您在建模中添加多个预测变量以及交互项,这样更方便。