SPSS教程25-28:生存分析
1.生存分析:一场“速度与激情”的健康追逐赛
2.如何阅读一张生存曲线图?
3.初学者如何理解Cox回归和HR值
4.Cox回归的应用条件
SPSS教程28讲:
Cox回归的应用条件
COX回归,全称为COX比例风险模型,主要用于带有时间的生存结局的影响因素研究,或评价某个临床治疗措施对患者生存的影响。最近几年,由于队列研究的大量开展,COX回归广泛获得应用。特别是临床病人随访研究,十之八九采用的统计学方法便是COX回归。
COX对因变量和自变量要求都不高,只要求结局指标既要有生存的二分类结局,也要有生存时间,对生存时间也没有分布的要求,对自变量要求更低,什么类型的自变量都可以。此外,COX回归要求观察值残差分布同样满足独立性的要求(一般情况下都不成问题,开展回归分析可以基本忽略本要求)
然而,尽管COX回归不用考虑生存数据分布,但有一点还是得明确,cox回归绝不是适用于所有生存数据的多因素分析。至少有2个关键的条件,COX回归必须考虑,也必须满足,第一,等比例风险(Proportionalhazards)假定。第二,当自变量是连续型变量时,Cox回归中自变量与因变量的关系--一种转换后线性关系,也必须满足。
接下来,我沿用上一讲的案例,来稍微详细解释下两个条件
这是一项关于胰腺癌病人术后生存时间的队列研究。该研究的终点为死亡,包括很多可能影响生存的因素。数据库见pancer.sav
等比例风险假定
什么是等比例风险?
举个例子:现在研究术中放疗这一手术方式对胰腺癌患者生存(OS)的影响,在研究方案中,设定术中放疗为治疗组,未术中放疗未对照组,患者接受随访,得到生存结局,开展生存分析。
术中放疗和没有接受术中放疗者在生存时间和结局的差别,这个差别初步可以绘制生存曲线来标的。
可以看出,放疗者和未放疗组,随着时间的推移,其生存率在下降,下降的速度即为单位时间死亡率,或者称之为死亡速率,在生存分析中称之为风险值。两组在任何一个时间都存在着风险率,比如第一个月的风险率、第1年内的风险率、第90天风险率,反映的是不同时间的死亡速度。同一个时间两组风险率的比值称之为风险比即为HR,反映的是任何一个时间点,术中放疗是否比未术中放疗更能预防死亡的发生。
COX回归有一个重大规定,虽然各组生存率下降,各个时间点死亡速度不一致,但是要求下降的速率比是一样,比如第二年,处理组死亡速率是10%,那么对照组死亡速率5%,第三年术中放疗组风险率20%,那么对照组应该也是10%左右,如此,死亡速率之比,也就是HR值保持一致,这便是等比例风险。
为什么要有这个规定呢?
这是因为COX回归计算的HR,是一个总体的HR,只有整个生存过程中HR保持一致,最终求出的HR才能代表总体,否则总体HR没有意义。
等比例风险判断
那么,如何判断数据是否满足这一条件呢?实际中常见的有这几种方法:
1.可以通过K-M方法得到生存曲线图,简单判断其是否符合条件
比如一般情况如果等比例分风险模型,曲线一般呈喇叭开口状(A),或者接近平行,但如果曲线交叉或者接接近交叉的状态(B),那么说明在不同是几点,HR值是不一致,此时不能采用COX回归
2.可以采用COX回归中二次对数生存曲线图来看看
绘制生存结局在不同状态下的二次对数生存曲线图(即横坐标是时间的对数,纵坐标是生存函数的对数的对数),如果生存曲线大致平行,那么COX回归的条件成立,COX回归条件不成立。
3.构造时依协变量开展交互效应分析在COX回归模型中增加研究因素与时依协变量的交互项。如果交互项有统计学意义(P0.05),则表明研究在不同时间的作用不同,也就是说不满足等比例风险假设。4.其它方法
探讨等比例风险假设的方法还很多比如Schoenfeld残差图法、线性相关检验法等,有兴趣的朋友可以