本篇内容选自课程《如何从临床工作中挖掘真实世界研究思路》讲师:美国杜克大学罗晟教授、何有文教授,美国圣犹达儿童研究医院汤黎教授。
背景故事
Kaplan-Meier的论文是美国统计学家Edward Kaplan和Paul Meier在1958年发表的,2014年《自然》杂志邀请汤森路透公司列出了有史以来引用次数最高的100篇论文中,该论文成为被引用最频繁的统计学论文(第11位)。有意思的是,尽管脍炙人口,以至于大多以为Kaplan-Meier是某个人的名字,Edward Kaplan和Paul Meier之间却并不认识。实际的情况是,两人分别单独写好论文,都寄往《美国统计学会会刊》(JASA),由于时间相近、方法一样,编辑促使了俩人的合作,这也就是Kaplan-Meier的由来。
01
K-M曲线(生存分析)是什么?
K-M曲线——研究某因素与生存结局(阳性事件)及时间是否相关相比于之前使用的寿命表法(Life-table method),这种方法更加充分地利用了信息,给出更准确的统计量。同时,作为一种非参数估计方法,不要求总体的分布形式,因此非常适合生存分析时使用。K-M曲线还可以很直观地表现出两组或多组的生存率或死亡率,非常适合在文章中进行展示。因此,K-M曲线也成为了生存分析中最常用的方法之一。
02
生存分析的目的?
当我们需要描述生存分析数据时,我们常常使用生存曲线来展示,这个时候需要估计每个时间点位的生存率,用的就是K-M方法。因此准确来说,K-M方法是一种统计描述方法,就好比用饼状图来展示比例,用箱图来展示连续变量。
(1)统计描述:
Kaplan-Meier法:估计生存率(生存函数)
(中位生存时间及四分位数间距)
(2)统计推断:
Log-rank检验:比较各组的生存率(生存曲线)
COX回归:生存期长短的影响因素分析
通过K-M曲线我们可以得到什么呢?
只有描述是不够的!我们还需要进行统计推断,也就是比较。因为生存数据往往都是非正态分布,因此常使用非参数的检验方法,也就是log-rank检验或Breslow检验,这就类似于对于非正态连续变量比较实用的方差分析。因此在实际写作中,K-M曲线都会搭配log-rank检验或者Breslow检验的P值,这样才算完整。
03
生存分析的数据组成有哪些?
生存分析的数据主要由三部分组成:分组信息、生存结局、生存时间。
(1)分组信息
常为2分类,但也可分为3分类、4分类等,上述案例为2分类。
(2)生存结局
生存结局是研究者设定的阳性事件。如果随访时间足够长、生存结局理论上均为1(发生阳性事件),但实际研究中,不一定所有研究对象在随访过程中均出现了阳性事件,此类患者的生存结局是0。
(3)生存时间
从随访开始到出现阳性事件(不限于死亡)所经历的时间。可分为完全生存时间和不完全生存时间(又称截尾值,censored value),截尾值涉及三种情况:①随访截止;②中途失访;③死于其他原因。
04
SPSS如何实现K-M曲线的绘制?
(1)菜单栏点击分析-生存函数-“K-M曲线”,依次填好信息。
(3)得到K-M曲线
由上面数据我们可以看到两种检验方法分别为Log Rank和Breslow得到的检验结果都是显著的而且通过生存曲线图我们也可以发现随着时间的推移差别更大的情况, Log Rank的P值更小,更容易得到阳性的结果。
更多临床研究相关知识,
详见课程
《如何从临床工作中挖掘真实世界研究思路》
多维视角、真实案例
SCI审稿专家带你清晰规划科研思路
从琐碎的临床工作当中挖掘真实世界研究思路
高效创作
剑指SCI期刊论文
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.