网易首页 > 网易号 > 正文 申请入驻

预测模型教程:详解区分度和校准度的SPSS操作

0
分享至

基于风险预测模型的预后研究一直以来都是研究者关注的热点,各种各样的预测模型质量参差不齐,常常让人眼花缭乱,那么如何去评价一个模型的好坏,或者说当你构建出一个疾病风险预测模型后,它到底靠不靠谱,值不值得去推广和使用呢?这是一个我们需要去好好考量的问题。

一个好的疾病风险预测模型,它不只是简单的因变量和自变量的数学组合,它背后的实际临床意义才是我们所要把握的重点,这就要求预测模型不仅要有很好的区分度(Discrimination),同时还要具备良好的校准度(Calibration)

Discrimination和Calibration是我们在评价预测模型时最常用到的一对指标,但是2015年Circ Cardiovasc Qual Outcomes杂志(影响因子:4.5)上发表的一项关注心血管疾病预测模型的系统综述发现,63%的研究报告了预测模型的Discrimination信息,但仅36%的研究报告了Calibration信息,使得预测模型的质量成为研究泛滥的重灾区。

本期内容我们就来向大家介绍一下这两个重要的指标,尤其是常常被人忽略的Calibration。

区分度(Discrimination)

介绍Calibration之前,我们先简单介绍一下Discrimination。顾名思义,一个好的疾病风险预测模型,它能够把未来发病风险高、低不同的人群正确地区分开来,预测模型通过设置一定的风险界值,高于界值判断为发病,低于界值则判断为不发病,从而正确区分个体是否会发生结局事件,这就是预测模型的区分度(Discrimination)。

评价预测模型区分能力的指标,最常用的就是大家非常熟悉的ROC曲线下面积(AUC),也叫C统计量(C-statistics)。AUC越大,说明预测模型的判别区分能力越好。一般AUC<0.6认为区分度较差,0.6-0.75认为模型有一定的区分能力,>0.75认为区分能力较好。

校准度(Calibration)

预测模型的校准度(Calibration),是评价一个疾病风险模型预测未来某个个体发生结局事件概率准确性的重要指标,它反映了模型预测风险与实际发生风险的一致程度,所以也可以称作为一致性。校准度好,提示预测模型的准确性高,校准度差,则模型有可能高估或低估疾病的发生风险。

在实际的应用中,通常用Hosmer-Lemeshow good of fit test(拟合优度检验)来评价预测模型的校准度。Hosmer-Lemeshow检验的基本思路如下:

1. 首先根据预测模型来计算每个个体未来发生结局事件的预测概率;

2. 根据预测概率从小到大进行排序,并按照十分位等分成10组;

3. 分别计算各组的实际观测数和模型预测数,其中模型预测数,即每个人的预测概率*人数,再求总和,这里人数即为1,最后总和就相当于每个个体预测概率的直接加和;

4. 根据每组实际观测数和模型预测数计算卡方值(自由度=8),再根据卡方分布得到对应的P值。

若所得的统计量卡方值越小,对应的P值越大,则提示预测模型的校准度越好。若检验结果显示有统计学显著性(P<0.05),则表明模型预测值和实际观测值之间存在一定的差异,模型校准度差。

区分度和校准度的SPSS操作

一、建立数据库

某研究人员拟建立一个关于冠心病患者支架介入术后再次发生MACE事件(Major Adverse Cardiovascular Events,主要心血管不良事件)的风险预测模型,并对该风险模型的预测能力进行评价。数据库格式如下图所示。


其中因变量(结局事件)为Event,自变量(影响因素)为性别(Gender)、年龄(Age)、收缩压(SBP)、吸烟(Smoking)、低密度脂蛋白胆固醇(LDL)及冠脉病变Syntax评分(SYNTAX)。

二、构建预测模型

本研究利用Logistic回归构建预测模型(若研究为含有时间变量的生存数据,则可采用Cox回归模型)。Logistic回归的操作步骤对大家来说应该早就是小case了,操作方法如下:

1. Analyze → Regression → Binary Logistic Regression

2. 将因变量Event选入Dependent框中,将各个自变量选入Covariates框中


3. 点击Save,在Predicted Values下勾选Probabilities,目的是为了在数据库中新生成一个概率值,用于绘制ROC曲线和校准曲线图。


4. 点击Options,勾选Hosmer-Lemeshow goodness-of-fit,用于输出Hosmer-Lemeshow拟合优度检验的结果。


三、Logistic回归结果

Variable in the Equation中输出了每个影响因素的回归系数(β)、OR值、95% CI以及P值等信息。回归方程如下:

logit (p)= -8.713 - 0.899*Gender + 0.05*Age + 0.021*SBP + 0.912*Smoking + 0.438*LDL + 0.07*SYNTAX


四、模型区分度(Discrimination)

通过绘制ROC曲线,计算AUC,即C统计量来评价模型的判别区分能力。具体操作步骤为:

1. Analyze → ROC Curve

2. 将新生成的预测概率值PRE_1作为检验变量Test Variable ,将Event作为状态变量State Variable,并设定Value of State Variable为1

3. 勾选ROC Curve用于绘制ROC曲线

勾选Standard error and confidence interval用于输出AUC及其标准误和95%可信区间。


预测模型ROC曲线如下图所示,曲线下面积AUC为0.782>0.75,95% CI为0.726-0.838,提示该预测模型的区分能力较好。



五、模型校准度(Calibration)

通过Hosmer-Lemeshow拟合优度检验来评价预测模型的校准能力。结果显示,Hosmer-Lemeshow χ2 =4.864,P=0.772>0.05,提示模型预测值与实际观测值之间的差异没有统计学显著性,预测模型有较好的校准能力。

同时SPSS还输出了Hosmer-Lemeshow检验列联表,表中将每个研究对象的预测概率从小到大进行排序,并按照十分位分成10组,分别列出了每一组实际观测值(Observed)和模型预测值(Expected),从而可以在每一个分组下进行直观的比较,来帮助判断模型的校准能力。


六、模型校准图形(Calibration Plot)

既然在评价预测模型区分度的时候,结果可以通过绘制ROC曲线进行可视化,那么对于预测模型的校准度,我们也同样可以绘制校准图使结果可视化。

我们在文献中常常可以看到,校准图的绘制一般有三种形式,大家可以利用上面SPSS输出的Hosmer-Lemeshow检验列联表的结果,将其复制到Excel中(以下图形均以Excel 2013版为例),跟着小咖一起来绘制校准图形。

1. 散点图

根据实际观测值(Observed)和模型预测值(Expected)绘制散点图,并拟合线性趋势线,即可得到校准曲线,如下图所示的蓝线。而红线为标准曲线(y=x),表示预测数和实际观测数完全一样。若蓝色的校准曲线和红色的标准曲线越接近,则提示模型的校准能力越好。


2. 条形图

将每个研究对象的预测概率从小到大进行排序,并按照十分位分成10组,以条图的形式来表示每组实际观测值和模型预测值的大小,这样能够更加直观的展示在每一组内,实际观测值和模型预测值之间的差别,以此来帮助判断模型更为准确的预测区间。


3. 线图

线图的表达方式和条形图类似,同样也是按照预测概率的十分位分成10组,以坐标点的形式来表示每组实际观测值和模型预测值的大小,并用平滑的线段依次连接起来。它不仅可以直观的展示每一组内实际观测值和模型预测值之间的差别,同时也能从整体上来判断模型的校准能力。模型预测曲线与实际观测曲线越接近,则可提示模型的校准能力越好。


总结

Discrimination和Calibration是评价预测模型效能的两个重要指标,但比较容易混淆,最后再和大家总结一下:

1.Discrimination区分度,就是在模型的预测值中,看是否能够找到一个截点,使得把患者和非患者正确区分开来。如果区分的越开,且与实际情况越吻合,则提示模型的区分度越好。

2.Calibration校准度,就是评价模型预测值的大小和结局事件发生概率的大小是否一致。如果模型的预测值与结局实际发生概率越接近,则提示模型的校准度就越好。

3.风险预测模型的Discrimination和Calibration并不一定都是同方向的。

如图A,模型的Discrimination很好,能够根据发病风险将不同的研究对象明显的区分开来,但是Calibration较差,预测值偏离校准曲线很远,与实际情况不符。


(图A)

图B,模型的Calibration很好,预测值都集中在校准曲线上,预测较为准确,但是Discrimination较差,研究对象的患病风险都比较接近,无法将其明显的区分开来。


(图B)

图C,模型的Discrimination和Calibration都很好,不仅能够把不同风险的患者明显的区分开来,而且预测值都集中在校准曲线上,预测结果较为准确。


(图C)

图D,是最为理想的模型,能够准确预测研究对象是否患者,发病风险为0或100%。


(图D)

4.对于一个疾病预测模型,在利用Discrimination和Calibration进行评价时,我们首先需要考虑的是模型的区分能力Discrimination,如果模型的区分度较差,不能正确的将不同风险的人群区分开来,那么它就不是一个合格的预测模型,失去了临床的应用价值,再继续评价Calibration也没有太大的意义了。

所以,如果你对自己建立的疾病风险预测模型有足够的信心,那么不妨也计算一下模型的Discrimination和Calibration,相信一定会得到更多同行的认可。

参考文献:

[1] Circ Cardiovasc Qual Outcomes. 2015 Jul;8(4):368-75

[2] JAMA. 2017;318(14):1377-1384

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海这座乐园成废墟探险地?实地探访:安全防护全无,逃票进场不绝

上海这座乐园成废墟探险地?实地探访:安全防护全无,逃票进场不绝

新民晚报
2024-05-27 09:19:08
患者300元挂专家号,报告出来专家已下班 院长:可以去普通门诊看

患者300元挂专家号,报告出来专家已下班 院长:可以去普通门诊看

荷兰豆爱健康
2024-05-26 22:23:41
江启臣也宣扬“两国论”?

江启臣也宣扬“两国论”?

杂谈天下式
2024-05-28 02:14:07
炸裂!陕西一县书记出轨女下属,聊天记录被男友曝光!

炸裂!陕西一县书记出轨女下属,聊天记录被男友曝光!

猫小狸同学
2024-05-28 12:30:02
哈维被解雇的真正原因 并非大嘴巴 而想要清洗这四位球员

哈维被解雇的真正原因 并非大嘴巴 而想要清洗这四位球员

智道足球
2024-05-28 10:39:17
5月26日晚,凤凰传奇,深夜共同发文!

5月26日晚,凤凰传奇,深夜共同发文!

仙人掌说娱乐
2024-05-27 10:59:19
法网冷门不断!4大种子翻车,郑钦文领衔3金花登场,德约开门红?

法网冷门不断!4大种子翻车,郑钦文领衔3金花登场,德约开门红?

刘姚尧的文字城堡
2024-05-28 05:48:58
TA:为参加庆功宴,卡塞米罗冒损失14万欧风险将私人飞机推迟2小时

TA:为参加庆功宴,卡塞米罗冒损失14万欧风险将私人飞机推迟2小时

直播吧
2024-05-28 03:49:27
央美毕业展作品惹争议,网友怒批“一堆垃圾”

央美毕业展作品惹争议,网友怒批“一堆垃圾”

新动察
2024-05-27 10:01:31
回顾:女子上班素面朝天,新来个男生后判若两人,同事:她化了妆

回顾:女子上班素面朝天,新来个男生后判若两人,同事:她化了妆

雅清故事汇
2024-05-27 20:31:48
王思聪被曝日本签证出问题,多次现身管理局,穿着邋遢撞衫汪小菲

王思聪被曝日本签证出问题,多次现身管理局,穿着邋遢撞衫汪小菲

萌神木木
2024-04-27 18:03:40
帕金斯警告绿军球迷:你们不要把欧文惹急了 他现在不好惹

帕金斯警告绿军球迷:你们不要把欧文惹急了 他现在不好惹

直播吧
2024-05-28 13:47:03
紧急道歉!立即关闭!永久解约!

紧急道歉!立即关闭!永久解约!

南国今报
2024-05-27 23:08:47
“春熙路最后一块土地”,或将再度易主

“春熙路最后一块土地”,或将再度易主

趣味萌宠的日常
2024-05-28 12:32:12
6月将至,如果房价继续下跌,输得最惨的不是炒房客,而是这4类人

6月将至,如果房价继续下跌,输得最惨的不是炒房客,而是这4类人

山丘楼评
2024-05-27 14:44:26
无侦10首飞琉球群岛侦察,御用摄影师水平下降严重,拍出画质太差

无侦10首飞琉球群岛侦察,御用摄影师水平下降严重,拍出画质太差

三叔的装备空间
2024-05-28 10:04:12
中国制裁美国军火商究竟有没有用?看看今天的洛马就知道了

中国制裁美国军火商究竟有没有用?看看今天的洛马就知道了

忠诚TALK
2024-05-27 09:37:48
笑话:大巴车上,司机手机响了,他开了免提说:老po,我开车呢

笑话:大巴车上,司机手机响了,他开了免提说:老po,我开车呢

今日搞笑分享
2024-05-27 07:25:06
惊心一幕!乌克兰女兵遭遇不公,阵亡后被抛弃,衣服弄的乱七八糟

惊心一幕!乌克兰女兵遭遇不公,阵亡后被抛弃,衣服弄的乱七八糟

笔墨V
2024-05-28 00:38:12
卡塔尔航空:执行QR017航班的波音B787-9飞机已安全降落 事件进入内部调查阶段

卡塔尔航空:执行QR017航班的波音B787-9飞机已安全降落 事件进入内部调查阶段

财联社
2024-05-27 17:18:22
2024-05-28 15:06:44
医咖会
医咖会
生动有趣的形式传递医学新进展
2152文章数 10747关注度
往期回顾 全部

科技要闻

罗永浩不和视频号交朋友

头条要闻

美国历史首个前总统刑事审判将结案 特朗普或将创纪录

头条要闻

美国历史首个前总统刑事审判将结案 特朗普或将创纪录

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

郑裕彤家族撑腰 小赢科技撮合放贷大赚

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

家居
旅游
本地
公开课
军事航空

家居要闻

圆的世界 流动的曲线与自如的空间

旅游要闻

画面曝光!五台山保安与游客起冲突 有人用手捂头

本地新闻

2024沈阳皇姑第二届半程马拉松

公开课

近视只是视力差?小心并发症

军事要闻

以色列空袭拉法难民营后 安理会将召开紧急闭门会议

无障碍浏览 进入关怀版