网易首页 > 网易号 > 正文 申请入驻

临床预测模型步骤详解:关于预测模型的样本量

0
分享至

本文整理自《Journal of Hepatology》(IF=25.7)的一篇综述,原文标题为“Developing and validating clinical prediction models in hepatology – An overview for clinicians”[1],详细拆解了开发和验证临床预测模型的步骤。小咖将拆成几篇推文进行介绍,希望能为你的研究提供一些帮助。

上一篇文章介绍了前两个步骤:确定是否需要新的预测模型,确定模型的目的和预期用途,错过的小伙伴可以点击查看: 。今天我们来讲第3个步骤:评估数据的质量和数量

1

案例和数据集

本文使用梅奥诊所的原发性胆汁性胆管炎(PBC)数据集,建模示例是一个诊断模型,使用的数据和所有代码,可以通过以下链接获取:

https://github.com/rickstra/PBCexample

2

步骤3:评估数据的质量和数量

一旦确定了预测模型要解决的问题,就可以将重点转向数据了,需要检查数据的质量和数量。首先,我们当然希望数据集包含临床感兴趣的所有预测因子[2]。不希望看到的是,仅仅因为数据集中没有某个预测因子,就构建了一个没有该因子的预测模型。例如,使用一个没有肝硬化信息的数据集,开发预测患者未来罹患肝细胞癌风险的模型,很可能不会被临床医生采用。

此外,我们还应该考虑临床实践中如何测量这些预测因子。有些预测因子是"免费获取"的,如年龄、性别、体重和家族史;有些预测因子则需要医生对患者进行体格检查或采集血液样本。

有些预测因子则需要更高级的测量方法,如多基因风险评分、组学数据或影像学数据。在临床实践中应用时,测量这些预测因子的成本可能过高,如果一个用于基层医疗的模型,包含的预测因子的测量成本过高,那么该模型可能永远不会被使用。通过考虑每个预测因子在临床实践中的来源,我们在选择数据集覆盖的预测因子时,就能评估哪些在实践中是可行的,这就增加了模型在临床使用的可能性

在作为示例的PBC数据集中,"免费获取"的预测因子是年龄和性别;血小板、凝血酶原时间、白蛋白、胆红素、碱性磷酸酶、天门冬氨酸氨基转移酶、胆固醇和甘油三酯等预测因子需要血液样本;水肿、蜘蛛痣和肝肿大需要临床评估;铜水平需要尿液样本


由于尿铜是唯一需要采集尿样的预测指标,我们选择将其排除在外;我们还排除了凝血酶原时间,因为在许多情况下,该检测已不再经常使用。另外,腹水患者不在该预测模型的目标人群之列,因此也不将其作为预测指标。因此,在临床实践中要使用这个模型进行预测,需要临床评估和血液样本

提及预测模型可用的数据量,我们通常会考虑"有效样本量",它由数据集中的事件数而非总人数来决定(例如,在PBC数据集中,“有效样本量”是88例肝硬化事件,而非288例患者数)。在有10,000例患者的数据集中,3000例事件比只有10例事件有用得多。

在二分类结局的诊断模型中,有效样本量为事件数或非事件数,以最小者为准(例如,如果10,000名患者中有7,000例事件,则有效样本量为3,000)。在预后模型中,有效样本量由所关注结局的事件数决定。

构建模型所需的有效样本量,取决于预测模型的复杂程度。模型的"自由度(degrees of freedom)"是我们纳入到模型中需要估计的参数总数。 我们要求的自由度越大,就需要更多数据来准确估计所有参数。

每个预测因子至少需要一个自由度,也可能需要更多。对于分类变量的预测因子,自由度是类别数减一。例如,在PBC数据集中,发生水肿有三个类别(无水肿;治疗起效的水肿;治疗无效的水肿),因此自由度为2。如果我们希望看预测因子中的连续变量与结局间的非线性关联(例如使用样条函数),则需要根据所需的非线性复杂程度增加自由度,预测因子之间的交互作用也需要额外的自由度。

过去常用的经验法则是,模型中每一个自由度至少需要10例事件例如,我们使用的PBC数据集的有效样本量为88,表明自由度最多为9。最近,有研究者开发出了一种更有针对性的方法[3]。根据事件发生率和预设的模型复杂度(所有候选预测因子的自由度总数),基于模型性能良好所需的4项标准来估算所需的样本量。这4项标准是:

1. 样本量能否足够精确估计总体风险?

我们应该能够以一定的精度估算出事件发生率,比如误差在±5%以内。以二分类结局为例,样本量计算方法为:


例如,对于结局事件发生率为0.5的二分类结局来说,误差为0.05的条件下,样本量至少为385:


2. 多大的样本量可以使预测的平均绝对误差较小?

预测的绝对误差是指患者的预测风险与真实风险之间的绝对差值。真实风险永远不可知,但仍可使用近似公式估算出保持足够小平均绝对误差(如小于5%)所需的样本量。计算公式如下:


注:示例中结局事件发生率为0.3,预测因子数(P)为10,预测的平均绝对误差(MAPE)为0.05

3. 多大的样本量可以将过拟合降至最小?

过拟合是指模型过分匹配特定训练数据集,对训练集外的数据无良好地拟合及预测,易出现极端预测情况。例如,如果二分类结局的预测模型过拟合,那么对于结局概率高于平均值的个体来说,预测概率会过于接近1,而对于结局概率低于平均值的个体来说,预测概率会过于接近0。

过拟合主要发生在样本量过小时,特别是当候选的预测因子数量相对参与者数量或结局事件数量来说较大时过拟合的后果是,模型的表面预测性能(从开发数据集本身来看)是乐观的(即过高),而在来自同一目标人群的新数据集中的实际预测性能较差

收缩法(Shrinkage,也称为惩罚或正则化)可以通过减少模型的预测可变性来处理过拟合的问题,即减少极端预测情况(预测概率接近0或1)的发生。

Riley等人[4,5]建议在开发模型时,确定与预期较低收缩率(≤0.1,即收缩因子S≥0.9)相匹配的样本量和候选预测因子数量。对于二分类结局,计算样本量时需要知道候选预测因子数量、目标结局发生率,还需要评价模型性能的保守指标Cox-Snell R2(缩写为R2CS,接近0时,估计不可靠,可能出现过拟合;接近1时,反之)。计算公式如下:


注:示例中预测因子数(P)为20,收缩因子(S)为0.9,R2CS为0.1

4. 多大的样本量可以使模型拟合度达到较小的乐观程度?

一个预测模型在开发数据集中的表现,会比来自同一目标人群的新数据集的表现要好,我们称为表面性能是乐观的(即过高),数据越多,乐观程度就越低。我们希望有足够的样本量来限制预期的乐观程度。样本量计算公式如下:


很多时候,数据采集在建立预测模型之前就已完成了。在这种情况下,可以基于现有的样本量,根据上述四个标准来确定模型可以有的自由度在下表中,研究者根据上述四个标准对PBC案例进行了计算。研究者最初确定了12个候选预测因子(因此自由度至少为12),如果我们想为非线性或多类别再增加两个自由度,就可以基于14 个自由度来计算样本量。


注:该表显示了每一项标准的目标值(Target value);当自由度为14时,实现上述目标值所需的样本量(Sample size);根据实际的288个样本量和自由度14可以实现的值(Achieved value);根据实际的288个样本量来达到目标值所允许的最大自由度(df)。

达到全部四个标准所需的样本量为635,是现有样本量的两倍多。可以看出,是第二个标准要求如此大的样本量,因此,如果实际样本量为288个,那么预测的平均绝对误差会比我们希望的要大(0.077,而不是0.05)。

关于预测模型样本量计算的问题,推荐大家看BMJ的这篇文章,讲解得非常详细:


链接:https://www.bmj.com/content/368/bmj.m441

参考文献:

1. J Hepatol. 2024 Mar 24:S0168-8278(24)00213-7.

2. BMJ. 1995;311:1539–41.

3. BMJ 2020;368:m441

4. Stat Med. 2019;38:1276-96.

5. Stat Med. 2019;38:1262-75.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泽连斯基拿出白纸黑字,要中国兑现承诺:30年前就答应保护乌克兰

泽连斯基拿出白纸黑字,要中国兑现承诺:30年前就答应保护乌克兰

国学璀璨
2024-06-02 19:05:42
邯郸3恶魔杀害同学后续:嫌疑人全被抓,核准追诉,心理学家发声

邯郸3恶魔杀害同学后续:嫌疑人全被抓,核准追诉,心理学家发声

智博本博
2024-06-03 07:31:58
去菜市场买菜,为啥不能买门口老人卖的菜?内行:4个原因,很现实

去菜市场买菜,为啥不能买门口老人卖的菜?内行:4个原因,很现实

王姐懒人家常菜
2024-06-03 12:40:20
马尔代夫政府决定禁止以色列公民入境

马尔代夫政府决定禁止以色列公民入境

新华社
2024-06-03 02:20:03
直冲31℃!上海今天近期最热,转折马上来了:两次降温降雨,最高仅25℃

直冲31℃!上海今天近期最热,转折马上来了:两次降温降雨,最高仅25℃

上观新闻
2024-06-03 11:57:41
美军司令:台海战事一旦爆发,6个航母战斗群2个陆战师将尽数出动

美军司令:台海战事一旦爆发,6个航母战斗群2个陆战师将尽数出动

慎独赢
2024-06-03 12:45:02
李盈莹说出实情,朱婷未主打事出有因,蔡斌罕见表情失控

李盈莹说出实情,朱婷未主打事出有因,蔡斌罕见表情失控

跑者排球视角
2024-06-03 00:31:58
董军就台海划红线不到24小时,美日韩发表声明,不许中方收台

董军就台海划红线不到24小时,美日韩发表声明,不许中方收台

墨写东瀛话春秋
2024-06-03 19:33:56
足球报:如果国足不能晋级世预赛18强,伊万也必将面临下课

足球报:如果国足不能晋级世预赛18强,伊万也必将面临下课

直播吧
2024-06-03 09:46:11
“印钞机都赶不上它!”14天花掉234万,ICU是在救命还是捞财?

“印钞机都赶不上它!”14天花掉234万,ICU是在救命还是捞财?

39健康网
2024-06-02 09:04:01
将船拖走!中方下达最后通牒!西部战区司令被撤职,菲方彻底慌了

将船拖走!中方下达最后通牒!西部战区司令被撤职,菲方彻底慌了

慎独赢
2024-05-24 13:05:54
回顾:中国留学生魏巍在日本被执行死刑,受刑过程中他泪流满面

回顾:中国留学生魏巍在日本被执行死刑,受刑过程中他泪流满面

新月智慧所
2024-06-02 16:54:18
美国:钻地弹能把三峡大坝轰烂,没多久中国小伙让钻地弹变成废铁

美国:钻地弹能把三峡大坝轰烂,没多久中国小伙让钻地弹变成废铁

华人星光
2024-06-03 17:11:37
复牌跌停!撤销ST第1天涌出1亿,20万手把门焊死,2万股东一锅端

复牌跌停!撤销ST第1天涌出1亿,20万手把门焊死,2万股东一锅端

惜别的海岸
2024-06-03 11:07:52
中国曾三次忍辱负重“装孙子”,完美躲过美国制裁!最终迎来崛起

中国曾三次忍辱负重“装孙子”,完美躲过美国制裁!最终迎来崛起

猫眼观史
2024-05-16 18:11:46
伊朗突然对中国发起抗议,条件只有一个,希望中国想清楚再选边站

伊朗突然对中国发起抗议,条件只有一个,希望中国想清楚再选边站

刘庆彬
2024-06-03 17:56:01
哈曼:我不同情凯恩,欧冠只要没有韧带撕裂或崴脚就该留在场上

哈曼:我不同情凯恩,欧冠只要没有韧带撕裂或崴脚就该留在场上

直播吧
2024-06-02 23:09:11
警惕身边的“007”!国家安全机关再度破获重大间谍案

警惕身边的“007”!国家安全机关再度破获重大间谍案

极目新闻
2024-06-03 14:33:39
央视三胎广告火了!女生挺着三胎孕肚伺候一家老小?网友怒了

央视三胎广告火了!女生挺着三胎孕肚伺候一家老小?网友怒了

鬼谷子思维
2024-06-02 13:05:41
两年1800万,重返森林狼!李凯尔成联盟第1,彻底征服了所有人

两年1800万,重返森林狼!李凯尔成联盟第1,彻底征服了所有人

篮球谈资哦
2024-06-03 12:24:29
2024-06-03 21:02:44
医咖会
医咖会
生动有趣的形式传递医学新进展
2156文章数 10747关注度
往期回顾 全部

健康要闻

晚餐不吃or吃七分饱,哪种更减肥?

头条要闻

俞敏洪称"东方甄选做得乱七八糟":以后准备远离生意场

头条要闻

俞敏洪称"东方甄选做得乱七八糟":以后准备远离生意场

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

接班100天,宗馥莉急了

科技要闻

特斯拉回应单踏板模式可能被禁止:暂无影响

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

旅游
家居
教育
本地
游戏

旅游要闻

哈尔滨至香港航线正式开通

家居要闻

静谧极简 让空间回归本质

教育要闻

豁出去了,宁夏煤业招聘专科生下井挖煤,报名人数爆满,引热议

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

上海大师赛:残局大师eeiu标配下冥驹,100T 2-1淘汰PRX

无障碍浏览 进入关怀版