网易首页 > 网易号 > 正文 申请入驻

观察性研究控制混杂因素第一弹:分层分析

0
分享至

在随机对照试验(RCT)中,随机化保证了研究对象的各项基线特征(例如年龄、性别、疾病严重程度、伴随疾病等能够影响疾病预后的因素)在试验组和对照组之间的均衡性。

然而,RCT研究并非总是可行。

第一,对于需要很长时间的干预和随访来观察长期效应的研究,或者需要大量样本来观察罕见严重不良事件的研究,RCT并不是最理想的,因为它十分昂贵且需要耗费大量资源,实施起来也非常困难;

第二,当研究的干预措施具有一定风险时,随机分组则可能无法满足伦理要求,不能将患者随机分配到具有一定风险的干预组中。

针对这些情况,观察性研究可以提供更好的证据来源。实际上,越来越多设计规范的观察性研究被广泛应用到疗效比较中,甚至有学者认为观察性研究能够解决RCT在人群普遍适用性上的缺陷,从而提供最接近真实世界的疗效评价结果。

然而,在真实世界中,治疗方案的选择往往是根据可能影响患者预后的因素来确定的,而这些影响因素在暴露/处理组和非暴露/对照组的人群中常常分布并不均衡,这就导致观察性研究的结果可能会产生一定的偏倚。

为了克服预后因素分布的不均衡性,保证观察性研究结果的真实性和可靠性,我们可以从统计学的角度来对其进行调整和处理,常用的统计学方法包括分层分析(Stratified Analysis)、多因素调整分析(Multivariable risk adjustment)、倾向性评分分析(Propensity Score Analysis,PSA)、工具变量分析(Instrumnental Variable Analysis,IVA)等等。

我们将通过一系列的文章,针对观察性研究控制混杂因素的方法一一向大家介绍。

混杂因素

在介绍各种方法之前,我们首先要搞清楚什么是混杂因素,为什么调整混杂因素很重要。当我们想要评估某种干预措施的疗效时,最为理想的研究方案是,除了干预措施以外,其他所有可能会影响结局的因素,包括已知的和未知的因素,在两组研究对象之间均保持一致。

随机化是解决这一问题最理想的方法,但在观察性研究中暴露/处理因素往往是病人自行或被动选择的,从而导致暴露/处理组和非暴露/对照组人群之间的预后因素分布不均衡,使得真实的效应值被低估或高估,引起偏倚。这种现象我们称之为混杂(Confounding),其中引起混杂效应的因素被称为混杂因素(Confounder)

混杂因素通常具备以下几个特点:

1、混杂因素必须与研究结局密切相关;

2、混杂因素又与研究的暴露/处理因素有关;

3、混杂因素一定不是暴露/处理因素和研究结局之间因果关系链上的中间变量,它们三者的关系如图1所示。

有一些混杂因素是已知的,并且可以被准确测量,但是还有很多潜在的混杂因素是我们未知且无法测量的,这些混杂因素也会对结果造成一定的偏倚,我们称之为残余混杂(Residual Confounding)

为了控制混杂因素对研究结果的干扰,减少偏倚,我们需要对混杂因素进行一定的调整,使其在暴露/处理组和非暴露/对照组中分布均衡,才能更准确地探讨暴露/处理因素与研究结局之间的关联性,保证观察性研究结果的真实可靠。

分层分析

分层分析是一种常用的控制混杂因素的方法,它是将数据资料按照某个需要控制的混杂因素进行分层,然后再估计暴露/处理因素与研究结局之间的关联性。

分层分析的一般步骤为:

1. 计算总人群中暴露/处理因素与研究结局的效应值,即粗RR(相对危险度)或OR(比值比)值;

2. 将研究资料按照混杂因素来进行分层,计算各层内暴露/处理因素与研究结局的效应值,即分层RR或OR值;

3. 判断各层之间的效应值是否一致,即判断层间RR或OR值是否相近或同质。若各层之间的RR或OR值不一致,则不能合并,需要分层报告效应值。

4. 若各层之间的RR或OR值基本一致,则可以用M-H(Mantel-Haenszel)法计算合并的效应值,即调整(控制混杂因素后)的RR或OR值;再将合并的RR或OR值与分层前的粗RR或OR值进行比较。

若调整后的RR或OR值与粗RR或OR值不一致,可以认为分层因素存在混杂作用【《流行病学(第六版)》建议,差值在0.1以上(RR或OR<1时),或在0.5以上(RR或OR>1时)时,认为调整后RR或OR值与粗RR或OR值不一致】。此时,还要结合临床或生物学意义进行综合分析,而不应该仅仅根据统计学结果来判断。

研究实例

举一个例子,如图2所示,假设我们进行一个队列研究(队列研究是观察性研究的一种)来探讨某种处理的疗效,处理组和对照组各100人,其中处理组中有80人为年轻人,20人为老年人,而对照组中有20人为年轻人,80人为老年人。

经过一段时间的随访,处理组中死亡12人,其中8人为年轻人,4人为老年人,对照组中死亡18人,其中2人为年轻人,16人为老年人。直接计算处理因素的RR为12%/18%,即0.67,可认为该处理是有效的,能够降低33%的死亡风险。

(点击图片可查看大图)

由于年龄本身与死亡密切相关,且年龄在两组之间分布严重不均衡,年龄作为一个混杂因素,可能会对结果造成一定的偏倚。下面我们按照年龄进行分层,来重新评估不同年龄分层下的处理因素的效应值。

首先在年轻人中,处理组80人死亡8人(10%),对照组20人死亡2人(10%),处理因素的RR为10%/10%=1,在老年人中,处理组20人死亡4人(20%),对照组80人死亡16人(20%),处理因素的RR为20%/20%=1,将分层后的RR值进行合并计算,得到控制年龄混杂因素后的调整RR值为1,则可认为两组人群的死亡风险相同。

从这个例子我们发现,在未进行分层分析之前,由于处理组年轻人较多,而年轻人的死亡风险又较低,因此初步的结果倾向于认为处理因素可以降低死亡风险。但是按照年龄因素进行分层后,由于年龄在两组之间的分布严重不均衡,掩盖了处理因素的真实效应,在对年龄进行分层分析后,才发现处理因素实际上对于死亡风险并无影响。

分层分析局限性

在上述例子中,我们仅考虑了年龄一个混杂因素,并对其进行了分层分析,假设此时增加一个混杂因素——糖尿病,且糖尿病在处理组和对照组人群中分布也不均衡,我们就需要同时对年龄和糖尿病进行分层,即分为年轻糖尿病组、年轻非糖尿病组、老年糖尿病组和老年非糖尿病组,共4层,并在每一层下进行单独分析,最后将结果进行汇总。

如果再增加一个混杂因素——高血压,此时有3个混杂因素,就要分为8层(23)。若有n个混杂因素,则分层的数量即为2n。

在实际研究中,混杂因素的数量往往较多且非常复杂,因而研究对象就会被分割为很多亚层,计算就会变得非常复杂,同时每一层的样本量就会变得很少,结果也会很不稳定。并且对于连续性的变量,在进行分层分析时需要将其转化为分类变量,这样也造成了信息损失,降低了数据的利用效率。

因此,当我们的研究中存在较多的混杂因素,且混杂因素较为复杂时,应该如何对混杂因素进行控制和调整呢?我们将在下期内容中介绍更多实用的统计方法

参考文献:

1. JAMA. 2017 Feb 21;317(7):748-759

更多阅读

1. 一张示意图,马上搞懂分层随机化!

2. 干货:那些年火到现在的倾向值匹配法

3. 《内科学年鉴》连发两文,聚焦咖啡和死亡率!

医咖会微信:medieco-ykh

关注医咖会,涨姿势!

有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进统计讨论群和其他小伙伴们一起交流学习;或者点击公众号下方自定义菜单的“统计咨询”,提出你遇到的统计难题。

点击左下角“阅读原文”,看看既往小伙伴们都提出了哪些问题,以及该如何去解决,也许正好能帮到你~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宋宁峰疑带女儿出轨,两人互发不雅照录音曝光,小三是高露好友

宋宁峰疑带女儿出轨,两人互发不雅照录音曝光,小三是高露好友

古希腊掌管松饼的神
2026-03-31 11:58:42
瑞典晋级世界杯!3-2淘汰波兰,阿森纳神锋绝杀+半决赛帽子戏法

瑞典晋级世界杯!3-2淘汰波兰,阿森纳神锋绝杀+半决赛帽子戏法

小金体坛大视野
2026-04-01 08:33:57
一夜狂跌400元!3月31日金价变天,一定要注意这3个坑千万别踩!

一夜狂跌400元!3月31日金价变天,一定要注意这3个坑千万别踩!

次元君情感
2026-04-01 03:21:28
震惊!一程序员与公司达成73万补偿和解,网友:公司还是低头了…

震惊!一程序员与公司达成73万补偿和解,网友:公司还是低头了…

火山詩话
2026-03-31 12:16:45
公安部亮剑!2026民生乱象零容忍,再不整治普通人寸步难行

公安部亮剑!2026民生乱象零容忍,再不整治普通人寸步难行

叮当当科技
2026-04-01 05:43:23
4.1日早评|重磅公布!伊朗大消息!A股要起飞!

4.1日早评|重磅公布!伊朗大消息!A股要起飞!

龙行天下虎
2026-04-01 04:03:56
其实你缺的不是衣服,而是“搭配思路”,不然衣服再多也白费!

其实你缺的不是衣服,而是“搭配思路”,不然衣服再多也白费!

老好人的愤怒
2026-03-31 11:30:01
张凌赫团队急了?素颜热搜洗白失败遭群嘲,网友呼吁严查背后资本

张凌赫团队急了?素颜热搜洗白失败遭群嘲,网友呼吁严查背后资本

萌神木木
2026-03-29 16:02:23
西方正制造一个可怕的共识:对华战争,可无视道德底线和伦理原则

西方正制造一个可怕的共识:对华战争,可无视道德底线和伦理原则

老范谈史
2026-03-31 18:35:14
意大利出局加图索致歉:十人死守已尽力,拿刀捅我都不流血了

意大利出局加图索致歉:十人死守已尽力,拿刀捅我都不流血了

仰卧撑FTUer
2026-04-01 06:37:02
张雪机车两连冠!必须提醒:你们动巨头500亿的蛋糕,一定要小心

张雪机车两连冠!必须提醒:你们动巨头500亿的蛋糕,一定要小心

达文西看世界
2026-03-31 18:53:29
乒乓球世界杯:温瑞博连赢2局2-1逆转!8-3后连丢3分,11-9险胜!

乒乓球世界杯:温瑞博连赢2局2-1逆转!8-3后连丢3分,11-9险胜!

刘姚尧的文字城堡
2026-03-31 21:23:39
差120票!联大压倒性投票表决,中国审判美以暴行,现场激烈对峙

差120票!联大压倒性投票表决,中国审判美以暴行,现场激烈对峙

书纪文谭
2026-03-31 12:32:32
澳门世界杯疯狂一夜!雨果剃光头,王楚钦零封,温瑞博3-1逆转

澳门世界杯疯狂一夜!雨果剃光头,王楚钦零封,温瑞博3-1逆转

小徐讲八卦
2026-04-01 05:49:47
瞠目结舌!张雪社交媒体亲述:放水太明显了!

瞠目结舌!张雪社交媒体亲述:放水太明显了!

真理是我亲戚
2026-03-30 15:33:49
坦诚!爱德华兹:没首发的原因是我当时在拉屎

坦诚!爱德华兹:没首发的原因是我当时在拉屎

懂球帝
2026-03-31 19:24:10
章泽天带卡塔尔公主参观京东总部,身穿紫色套装,端庄大气

章泽天带卡塔尔公主参观京东总部,身穿紫色套装,端庄大气

日落于西
2026-03-30 16:40:28
难以置信!成都一高中教师年收入曝光,含公积金近22万,评论炸锅

难以置信!成都一高中教师年收入曝光,含公积金近22万,评论炸锅

火山詩话
2026-03-31 17:08:57
艾维被裁更多细节曝光:全额领剩余薪水 没任何公牛球员为他惋惜

艾维被裁更多细节曝光:全额领剩余薪水 没任何公牛球员为他惋惜

罗说NBA
2026-04-01 06:15:36
S.H.E为田馥甄庆生,合照炸出中年分水岭:最不起眼的Selina赢麻了

S.H.E为田馥甄庆生,合照炸出中年分水岭:最不起眼的Selina赢麻了

乡野小珥
2026-03-31 17:02:44
2026-04-01 08:48:49
医咖会
医咖会
生动有趣的形式传递医学新进展
2801文章数 10992关注度
往期回顾 全部

头条要闻

牛弹琴:战争开始烂尾 特朗普要跑了以色列目瞪口呆

头条要闻

牛弹琴:战争开始烂尾 特朗普要跑了以色列目瞪口呆

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

欧央行行长与美财长G7会议上交锋!

科技要闻

营收翻倍、巨亏31亿!中国大模型太烧钱了

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

艺术
游戏
亲子
公开课
军事航空

艺术要闻

蓝瑛『兰竹石册』

Bin哥自曝控制饮食狂瘦20斤!ON目标去MSI

亲子要闻

为什么不建议孩子穿开裆裤?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:即使霍尔木兹海峡仍关闭 也愿意结束战争

无障碍浏览 进入关怀版