![]()
系列简介
这是我们一系列原创技术贴,从易到难,每天学习一点。所有内容均为疾控数据分析、科研论文相关,或者说很多和现在的热门监测预警相关,所以我们这个系列就叫“监测预警基础”。
今天是第20节,经过2节课的预热,我们终于来到了最近3-4节的主题——Serfling回归,快学起来吧。
在传染病监测领域,我们常常面临一个核心问题:如何判断当前的发病人数、或者说死亡人数是否“异常”?是正常的季节性波动,还是某种传染病比如流感的悄然袭击?
60年前,一位美国流行病学家用一套简洁而强大的统计模型,给出了经久不衰的答案。今天,我们就来深入剖析这个监测领域的经典工具——Serfling回归模型。
![]()
Serfling回归模型,由Robert Serfling博士于1963年创立,是历史上首个被系统用于量化流感相关超额死亡率的统计模型。
它的核心思路非常直观:
1.寻找“常态”:收集过去多年每周的死亡数据。
2.剥离“流感”:手动剔除历史上明确是流感高峰的时期,剩下的数据被视为“无流感干扰的本底状态”。
3.建模预测:用这些“干净”的数据拟合一个模型,这个模型能刻画死亡率的长期趋势和固定季节波动。
4.照亮“异常”:将这个模型外推到全年,生成一条连续的“预期死亡基线”。这条线回答了一个关键的假设性问题:“如果今年完全没有流感,死亡情况本应如何?”
最后,将实际观测到的死亡数,与这条理论基线进行比较。持续超出基线的部分,就被估算为流感带来的“超额死亡”,当然,所有这些死亡,你都可以理解为发病。
![]()
本质是“基线模型”:该方法的核心思想是利用正弦和余弦函数的循环回归特性,处理时间序列中的季节性或循环波动的情况,它不预测未来,而是定义“常态”,它的全部工作就是建立一条合理的基准线,所有监测都始于与这条线的比较。
内核是“反事实推断”:这是其最深刻的内涵。它通过统计方法构建了一个未曾发生的“反事实世界”(无特殊异常的世界),并将现实与之对比,从而量化出疾病的具体影响。
精髓在于“分离”:它将时间序列数据中的信号分离为三部分:
趋势(缓慢变化)
季节(规律波动)
超额(异常信号)
模型捕捉前两者,剩下的突出部分就可能是超额。
一个生动的比喻:Serfling模型就像一位严谨的历史气象学家。他先研究过去几十年非台风季节的风力数据,总结出四季的正常风力变化规律,然后,他用这个规律去审视全年数据。当他在某个夏秋之交,发现实际风速持续、显著地超过了正常规律预测的值时,他就可以断言:“这里有一个台风信号,它的‘破坏力’可以用超过正常值的部分来衡量。”
![]()
原始论文中,Serfling使用最小二乘法拟合以下模型:
![]()
让我们抛开公式,理解其操作逻辑:
第一步:准备数据
收集至少5-7年的每周发病人数,
第二步:定义“基线期”(关键!)
在历史数据中,手工标记并剔除所有明确的流感流行周。Serfling本人剔除了每年死亡率最高的约10%的周。剩下的数据,就是构建模型的“净土”。
第三步:拟合模型
用“净土”数据拟合一个方程:发病情况 = 长期趋势 + 季节性波浪
“季节性波浪”通常用一对正弦-余弦函数来完美模拟其平滑、周期性的波动。这一步在统计软件中可轻松完成。
第四步:绘制基线,设定阈值
将上述方程用于预测全年每一周(包括之前被剔除的流感季),得到贯穿全年的预期发病基线。在此基线上方,计算一个流行病阈值线(通常为基线预测值的95%置信区间上限)。
第五步:比较与计算
将当前实际的发病曲线与预测基线、阈值线绘制在同一张图上。
何时暴发?实际曲线持续突破阈值线时,提示流行开始。
负担多重?将流行期内,实际曲线与基线之间区域的“面积”(死亡数的累计差值)加总,即得到超额死亡总数。
具体来说,就是将拟合方程的病例基线95% 置信区间的上限作为流行阈值,观察值大于流行阈值的时间定义为流行期,该期内观察值与拟合基线的差值即为超额病例数,用超额病例数与流行期拟合基线病例数的比值反映超额幅度即超额占比。
好的,就先这样吧,具体如何操作,下一节我们以实际例子详细讲述一下怎么操作。
![]()
![]()
编辑:普通疾控人 | 审核:诗酒趁年华
文章来源 | 原创
说明 | 转载只为分享,如有侵权联系删除
©版权声明 | 部分信息和图片来自公开网络
转载请注明
再次转载请注明出处
![]()
科普健康 | 宣传疾控
本号为多位疾控机构从业者运营
重点关注国内外健康事件
致力于疾控科普
在做好科普服务大众的同时
做好疾控机构的宣传
让更多的人了解疾控,拥抱健康
欢迎加「小编」微信(cdcjkr126com)
本文具体说明
本文为原创内容,文章为个人理解所学,不涉及疫情信息及内部保密数据,发表的目的为自我总结及给有需求的人士学习使用。如有不妥之处,欢迎联系小编修改、删除。
更多精彩视频,尽在“CDC疾控人”视频号
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.