![]()
系列简介
这是我们一系列原创技术贴,从易到难,每天学习一点。所有内容均为疾控数据分析、科研论文相关,或者说很多和现在的热门监测预警相关,所以我们这个系列就叫“监测预警基础”。
今天是第23节,也是Serfling回归的最后一节,我们讲讲调整Serfling回归的具体操作。
好的,一切准备就绪,我们现在直接开始 调整Serfling回归模型具体操作演示。
其实现在很简单了,前面 Serfling回归模型如何具体操作我们已经会了,上一节我们也把调整Serfling回归的步骤讲清楚了,现在操作就是手到擒来。
第1步,计算部分自变量
![]()
计算公式和前面Serfling回归的一模一样,我们就不赘述了,计算完成之后进行回归分析。
第2步,回归分析,得出预测病例数
![]()
使用软件开展回归分析,这个时候就可以得出预测病例数以及相应参数,这个时候得出R2为0.67。
第3步,计算第二轮回归的因变量
![]()
如果实际病例数大于第一轮预测的病例数,就去除这个数据,只保留实际病例数小于第一轮预测的病例数的值作为第二轮的因变量Y。
第4步,再次进行第二轮回归
![]()
使用软件开展第二轮回归分析,以保留的实际病例数小于第一轮预测的病例数的值作为第二轮的因变量Y,自变量不变,进行第二轮回归。
这个时候就可以得出第二轮回归的预测病例数以及相应参数,这个时候得出R2为0.88,明显比第一轮回归的要大,这个时候就需要第三轮回归。
第5步,计算第三轮回归的因变量
![]()
第三轮回归的因变量计算的时候还是比较,但是比较的对象不是预测值,我认识预测值的95%置信区间上限。
如果实际病例数大于第二轮预测的病例数的95%置信区间上限,就去除这个数据,只保留实际病例数小于第二轮预测的病例数的95%置信区间上限的值作为因变量Y。
第6步,进行第三轮回归
使用软件开展第3轮回归分析,这个时候就可以得出第3轮回归的预测病例数以及相应参数,这个时候得出R2为0.80,明显比第2轮回归的要小,这个时候就不再继续进行回归分析,而是以第二轮回归为准。
相当于就是最终取R2值最大的一次回归对应的拟合曲线及95%CI的上限作为最终的基线病例数及流行阈值。至此,我们回归的参数都有了,拟合曲线及95%CI的上限也有了,就可以计算超额发病数。将时间轴拉长进行计算,然后我们就可以进行预测接下来时间的病例数了。
![]()
![]()
编辑:普通疾控人 | 审核:诗酒趁年华
文章来源 | 原创
说明 | 转载只为分享,如有侵权联系删除
©版权声明 | 部分信息和图片来自公开网络
转载请注明
再次转载请注明出处
![]()
科普健康 | 宣传疾控
本号为多位疾控机构从业者运营
重点关注国内外健康事件
致力于疾控科普
在做好科普服务大众的同时
做好疾控机构的宣传
让更多的人了解疾控,拥抱健康
欢迎加「小编」微信(cdcjkr126com)
本文具体说明
本文为原创内容,文章为个人理解所学,不涉及疫情信息及内部保密数据,发表的目的为自我总结及给有需求的人士学习使用。如有不妥之处,欢迎联系小编修改、删除。
更多精彩视频,尽在“CDC疾控人”视频号
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.