本文内容整理自医咖会《广义估计方程的SPSS及Stata软件实现》专栏,小咖针对广义估计方程的案例部分进行了整理,可点击左下角“阅读原文”查看完整视频。
案例1 重复测量数据
![]()
数据及特征
基线、术后6h、12h、24h CRP:连续型变量;
根据评分将术后疼痛定义为“是/否”:二分类变量。
统计分析方法
CRP:重复测量方差分析、广义估计方程(GEE)、广义混合效应模型;
术后疼痛:不适合重复测量方差分析,可使用GEE、广义混合效应模型。
GEE根据因变量选择分布函数,如果因变量为二分类变量,就可以选择binomial,也就是二项分布;如果因变量为连续变量,就可以考虑identity,也就是线性回归,在广义估计方程的框架基础上拟合线性回归。广义混合效应模型可以考虑固定效应和随机效应分析重复测量数据。任何提到“广义”的方法,都可以分析定性、定量、离散等各种因变量类型,仅需据此更改分布函数和连接函数即可。
案例2 纵向随访数据
![]()
数据及特征
每位患者每次出院后随访30天,确定再入院情况:一位患者具有多条数据;记录的间隔时间不统一,可视为不平衡数据;因变量可能存在相关性,发生了30天再入院的患者再次发生该事件的可能性较高(该指标为医疗/护理质量指标);该变量可作为嵌套数据(每次随访记录作为一层、每个患者作为一层)。
统计分析方法
上述数据特征决定了其对GEE的选择。临床上相似的情况普遍存在,如慢性病的多次入院情况,如果仅使用其中一次的入院情况,不仅是对临床数据的浪费,也没有办法探究每次住院间的相关性。
案例3因变量相关性研究
![]()
数据及特征
患者耐药性:患者可能对一种或多种药物耐受;耐药数目相同者可能耐药种类不同;不同药物的耐药性间可能存在相关性。
统计分析方法
如果不考虑以上情况,直接分为耐药/不耐药,可能忽略了各变量之间的相关性。粗略的分类并不能很好的进行数据挖掘,进而衡量变量与变量之间、结果和结果之间的相关性。
这些数据可以考虑将每位患者的每一种药的耐药情况都列出,结合个体因素形成非独立性数据,满足GEES分析的数据需求。
使用GEE建模比较少见,使用该模型需自行构建代码。这篇文章进行了广义估计模型构建,如有兴趣可在公众号主页回复“广义估计肺结核”获取原文。科研中,通常使用GEE进行危险因子分析、队列研究中暴露因素和结局相关性等研究,需要注意的是,GEE只是在分析中考虑了观测与观测之间的相关性,结果解读与线性研究是一样的,按照正常的OR、RR进行解读即可,但尽量不要进行卡方检验或者T检验(通常用于独立性数据)。
![]()
案例4多重应答数据
![]()
若将选项变量单独分析,割裂了彼此之间的联系,不但会掩盖本来的规律,还会在各选项的分析结果相互矛盾时,难以得出对整个问题的分析结论。而且多重应答数据因变量间不是互斥的,而是可以共存的,且可能存在相关性。
这时候就可以尝试GEE进行因素分析或因果关联研究。
案例5层次结构数据
![]()
研究探讨卒中患者转院时间的影响因素,时间为连续变量,可以将转诊原医院作为一个层次,每个患者作为一个层次,形成层次结构数据。类似于混合效应模型,将医院等级或不同医院作为固定效应,进而使用过GEE分析转院时间的影响因素。
需要注意,有的文章表示“进行GEE分析的数据不需要满足正态性”指的是上文提到的GEE可以满足多种类型变量的分析(二分类变量、多分类变量、泊松分布等),而不是定量变量或连续型变量不需要满足正态性。如果转院时间是偏态变量,需要进行Log转换为正态分布数据,再行GEE分析。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.