什么是协变量?
协变量通常用于方差分析和 DOE。在这些模型中,协变量为任意连续变量,通常在数据收集期间不可控制(生产时不可控且试验时也不可控,但是可以测量的变量)。包含协变量的模型可让您包含并调整在试验中已度量但非随机化或不可控的输入变量。添加协变量可以在很大程度上提高模型的准确度,并可能显著影响最终的分析结果。在模型中包含协变量可以减少模型中的误差,从而提高因子检验的功效。常见的协变量包括环境温度、湿度以及对部件或对象采取处理手段之前的特征。
注:所谓讨厌因子是指在当前实验的环境中我们对此不感兴趣,但是必须考虑的因子。
例如,一位工程师希望研究四类铁条的腐蚀水平。该工程师让每种铁条接触一种液体处理方式,从而加速腐蚀效果,但他无法控制液体的温度。温度就是应在模型中考虑的协变量。
在 DOE 中,某工程师可能对协变量环境温度对于两种不同油漆的干燥时间的效应感兴趣。
向一般线性模型添加协变量的示例
某纺织公司使用三种不同的机器生产单丝纤维。他们想要确定使用不同机器产生的纤维抗断强度是否不同。他们从每台机器中随机选择 5 种纤维,收集其强度和直径数据。因为纤维强度与其直径相关,所以他们还记录了纤维直径,作为可能的协变量来使用。
1)确认协变量和响应是否线性相关。 您可以通过在Minitab中使用拟合线图分析数据来执行此操作。
拟合线图表明直径和强度之间存在很强的线性关系 (87.2%)。
2)执行含有协变量的一般线性模型分析。
机器的 F 统计量为 2.61,p 值为 0.118。因为 p 值 >0.05,您无法否定“在 5% 的显著性水平下,所以纤维强度不会根据所使用的机器而有所不同”的原假设。您可以假设所有机器的纤维强度都相同。请注意,直径(协变量)的 F 统计量为 69.97,p 值为 0.000。这表明,协变量效应显著。也就是说,直径对于纤维强度具有统计意义非常显著的影响。
3)现在,假设您重新运行分析并忽略协变量。这将得出以下输出:
请注意,F 统计量为 4.09,p 值为 0.044。模型中没有协变量,您会在 5% 显著性水平下否定原假设,并得出纤维强度会根据使用的机器而有所不同的结论。
结论
执行分析时包含和不包含协变量,得到的结论可能完全相反。该示例表明不包含协变量可能生成误导性分析结果的程度有多严重。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.