网易首页 > 网易号 > 正文 申请入驻

使用 Minitab 回归进行预测分析 – 第二部分

0
分享至

回归的目的是进行准确预测。模型中的项(线性、交互、二次)和用于计算模型的样本数据是影响模型可预测性的两大因素。项过多的模型通常会过度拟合样本数据,但会导致对新数据值的预测不佳。

前文中,我们讨论了如何快速构建、验证和可视化预测模型。现在,我们将深入了解验证模型的预测能力、自动化分析和模型选择以及预测新结果的更高级功能。

验证 MINITAB预测模型的能力

下图显示了一个过度拟合的模型。在添加来自同一过程的新数据时,该模型在预测新测量值方面表现不佳。如果使用线性模型来拟合原始数据,则可以做出更准确的预测。验证用于防止构建可预测性较低的模型。

验证过程分为两步,首先根据一组数据(训练集)构建模型。然后使用该模型对模型构建中省略的一组数据(测试集)进行预测。有三类验证技术:逐一剔除法、K 折叠和使用测试集验证。

使用验证时,分析师需要了解报告的模型及对应的 R2值。R2值用于了解模型在样本数据中解释了多少变异以及准确预测新值的能力。R2R2值越高越理想。如果过度拟合是潜在问题,则测试集和训练集之间的 R2值会存在较大差异。

逐一剔除法验证

验证过程省略一个数据点,作为测试集。剩余的 n-1 个观测值用于计算训练模型。然后使用该模型计算删除数据点的预测误差。每次观察都会重复此过程。预测误差用于生成预测 R2。请注意,预测 R2是所有回归模型的标准输出。

回归中的 K 折叠验证

在 K 折叠验证中,将数据随机分配到 K 个大小相同的组中,通常 K=10。删除第一组,作为测试集,并以剩余的组作为训练集来构建模型。使用训练模型对忽略组进行预测,来计算预测误差。将针对各组重复此过程,并计算复合 K 折叠 R2。

使用测试集验证

在使用测试集验证方法时,将随机数据子集分配为测试集,例如 30%,剩余的训练集 (70%) 用于计算预测模型。使用测试集对该模型进行验证,以计算测试 R2。

比较验证技术

K 折叠验证更适用于中等大小的样本,而使用测试集方法的验证则是大型数据集的理想之选。需要注意的是,逐一剔除法和 K 折叠验证技术仅验证模型的形式,而不能像使用测试集方法那样验证精确的模型系数。

自动化分析和模型选择。

回归模型选择通常是一个手动流程。但数据集不仅增加了观测值个数,还测量了更多变量。必须手动删除项可能让人望而生畏。

模型选择可以自动化。三种常见程序如下:

项 p 值的 Alpha 标准:逐步,使用“前进法”和“后退法”选择一个模型,该模型中的项在阈值 alpha 中具有显著意义。

模型拟合的信息标准:AICc 或 BIC 前进法将选择可最小化所选信息标准的模型。

模型预测拟合的 R 平方值:K 折叠或使用测试集进行验证前进法将选择具有最高测试 R2值的模型。

验证方法往往会导致不同的结果;因此,最好结合行业知识,找到最实用、最具影响力的解决方案。

预测新结果并优化参数

回归分析是一个强大的工具,一旦选择了“最佳”模型,就可以用其进行预测。以制造工厂的洁净室为例。重要的是了解几个预测变量对每立方英尺超过 100 个 0.5μ 或更大尺寸的粒子计数的影响。工艺工程师构建粒子计数预测模型:

该模型用于预测在有 7 名员工和 24 个洁净室入口/出口的情况下,完成 1000 生产量:

每立方英尺超过 100 个 0.5μ 或更大尺寸的预测平均粒子计数为 87.63。置信区间和预测区间说明了预测中的潜在误差。

MINITAB 让回归变得简单

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本,最后的阵地崩溃,走向可耻的终点

日本,最后的阵地崩溃,走向可耻的终点

一个坏土豆
2024-06-02 18:08:07
如果圆周率算尽了,会出现什么后果?颠覆人类文明或许只在一瞬间

如果圆周率算尽了,会出现什么后果?颠覆人类文明或许只在一瞬间

文史达观
2024-05-30 06:45:02
朱婷谈发球象征性登场:当时纠结,魏秋月老公叫我准备发球收尾

朱婷谈发球象征性登场:当时纠结,魏秋月老公叫我准备发球收尾

阿芒娱乐说
2024-05-31 15:01:56
快放生!四川老大爷钓到红色怪鱼,网友惊呼:牢底坐穿鱼

快放生!四川老大爷钓到红色怪鱼,网友惊呼:牢底坐穿鱼

小胡渔记
2024-05-30 08:40:02
哈佛大学:多吃含类黄酮的食物,或能保护大脑,远离老年痴呆

哈佛大学:多吃含类黄酮的食物,或能保护大脑,远离老年痴呆

39健康网
2024-06-01 21:31:45
突发!四川一条河变粉红色,环保局称没毒,源头没找到,评论炸了

突发!四川一条河变粉红色,环保局称没毒,源头没找到,评论炸了

荷兰豆爱健康
2024-06-03 08:19:24
分手前,我们做一次爱吧

分手前,我们做一次爱吧

娱乐洞察点点
2024-06-03 02:05:18
王朔:美国非常适合我这样的小市民居住,过一份踏实日子

王朔:美国非常适合我这样的小市民居住,过一份踏实日子

芯怡飞
2024-05-31 15:24:51
听说过捡尸吗?有些寂寞少妇,喜欢在醉酒后躺在酒吧门口等着被捡

听说过捡尸吗?有些寂寞少妇,喜欢在醉酒后躺在酒吧门口等着被捡

戎安鸽
2023-01-13 18:34:11
江苏一女子刚办完离婚手续,兴奋向闺蜜宣布,闺蜜不停道“恭喜”

江苏一女子刚办完离婚手续,兴奋向闺蜜宣布,闺蜜不停道“恭喜”

四象八卦
2024-06-02 19:06:37
盘点女乒四位"刺头":曹燕华喝酒抽烟五毒俱全,丁宁为赢不择手段!

盘点女乒四位"刺头":曹燕华喝酒抽烟五毒俱全,丁宁为赢不择手段!

祝晓塬
2024-06-02 22:13:03
破船还未搬走,菲第3艘坐摊舰又来了,国防部开始上场,禁令生效

破船还未搬走,菲第3艘坐摊舰又来了,国防部开始上场,禁令生效

影孖看世界
2024-06-01 12:50:23
1992年阎锡山小儿子回忻州老宅,不料却被售票员拦住:同志请买票

1992年阎锡山小儿子回忻州老宅,不料却被售票员拦住:同志请买票

历史有些冷
2024-06-02 10:05:02
人生下半场最大的差距,就在于《中年觉醒》

人生下半场最大的差距,就在于《中年觉醒》

洞见
2024-05-31 21:45:45
功德林最“憋屈”的两人:都参加过南昌起义,75年最后一批被释放

功德林最“憋屈”的两人:都参加过南昌起义,75年最后一批被释放

史源历史专栏
2024-05-31 10:01:29
70岁老头风流成性,把十多个会所小姐带回家当保姆,最后动了真心

70岁老头风流成性,把十多个会所小姐带回家当保姆,最后动了真心

叶天辰故事会
2024-05-22 15:49:25
曼联欲6000万签马夏尔替代者,已考察一赛季!左闸替补亦有新人选

曼联欲6000万签马夏尔替代者,已考察一赛季!左闸替补亦有新人选

罗米的曼联博客
2024-06-03 07:38:13
终于知道考公务员为啥要体检了笑崩了哈哈哈哈

终于知道考公务员为啥要体检了笑崩了哈哈哈哈

小陆搞笑日常
2024-05-31 14:35:48
领导干部任职前公示

领导干部任职前公示

锡望
2024-06-02 14:28:21
捂着伤口追下25级台阶追击20多米倒在血泊中,武汉民警邱建军壮烈牺牲

捂着伤口追下25级台阶追击20多米倒在血泊中,武汉民警邱建军壮烈牺牲

极目新闻
2024-06-03 08:53:42
2024-06-03 12:40:49
MinitabUG
MinitabUG
学习更多Minitab相关
271文章数 25关注度
往期回顾 全部

科技要闻

2万字演讲|黄仁勋剧透 未来3年新品有这些

头条要闻

武汉一警察牺牲 身中15刀仍下25级台阶紧追歹徒20米

头条要闻

武汉一警察牺牲 身中15刀仍下25级台阶紧追歹徒20米

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

黄仁勋的计划:涉及新AI平台 HBM4 机器人

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

家居
游戏
房产
本地
手机

家居要闻

静谧极简 让空间回归本质

TOC8国际邀请赛:恭喜PasDeBol成功夺冠!

房产要闻

重磅!琼海出台楼市新政:住房出租、挂牌计划出售,都可减套数!

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

手机要闻

轻薄又全能 华为Mate X5购机赠送HUAWEI Care+权益

无障碍浏览 进入关怀版