网易首页 > 网易号 > 正文 申请入驻

3种时间序列混合建模方法的效果对比和代码实现

0
分享至

本文中将讨论如何建立一个有效的混合预测器,并对常见混合方式进行对比和分析

基于树的算法在机器学习生态系统中是众所周知的,它们以主导表格的监督任务而闻名。在学习过程中,树的分裂标准只关注相关特征和有用值的范围,所以给定一组表格特征和要预测的目标,无需太多配置和特定的预处理就可以得到令人满意的结果。

但是基于树和梯度提升模型在时间序列预测领域的表现并不好,很多人更倾向于深度学习的方法。这并不奇怪,因为基于树的模型的弱点在于:在技术上无法推断出比训练数据中更高/更低的特征值。他们几乎不可能预测所见区间之外的值。相反,经典的线性回归可能较少受到数据动态行为的影响。既然线性回归擅长推断趋势,而梯度提升擅长学习交互,是否可以将它们结合起来呢?本文目标是创建“混合”预测器,结合互补的学习算法,让一个的优势弥补另一个的弱点。

在使用深度学习时,更容易想到“混合模型”,因为神经网络的无限架构组合和个性化训练过程在定制方面提供了巨大的好处。使用树模型开发定制的混合是比较麻烦的。linear-tree,这个 python 包是一个不错的选择,它提供混合模型架构,混合了基于树的模型和线性模型的学习能力。不仅如此,LGBM 或 XGBoost 也引入了用树叶中的线性近似拟合梯度提升的能力。

在这篇文章中,我尝试从头开始构建一个混合预测器。下面需要做的就是按照两步的方法来学习系统模式。

为了设计有效的混合,我们需要对时间序列的构建方式有一个大致的了解。时间序列一般可以通过将三个组成部分(趋势、季节和周期)加上一个本质上不可预测的项(误差)加在一起来精确描述。

series = trend + seasons + cycles + error

学习时间序列组件可以看作是一个迭代过程:

· 首先,学习趋势并将其从原始序列中减去,得到残差序列;

· 其次,从去趋势的残差中学习季节性并减去季节;

· 最后,学习周期并减去周期。

换句话说,我们使用一种算法来拟合特定的组件序列,然后使用另一种算法来拟合残差序列。 最终的预测是各种模型组件的预测相加。

为了尝试构建混合模型,我们开始生成一些具有双季节性模式和趋势分量的时间序列数据。

在随机游走序列上拟合三次多项式可以获得未知趋势。 结果是一条平滑的趋势线,它被添加到季节性分量中以获得最终的时间序列。 可以通过以这种方式生成多个时间序列,并尝试预测它们对各种解决方案进行基准测试。

本文中尝试了四种不同的方法:

· 拟合一个简单的线性模型;

· differencing:使用差分变换,使目标变得稳定;

· hybrid additive:拟合具有最优的线性模型推断趋势。 然后用梯度提升对去趋势序列进行建模;

· hybrid inclusive.:拟合梯度提升,包括外推趋势(获得拟合具有最优线性模型拟合的趋势)作为特征。

除了最基本的解决方案,上面的所有方法都使用一些样条变换作为特征。 这些特征可以很好地捕捉了季节性模式。 通过在训练数据上搜索最佳线性模型来计算最佳趋势。 使用时间交叉验证策略搜索一些最佳参数配置。

对于可以使用的每个系列,都尝试了上面所有提到的方法,并将结果存储在测试数据上。

hybrid inclusive 获得最低的平均测试误差,其次是差分法。 hybrid additive的表现低于我们的预期,因为它的错误几乎是差分方法的三倍。 一般来说,在对动态系统(例如本文的实验中提出的系统)进行建模时,对目标值进行差分操作是一个很好的选择。 混合方法之间的巨大性能差异也表现出了一些问题。 让我们检查一下下结果,看看会发生什么。

预测比较1

预测比较2

预测比较3

从上面的一堆图像中,可以更好地理解additive 方法的“失败”。 它的表现与之前趋势拟合的好坏密切相关。 如果趋势估计不准确,那么最终预测将更不准确。 但这种行为通过hybrid inclusive方法得到缓解,因为趋势作为特征包含在模型中。 因此梯度提升可以纠正/减轻最终的预测误差。

在这篇文章中,介绍了建立时间序列混合预测模型的不同方法。需要强调的重要一点是,除了这里展示的方法外,还有许多方法可以组合机器学习模型。如果我们能清楚理解标准算法是如何工作的,便能够更轻松地调试或理解混合创造的可能缺陷或缺陷。

最后,本文的完整代码在这里:

https://www.overfit.cn/post/266402dd48eb4a8884aa0f7c359da2cb

作者:Marco Cerliani

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
妻子出轨后我选择离婚,20年后,她儿子拿着份亲子鉴定来找我

妻子出轨后我选择离婚,20年后,她儿子拿着份亲子鉴定来找我

千秋文化
2026-06-13 20:02:52
世界杯战报:再爆大冷预警世界第6苦战2-2第87,日本很难很难了

世界杯战报:再爆大冷预警世界第6苦战2-2第87,日本很难很难了

金风说
2026-06-25 07:37:09
郑丽文再次对统一问题表态!

郑丽文再次对统一问题表态!

果妈聊娱乐
2026-06-25 12:17:32
原来她早已离世!自己一个人定墓园和寿衣,3200万遗产全给姐姐

原来她早已离世!自己一个人定墓园和寿衣,3200万遗产全给姐姐

小椰的奶奶
2026-06-25 11:01:21
被逼入绝境?绍伊古当面向中方提了两件事,俄罗斯希望中国能成全

被逼入绝境?绍伊古当面向中方提了两件事,俄罗斯希望中国能成全

丁丁鲤史纪
2026-06-25 17:13:58
美股科技股走势分化 美光科技收涨超15% 苹果大跌6%领跌“科技七巨头”

美股科技股走势分化 美光科技收涨超15% 苹果大跌6%领跌“科技七巨头”

财联社
2026-06-26 04:28:03
全线下跌,超20万人爆仓

全线下跌,超20万人爆仓

每日经济新闻
2026-06-26 00:32:07
造成3死1伤!福建福州市发生一起较大中毒窒息事故,调查评估报告发布:1人获刑三年,8人被给予党纪政务处分;因员工盲目施救造成伤亡扩大

造成3死1伤!福建福州市发生一起较大中毒窒息事故,调查评估报告发布:1人获刑三年,8人被给予党纪政务处分;因员工盲目施救造成伤亡扩大

台州交通广播
2026-06-25 14:38:17
2002 年李春平世纪骗局内情曝光:所谓百亿遗产继承权全是谎言

2002 年李春平世纪骗局内情曝光:所谓百亿遗产继承权全是谎言

磊子讲史
2026-06-23 17:22:32
台湾不愿意“一国两制”,王毅外长霸气回应,那就满足你们!

台湾不愿意“一国两制”,王毅外长霸气回应,那就满足你们!

荆楚寰宇文枢
2026-06-24 23:05:42
新中国第一个被罢免的省长,出狱后下海经商,晚年过得如何?

新中国第一个被罢免的省长,出狱后下海经商,晚年过得如何?

历史图鉴
2026-06-25 22:32:54
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
安徽15岁女孩在一网红景点拍照时坠湖身亡,前一天刚参加中考,事后网上仍有人推荐前往打卡,官方:事发地是废弃矿坑

安徽15岁女孩在一网红景点拍照时坠湖身亡,前一天刚参加中考,事后网上仍有人推荐前往打卡,官方:事发地是废弃矿坑

大象新闻
2026-06-25 22:53:26
你们再这么清醒下去,娱乐圈迟早要挂掉!

你们再这么清醒下去,娱乐圈迟早要挂掉!

走读新生
2026-06-23 17:32:04
黄一鸣48小时崩盘 两场官司全输账号遭封禁 私生女流量彻底反噬

黄一鸣48小时崩盘 两场官司全输账号遭封禁 私生女流量彻底反噬

手工制作阿歼
2026-06-26 03:15:22
7天期限已过,泽连斯基宣布好消息,为900万人性命,普京暂避锋芒

7天期限已过,泽连斯基宣布好消息,为900万人性命,普京暂避锋芒

李健政观察
2026-06-25 17:37:46
离开11年后,央视名嘴低调隐居北京,如今二婚21年无儿无女很潇洒

离开11年后,央视名嘴低调隐居北京,如今二婚21年无儿无女很潇洒

素衣读史
2026-06-25 21:56:52
乌克兰只是幌子,真正的目标已经落入圈套

乌克兰只是幌子,真正的目标已经落入圈套

半路友人之他
2026-06-26 00:51:00
听过最恐怖的故事是什么 看网友讲述 我身上的汗毛倒竖人间地狱啊

听过最恐怖的故事是什么 看网友讲述 我身上的汗毛倒竖人间地狱啊

侃神评故事
2026-06-25 11:02:06
A股:中央五部门联合出手,释放出重磅信号,明日将迎来更大行情

A股:中央五部门联合出手,释放出重磅信号,明日将迎来更大行情

云鹏叙事
2026-06-26 00:00:07
2026-06-26 05:24:49
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
2019文章数 1465关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

女孩在网红景点拍照时坠湖身亡 前一天刚参加中考

头条要闻

女孩在网红景点拍照时坠湖身亡 前一天刚参加中考

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

本地
房产
教育
旅游
健康

本地新闻

2026世界杯全勤太难?这份保姆级攻略请收好

房产要闻

城市精英集体出手!科学城这一现象级热销红盘,凭何成为共识之选?

教育要闻

321分上本科,489分却读专科:2026高考分数线三大趋势

旅游要闻

淤泥里挖出铁钟,钟下还压一尊神像,这座老庙藏着春城百年秘密!

医生如何快速诊断脑梗和脑出血?

无障碍浏览 进入关怀版