网易首页 > 网易号 > 正文 申请入驻

做时间序列预测有必要用深度学习吗?事实证明,梯度提升回归树媲美甚至超越多个DNN模型

0
分享至

在深度学习方法应用广泛的今天,所有领域是不是非它不可呢?其实未必,在时间序列预测任务上,简单的机器学习方法能够媲美甚至超越很多 DNN 模型

过去几年,时间序列领域的经典参数方法(自回归)已经在很大程度上被复杂的深度学习框架(如 DeepGIO 或 LSTNet 等)更新替代。这是因为传统方法可能无法捕获长期和短期序列混合传递的信息,而深度学习方法的思路是掌握数据中的跨时非线性依赖。从结果来看,这些深度学习方法不仅优于 ARIMA 等传统方法和梯度提升回归树(Gradient Boosting Regression Tree, GBRT)等简单机器学习模型,而且增强了这样一种预期,即机器学习领域的时间序列预测模型需要以深度学习工作为基础,才能得到 SOTA 结果。

但是,推荐系列领域的最新启示表明,深度学习方法在机器学习各种研究分支取得的成就需要对简单高效模型定期确认和评估,以保持各自研究领域进展的真实性。除了时间序列预测模型越来越复杂之外,另一个动机包括文献中正在完善的深度学习模型在处理时间序列预测问题上的片面性,因此限制了现有解决方案方法的多样性。

在前段时间的一篇论文《Do We Really Need Deep Learning Models for Time Series Forecasting?》中,来自德国希尔德斯海姆大学计算机科学系的研究者展示了通过精心配置的输入处理结构,GBRT 等简单但强大的集成模型在时间序列预测领域能够媲美甚至超越很多 DNN 模型。

论文地址:https://arxiv.org/pdf/2101.02118.pdf

研究者对特征工程多输出 GBRT 模型进行了评估,并提出了以下两个研究问题:

  • 对于用于时间序列预测的基于窗口的学习框架来说,精心配置 GBRT 模型的输入和输出结构有什么效果?

  • 一个虽简单但配置良好的 GBRT 模型与 SOTA 深度学习时间序列预测框架相比如何?


为了回答这两个问题,研究者选择了双重实验设置,分别解决两类预测任务,即系统化方式中的单变量和多变量预测。目的是评估 GBRT 模型以及在顶会(NeurIPS、KDD、SIGIR、ECML、ICML、CIKM、IJCAI、ICLR 等)中出现的 SOTA 深度学习方法。这项研究的整体贡献可以总结如下:

一,研究者将一个简单的机器学习方法 GBRT 提升了竞品 DNN 时间序列预测模型的标准。首先将 GBRT 转换成一个基于窗口的回归框架,接着对它的输入和输出结构进行特征工程,如此便能从额外上下文信息中获益最多;

二,为了突出输入处理对时间序列预测模型的重要性,研究者通过实证证明了为什么基于窗口的 GBRT 输入设置可以在时间序列预测领域提高 ARIMA 和原版 GBRT 等精心配置的模型所产生的预测性能;

三,研究者比较了 GBRT 与各种 SOTA 深度学习时间序列预测模型的性能,并验证了它在单变量和双变量时间序列预测任务中的竞争力。

这项研究也引起了不少人的共鸣。有人认为,时间序列分类任务同样也没有必要用深度学习方法。在一些情况下,SVMs 或逻辑回归方法表现更好,速度也更快。

研究设计

选择基线。研究者系统地过滤了 2016 年至 2020 年在 NeurIPS、KDD、SIGIR、SDM、ECML、ICML、CIKM、IJCAI、ICLR 等会议表现较好的论文集。论文需满足以下要求:

  • 主题:只考虑时间序列预测领域的研究;

  • 数据结构:专用数据类型,但如异步时间序列和概念化为图形的数据被排除在外;

  • 可复现:数据、源代码应公开。如果源代码不可用,但实验设置有清晰的文档,研究也可以从实验中复制结果;

  • 计算的可行性:研究中得出的结果能够以易于处理的方式复现,并在合理的时间内可计算。

评估。该研究在两个层次上对时间序列预测 GBRT 模型进行评估:一个单变量和一个多变量。为了使所选的深度学习基线和 GBRT 之间具有显著的可比性,该研究在相同的数据集上评估了所有模型,数据集如下表 1 所示:左边提供了关于用来评估模型数据集,而右边则列出了各自的实验规范:

问题公式化。时间序列预测问题,就监督学习而言,时间序列预测可以表述为:给定一个集合 和一个集合 ,经过一系列假设后,得到如下期望损失最小化模型:

GBRT

GBRT 模型,特别是 XGBoost 实现,其优点是易于应用,而且在结构化数据上特别成功。但是当涉及时间序列预测的初始(naive)实现时,GBRT 模型失去了很大一部分灵活性,因为它们没有被投射到基于窗口的回归问题中,而是被配置为适合大部分时间序列作为完整且连续的数据点序列来预测时间序列的后续和剩余测试部分。

与上述初始实现不同,该研究通过将时间序列重新配置为窗口输入,并在多个训练实例(窗口)上进行训练,以模拟成功的时间序列预测模型中使用的输入处理行为,为此该研究定义了一个可调窗口, 。 这种基于窗口的 GBRT 模型输入设置如图 1 所示:

第一步是使用变换函数 将典型的 2D 训练实例(时间序列输入窗口)变换为适合 GBRT 的 1D 形状向量(扁平窗口)。 该函数将所有 w 实例的目标值 y_i 连接起来,然后将最后一个时间点实例 t 的协变量向量附加到输入窗口 w 中,表示为 。

基于窗口的 GBRT 输入设置极大地提高了其预测性能,因为 GBRT 模型现在能够掌握数据的底层时间序列结构,并且现在可以被认为是先进 DNN 时间序列预测模型的适当机器学习基线。另一方面,简单配置的 GBRT 模型 是一个简单的逐点回归模型,将时间点 的协变量作为输入,预测单一目标值 Y_i、j 为同一时间点训练损失如下:

实验结果

单变量时间序列的结果

下表 2 总体结果表明,除了 traffic 预测外,基于窗口的 GBRT 具有较强的竞争力。另一方面,具有传统配置的预测模型(例如 ARIMA 和 GBRT(Naive))的表现远远优于预期。

而在 electricity 预测方面,基于窗口的 GBRT 在所有模型中均显示出最佳的 RMSE 性能,其在 WAPE 和 MAE 方面的性能仅优于 2016 年推出的 TRMF,基于注意力的 DARNN 模型表现较差。关于 exchange rate 任务,LSTNet(以 w = 24 重新实现)和 TMRF 显示出相当强的结果,优于基于窗口的 GBRT 基线。

在不考虑时间预测器的情况下,traffic 预测的结果是混合的,因此 DARNN 和 LSTNet 实现了 traffic 数据集的最佳结果,而对于 PeMSD7 数据集,基于窗口的 GBRT 基线在两个方面优于 DNN 模型三个指标。然而,时间协变量的包含显着提高了 GBRT 的性能(下表 3),因此,对于 traffic 预测,所有 DNN 方法,包括 DeepGlo [18] 和 STGCN(spatio-temporal traffic forecasting model ) [19],其在 PeMSD7 上实现了 6.77 的 RMSE,优于重新配置的 GBRT 基线。

下表 4 显示了 LSTNet 与 GBRT(W-b) 的结果:

下表 5 中的结果表明 GBRT 的竞争力,但也表明基于 transformer 的模型相当强大,例如 TFT 超过了提升回归树性能。然而,作为一个例外,TFT 构成了本研究中唯一一个始终优于 GBRT 的 DNN 模型,而 DeepAR 和 DeepState 等概率模型在这些单变量数据集上的表现优于其他模型。

多元数据集

下表 6 中为 DARNN 与基于窗口 GBRT 比较:简单、配置良好的 GBRT 基线可以超越 DNN 框架。

从下表 7 可以看出,即使是专门为某一预测任务设计的 DNN 模型,也没有达到预期效果。相反,DAQFF 的性能比简单的基于窗口、特征工程的梯度提升回归树模型更差。在本实验中,值得注意的是,即使是传统应用预测意义上的 GBRT 模型也能在 air quality 数据集上提供更好的结果。

—版权声明—

来源:机器之心,编辑:nhyilin

仅用于学术分享,版权属于原作者。

若有侵权,请联系微信号:Eternalhui或nhyilin删除或修改!

—THE END—

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
发现阿里老公失业了,他每天假装上班。我要不要告诉他已经知道了

发现阿里老公失业了,他每天假装上班。我要不要告诉他已经知道了

蚂蚁大喇叭
2026-07-03 11:29:16
尹乃菁与郑丽文切割,郑借势换血清杂音,启用陈以信全面收拢权力

尹乃菁与郑丽文切割,郑借势换血清杂音,启用陈以信全面收拢权力

除此深远轮廓
2026-07-03 08:25:16
她是大家熟悉的演员,不拍戏在法国洗碗谋生,如今遭遇高温热得慌

她是大家熟悉的演员,不拍戏在法国洗碗谋生,如今遭遇高温热得慌

潋滟晴方DAY
2026-07-01 23:20:19
日本振振有词让中方给个解释,凭什么连自卫队都不放过?

日本振振有词让中方给个解释,凭什么连自卫队都不放过?

铁锤侃侃而谈
2026-07-03 12:22:25
神操作!男子将现任妻子照片PS成前妻样貌,假冒有前妻授权,欲独吞60万执行返还款,被法院当场识破

神操作!男子将现任妻子照片PS成前妻样貌,假冒有前妻授权,欲独吞60万执行返还款,被法院当场识破

上观新闻
2026-07-03 09:35:12
毛主席接见导弹营长岳振华,说:你打下一架飞机,我就给你加颗豆

毛主席接见导弹营长岳振华,说:你打下一架飞机,我就给你加颗豆

搜史君
2026-06-30 13:45:10
会长权顺基,任上被查

会长权顺基,任上被查

扬子晚报
2026-07-03 12:42:12
就这还日乒最强+世界冠军?削球对决0-3完败 桥本内战已四连败

就这还日乒最强+世界冠军?削球对决0-3完败 桥本内战已四连败

颜小白的篮球梦
2026-07-03 06:09:50
自然界从没出现过丝袜,为啥男生天生会对丝袜如此着迷?

自然界从没出现过丝袜,为啥男生天生会对丝袜如此着迷?

向航说
2026-07-03 11:55:05
印媒高调宣称,印度空调制造商将帮欧洲降温,抢夺中国厂商的订单

印媒高调宣称,印度空调制造商将帮欧洲降温,抢夺中国厂商的订单

王新喜
2026-07-02 15:08:27
上午开国,下午谋反

上午开国,下午谋反

我是历史其实挺有趣
2026-07-02 14:22:50
地铁吐血女孩10天收7张病危通知单,被医生委婉劝说保守治疗,当事人:6月经历了很多挫折,面对死亡“有一点点害怕”

地铁吐血女孩10天收7张病危通知单,被医生委婉劝说保守治疗,当事人:6月经历了很多挫折,面对死亡“有一点点害怕”

极目新闻
2026-07-02 22:36:35
医生提醒:若长期一天只吃两顿饭,用不了半年,或患上这4种疾病

医生提醒:若长期一天只吃两顿饭,用不了半年,或患上这4种疾病

路医生健康科普
2026-06-29 12:05:03
“再降薪就没人踢了”,徐亮暴怒发声的原因出来了,范志毅说对了

“再降薪就没人踢了”,徐亮暴怒发声的原因出来了,范志毅说对了

娱说瑜悦
2026-06-17 13:53:07
曾是上海著名滑稽演员,妻子是我们熟悉的她,如今70岁靠商演谋生

曾是上海著名滑稽演员,妻子是我们熟悉的她,如今70岁靠商演谋生

胡一舸南游y
2026-07-02 14:58:35
人根本不用养老!看懂这个真相,余生少走十年弯路

人根本不用养老!看懂这个真相,余生少走十年弯路

椰青美食分享
2026-07-02 11:40:36
大陆7.1提出两岸统一,国民党回应致民进党坐不住了

大陆7.1提出两岸统一,国民党回应致民进党坐不住了

余塩搞笑段子
2026-07-01 19:07:31
中国已经成为全球第一个集体拒接电话的国家

中国已经成为全球第一个集体拒接电话的国家

黯泉
2026-06-26 10:44:35
8600 万!阿森纳锁定 21 岁世界杯天才,被誉为未来金球奖得主

8600 万!阿森纳锁定 21 岁世界杯天才,被誉为未来金球奖得主

澜归序
2026-07-03 04:57:17
中足联官宣重磅罚单!52岁于根伟禁赛5场罚5万 辱骂+率队围堵裁判

中足联官宣重磅罚单!52岁于根伟禁赛5场罚5万 辱骂+率队围堵裁判

我爱英超
2026-07-02 22:05:30
2026-07-03 13:40:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5637文章数 64622关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

齐达内儿子被梅西打穿后一度崩溃 淘汰赛又被灌进2球

头条要闻

齐达内儿子被梅西打穿后一度崩溃 淘汰赛又被灌进2球

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

黄晓明深夜约会美女,分手原因曝光

财经要闻

AI“鬼故事”不断,市场开始重估?

汽车要闻

极氪9X五座版官宣,如图!

态度原创

数码
亲子
本地
时尚
公开课

数码要闻

299元双8K旗舰款!雷神X7s Pro Max鼠标预售:全球首发PAW3955 Turbo

亲子要闻

这种情况如何破局?

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

盛夏,穿这三组配色呀!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版