网易首页 > 网易号 > 正文 申请入驻

精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA

0
分享至

新智元报道

编辑:LRST

【新智元导读】TimeDistill通过知识蒸馏,将复杂模型(如Transformer和CNN)的预测能力迁移到轻量级的MLP模型中,专注于提取多尺度和多周期模式,显著提升MLP的预测精度,同时保持高效计算能力,为时序预测提供了一种高效且精准的解决方案。

如何在保证预测精度的同时降低计算成本,是时序预测应用面临的核心挑战。

传统的时序预测模型(如基于Transformer或CNN的复杂结构)虽在精度上表现卓越,但计算开销往往难以满足实际部署需求。而轻量级MLP(多层感知器)虽然具备较高的推理速度,却常因建模能力不足,导致预测精度较低。

这引出了一个有趣的问题:是否可以将MLP与其他先进架构(如Transformer和CNN)结合,以构建一个既强大又高效的模型?

一个直觉的解决方案是知识蒸馏(Knowledge Distillation),通过将更大、更复杂的模型(教师模型)的知识迁移到较小、更简单的模型(学生模型),使其在提升性能的同时实现更高的计算效率。

近期,来自美国埃默里大学、澳大利亚格里菲斯大学等多地的华人科研团队联合提出了一种跨架构知识蒸馏(Cross-Architecture Knowledge Distillation)框架TimeDistill,将MLP作为学生模型,其他复杂先进架构(如Transformer和CNN)作为教师模型,通过蒸馏复杂模型的优势至轻量级模型,实现计算负担大幅降低的同时显著提升预测精度。

相比于教师模型,TimeDistill加快了最多7倍推理速度,降低了最多130倍参数量,同时TimeDistill还在多个数据集上展现了超越教师模型的SOTA表现,为构建高效、高精度的时序预测模型提供了全新思路。

论文链接:https://arxiv.org/pdf/2502.15016

通过蒸馏,TimeDistill在多个数据集上取得超越教师模型的预测精度并实现了最佳的效率平衡。

TimeDistill模型方法

设计思路

首先,研究人员对MLP与其他时序模型的预测模式进行了对比分析。

研究发现,尽管MLP的整体预测精度较低,但往往在某一部分样本上表现出色,突显了其与教师模型之间存在一定的优势互补,强调了通过知识蒸馏向教师模型的学习互补知识的重要性。

为了进一步探索需要蒸馏的时序「知识」,研究人员聚焦于两个关键的时序模式:

  • 时间域的多尺度模式(Multi-Scale Pattern):真实世界的时序数据通常在多个时间尺度上呈现不同的变化。可以观察到,在最细粒度时间尺度上表现良好的模型通常在较粗粒度上也能保持较高的准确性,而MLP在大多数尺度上均表现不佳。

  • 频率域的多周期模式(Multi-Period Pattern):时序数据往往存在多个周期性,性能较好的模型能够捕捉到与真实数据接近的周期性特征,而MLP无法有效识别这些周期性结构。

因此,为了增强MLP的时序预测能力,从教师模型中蒸馏并整合多尺度和多周期模式至关重要。

跨架构知识蒸馏(Cross-Architecture Distillation)

对于任意教师模型,TimeDistill均能有效提炼其在时序预测中的多种模式,并将其压缩进轻量学生模型(例如MLP),使后者具备更强的预测能力。

其中即学生模型的预测,即学生模型的中间特征,S即预测长度,D即中间特征维度,C即变量数量。下标为t即代表教师模型。

多尺度、多周期特征的系统性提炼

多尺度蒸馏(Multi-Scale Distillation):在不同的时间分辨率上分别下采样教师模型与学生模型的预测和中间特征,确保学生模型同时捕捉粗粒度的整体趋势与细粒度的瞬时变化。

多周期蒸馏(Multi-Period Distillation):通过傅里叶变换(FFT)分析频域信息,将教师模型在周期性模式上的优势提炼并传递给学生模型,使后者在应对长周期波动(如季节、年度周期)与短周期干扰(如日内流量峰谷变化)时,都能维持稳定高精度。

由于FFT得到的频谱往往包含很多低频噪声,研究人员通过低温蒸馏使得频率(周期)分布更加锋利,使得学生模型可以直接学习最显著的频率(周期)分量。

理论解释

从理论上,研究人员将多尺度和多周期蒸馏损失诠释为一种数据增强策略,类似于分类任务中的标签平滑(Label Smoothing)。

蒸馏过程实际上等同于将教师模型的预测结果与真实标签进行混合,类似生成了经过Mixup变换的增广样本,这种数据增强带来了以下三个益处:增强泛化,显式融合多种模式,稳定训练,为TimeDistill的优异表现提供了理论支撑。

实验效果

效果全面领先

TimeDistill在8个时序数据集上进行实验,其中7个数据集的MSE指标优于基线教师模型,在所有数据集的MAE指标上均取得最佳表现,展现出卓越的预测能力。

兼容多种教师模型

TimeDistill适用于多种教师模型,能够有效蒸馏知识并提升MLP学生模型的性能,同时相较教师模型本身也有显著提升。

兼容多种学生模型

TimeDistill不仅适用于MLP结构,还可以增强轻量级学生模型的性能。例如,在以ModernTCN作为教师模型的实验中,TimeDistill使两个轻量模型TSMixer和LightTS的MSE分别降低6.26%和8.02%,验证了其在不同学生模型上的适应性。

兼容多种回溯窗口长度

时序模型的预测性能往往随回溯窗口(历史观测长度)变化而波动,而TimeDistill在所有窗口长度下均能提升MLP表现,甚至超越教师模型,体现出对不同时间依赖模式的强大适应能力。

消融实验

TimeDistill通过消融实验进一步验证了模型设计的合理性。值得注意的是,即使去掉Ground Truth监督信号(w/o sup),TimeDistill仍然能够显著提升MLP预测精度,表明其可以从教师模型中有效学习到丰富的知识。

总结

TimeDistill的提出,标志着时序预测领域正在向更高效、更通用的方向发展。它不仅展示了轻量级模型在蒸馏复杂模型知识后所能达到的卓越性能,还为学术界和工业界提供了新的思考方向:

如何在计算成本、模型规模与预测精度之间找到最优平衡?

如何通过知识蒸馏让轻量模型超越其原有能力上限?

未来,期待更多研究机构与企业推动TimeDistill在金融、能源、流量预测等领域的广泛应用,为数据驱动时代的时序分析注入新的动力。

参考资料:

https://arxiv.org/pdf/2502.15016

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
狗咬人命案中申倩才是高手,她一个决定让9人闯宅者追悔莫及,讽刺

狗咬人命案中申倩才是高手,她一个决定让9人闯宅者追悔莫及,讽刺

七月生活情感驿站
2025-11-17 14:09:02
取消日韩学历,这不是在报复日本

取消日韩学历,这不是在报复日本

林中木白
2025-11-17 14:59:29
多地发文!立即解散约车群、拼车群,否则追究群主法律责任!

多地发文!立即解散约车群、拼车群,否则追究群主法律责任!

网约车焦点
2025-11-17 12:00:54
“窗帘藏酒”真相再调查 原是服务员找来空箱装喝过的酒瓶 酒店表示:员工配合调查的时间算出勤

“窗帘藏酒”真相再调查 原是服务员找来空箱装喝过的酒瓶 酒店表示:员工配合调查的时间算出勤

扬子晚报
2025-11-17 22:06:24
宝马X4才跑一年多,四条轮胎均出现龟裂 4S店:经检测存在老化,非轮胎品质问题

宝马X4才跑一年多,四条轮胎均出现龟裂 4S店:经检测存在老化,非轮胎品质问题

大风新闻
2025-11-17 18:00:05
乌军能否守住红军城?不能!

乌军能否守住红军城?不能!

史政先锋
2025-11-17 16:09:20
拔出萝卜带出泥!王曼昱战胜孙颖莎夺冠才发现她和樊振东同病相怜

拔出萝卜带出泥!王曼昱战胜孙颖莎夺冠才发现她和樊振东同病相怜

阿纂看事
2025-11-17 09:01:23
香港演员林雪否认赌博负债百亿,本人回应:我没有欠钱,我大把钱;此前谣言称他输光家产,连夜驾车跑路离开香港

香港演员林雪否认赌博负债百亿,本人回应:我没有欠钱,我大把钱;此前谣言称他输光家产,连夜驾车跑路离开香港

极目新闻
2025-11-17 07:39:47
单项第4金+总第5金!全运会男子1500米自由泳:张展硕再夺一冠

单项第4金+总第5金!全运会男子1500米自由泳:张展硕再夺一冠

全景体育V
2025-11-17 19:46:08
最新:捷克志愿者48小时为乌克兰筹足“火烈鸟”导弹资金!

最新:捷克志愿者48小时为乌克兰筹足“火烈鸟”导弹资金!

项鹏飞
2025-11-17 20:09:14
霍尊复出,亮相音乐节连唱9首歌曲;4年前宣布退圈:我的错,我来扛

霍尊复出,亮相音乐节连唱9首歌曲;4年前宣布退圈:我的错,我来扛

台州交通广播
2025-11-17 11:39:46
东部战区重磅发声:若一去不回!

东部战区重磅发声:若一去不回!

吉刻新闻
2025-11-17 16:27:31
日媒通告全球:如果若中日开战,中国人会抢着当先锋

日媒通告全球:如果若中日开战,中国人会抢着当先锋

一个有灵魂的作者
2025-11-16 11:54:30
即刻宣告,若日本军舰再穿越台海,将被视作侵略行径,予以击沉

即刻宣告,若日本军舰再穿越台海,将被视作侵略行径,予以击沉

我心纵横天地间
2025-11-17 11:13:11
又走了一家外企

又走了一家外企

曹多鱼的财经世界
2025-11-17 15:03:31
荒诞!雷军再遭小米产品反噬:40米潜水手表,小字免责又引火烧身

荒诞!雷军再遭小米产品反噬:40米潜水手表,小字免责又引火烧身

娜乌和西卡
2025-11-17 16:22:27
乌克兰隐身导弹无人机惊艳首秀,俄罗斯国内大规模断网

乌克兰隐身导弹无人机惊艳首秀,俄罗斯国内大规模断网

史政先锋
2025-11-17 20:53:35
54岁杨钰莹近况曝光:定居深圳,每天打理菜园子,生活平淡

54岁杨钰莹近况曝光:定居深圳,每天打理菜园子,生活平淡

小徐讲八卦
2025-11-17 07:29:28
11秒10!16岁小孩姐称霸女子100米+破亚洲青年纪录 北大学霸排第5

11秒10!16岁小孩姐称霸女子100米+破亚洲青年纪录 北大学霸排第5

风过乡
2025-11-17 21:35:34
女子为10件毛衣从法国飞回国维权:不是钱的事,就为一口气!

女子为10件毛衣从法国飞回国维权:不是钱的事,就为一口气!

潇湘晨报
2025-11-17 15:07:31
2025-11-18 01:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13890文章数 66259关注度
往期回顾 全部

科技要闻

京东外卖要“独立” 刘强东还宣战“点评”

头条要闻

韩国向日本表示强烈抗议 中方表态

头条要闻

韩国向日本表示强烈抗议 中方表态

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

旅游
健康
本地
家居
数码

旅游要闻

三亚发布“四张清单” 全场景守护旅游旺季玩海安全

血液科专家揭秘白血病七大误区

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

家居要闻

回廊通道 强化空间秩序

数码要闻

OPPO Reno15系列发布:2999元起 2亿像素超清主摄

无障碍浏览 进入关怀版