网易首页 > 网易号 > 正文 申请入驻

ICLR 2026|PMDformer:尺度是否正在「偷偷绑架」注意力?一个简单减法实现长时序...

0
分享至

来源:市场资讯


西南财经大学在读硕士、上智院实习生胡澳,是本文第一作者,其主要研究方向为多变量长时序预测;西南财经大学教授、成都恒图科技创始人段江,为共同第一作者。西南财经大学副教授温良剑,上智院 AI 科学家、复旦大学教授徐增林,为本文通讯作者。

长期时间序列预测(Long-term Time Series Forecasting, LTSF)是能源管理、金融市场和交通预测等领域的核心任务。现有基于 Patch 的 Transformer 模型面临一个根本性挑战:非平稳时序数据中,Patch 之间的尺度差异会严重干扰注意力机制对形状相似性的捕捉,导致模型学习到错误的相关关系,预测精度受限。

为此,西南财经大学、上海科学智能研究院(下称上智院)、复旦大学、成都恒图科技等机构最新联合提出 PMDformer—— 一种基于 Patch 均值解耦(PMD)的创新时序预测框架。通过三大核心模块的协同设计,它在多项权威基准上全面超越现有最优方法。


  • 论文地址:https://openreview.net/forum?id=rfJ41gK9Ct

  • 代码地址:https://github.com/aohu1105/PMDformer

目前,该成果已被 ICLR 2026 接收。

现有方法的痛点:尺度差异如何「扭曲」形状建模?

长期时序预测中,研究者常用 Patch 分割策略来捕捉长序列中的局部语义,但时序数据的非平稳性带来显著挑战 —— 同一序列在不同时段的数值尺度差异悬殊。这一特性带来了两个关键问题:

  • 尺度偏差遮蔽形状相似性:注意力权重受 Patch 均值影响,导致形状相似但尺度不同的 Patch 被错误地判为不相关,而形状迥异的 Patch 反而获得高注意力权重。模型捕捉到的并非真正的模式,而是由尺度「幻觉」造成的误导。如论文图 1 所示,P1 与 P2 形状高度相似,但在解耦前,P1 与 P3 的注意力权重反而更高。

  • 跨变量依赖建模失准:变量间的相关性随时间演变,历史早期的相关关系对预测近期走势的参考价值有限,但现有模型通常在全局历史窗口上计算变量交互,引入大量噪声,容易过拟合。


图 1:PMD 解耦前后的注意力权重对比。上:原始序列中,尺度差异导致注意力偏向 P3;下:均值解耦后,注意力正确反映形状相似性

PMDformer:三位一体的解决方案

PMDformer 由三个协同工作的核心模块组成,分别解决上述不同层面的问题,形成完整的技术闭环。


图 2:PMDformer 整体架构图

一、Patch 均值解耦(PMD):还原形状本质

PMD 的核心操作简洁而高效:对每个 Patch 减去其时间均值,将原始 Patch 分解为长期趋势(均值)和残差形状两部分。与现有 Normalization 方法不同,PMD 仅做均值减法,完整保留了 Patch 内部的振幅变化和形状结构。

二、近邻变量注意力(PVA):聚焦最相关的跨变量依赖

PVA 模块基于一个直觉洞察:预测目标序列时,变量间在最近时间段的交互关系最具参考价值。因此,PVA 将跨变量的自注意力计算严格限制在最近一个 Patch(第 N 个 Patch)的时序词元(Tokens)上,而非全局历史序列。

这一设计带来双重优势:

  • 一是捕捉最相关的近期跨变量形状相似性,避免早期弱相关或虚假相关对预测的干扰;

  • 二是将计算复杂度从 O (C²N) 降低至 O (C²),显著提升计算效率。

三、趋势恢复注意力(TRA):兼顾形状与趋势

PMD 在提升形状相似性建模的同时,客观上削弱了长期趋势信号。TRA 模块专门针对此问题设计:在注意力计算中,Query/Key 通道仅使用形状嵌入(确保注意力分数反映形状相似性),而 Value 通道则通过加法注入 PMD 分离出的 Patch 均值(趋势信息)。

这种分离式设计使模型能够同时编码局部形状模式和全局趋势动态,输出更稳定的预测结果。

实验结果:在 8 个权威基准上全面领先

研究团队在 8 个广泛使用的真实世界数据集上进行了系统评估,涵盖电力、天气、能源、交通等多个应用领域。与 8 个最新基线方法的比较表明,PMDformer 在 7/8 个数据集上取得最低 MSE 和 MAE,展现出稳定且全面的性能优势。


表 1:长时间序列预测任务结果对比。包含 8 个数据集、4 个预测长度(96/192/336/720 步)、MSE 与 MAE 双指标的完整对比数据

计算效率:以更少资源实现更高性能

PMDformer 在计算效率方面同样表现突出。在变量数量从 100 增至 3000、以及序列长度从 144 增至 5400 的两组扩展实验中,PMDformer 相比 PatchTST、iTransformer、ModernTCN 均需要更少的 GPU 显存。这一优势源于 PVA 模块将跨变量注意力复杂度从 O (C²N) 压缩至 O (C²),在高维多变量场景下尤为显著。


图 3:计算效率对比:不同变量数量(左)与不同序列长度(右)下,各模型 GPU 显存占用对比

总结与展望

PMDformer 的成功揭示了时序预测领域一个长期被忽视但至关重要的问题:Patch 的均值(趋势)与残差(形状)耦合在一起,会系统性地损害注意力机制对形状相似性的建模能力。

通过一个简洁的均值减法操作,配合精心设计的趋势恢复机制和近邻变量注意力,PMDformer 在不增加模型复杂度的前提下,全面提升了预测精度与计算效率。

接下来,研究团队计划将 PMDformer 扩展至更高维度的多变量时序数据建模,并探索与多模态数据(如文本、图像)的融合应用,为能源、金融、交通等领域的智能预测持续提供新动力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈丽华百亿遗产分配引热议,曾透露会给孩子留,未提及迟重瑞

陈丽华百亿遗产分配引热议,曾透露会给孩子留,未提及迟重瑞

扒虾侃娱
2026-04-07 16:10:24
欧冠1/4决赛最贵阵容:姆巴佩、亚马尔领衔,巴萨4人皇马3人

欧冠1/4决赛最贵阵容:姆巴佩、亚马尔领衔,巴萨4人皇马3人

懂球帝
2026-04-07 23:14:18
这四种生肖的人,若是不改正这些缺点,必将轮回畜生道

这四种生肖的人,若是不改正这些缺点,必将轮回畜生道

屏儿爱读书
2025-02-17 13:37:23
中国央行连续17个月增持黄金,黄金大买家逆势抛售,高盛:金价有望冲击6100美元

中国央行连续17个月增持黄金,黄金大买家逆势抛售,高盛:金价有望冲击6100美元

21世纪经济报道
2026-04-07 16:43:55
10天飙涨100%!A股7连板牛股遭爆炒,公司紧急公告

10天飙涨100%!A股7连板牛股遭爆炒,公司紧急公告

21世纪经济报道
2026-04-07 23:47:58
61岁男子,坚持饿肚子不吃晚饭,6个月之后,血糖和体重情况如何

61岁男子,坚持饿肚子不吃晚饭,6个月之后,血糖和体重情况如何

蜉蝣说
2026-02-03 15:04:01
刘嘉玲日本度假被偶遇,打扮随意发福明显皮肤松弛像普通大妈

刘嘉玲日本度假被偶遇,打扮随意发福明显皮肤松弛像普通大妈

嘴角上翘的弧度
2026-04-05 03:42:20
王楚钦夺冠不到24小时,坏消息来袭!世界乒联公布,国乒仅存2人

王楚钦夺冠不到24小时,坏消息来袭!世界乒联公布,国乒仅存2人

宝哥精彩赛事
2026-04-07 07:22:29
为什么没人联合打以色列,答案很简单:不是没人想打,是没人敢打

为什么没人联合打以色列,答案很简单:不是没人想打,是没人敢打

墨印斋
2026-04-07 13:47:02
4月开始,中国可能出现四大涨潮:除了油价外,这3类也会上调了

4月开始,中国可能出现四大涨潮:除了油价外,这3类也会上调了

小怪吃美食
2026-04-07 16:19:48
研究报告:中国成为东盟与中日韩区域生产网络主要枢纽

研究报告:中国成为东盟与中日韩区域生产网络主要枢纽

人民网
2026-04-07 06:52:12
已经穷到别人炫富都看不出来了!网友:知道的豪车就是宝马奔驰

已经穷到别人炫富都看不出来了!网友:知道的豪车就是宝马奔驰

夜深爱杂谈
2026-03-22 21:48:32
特朗普,最新发声!霍尔木兹海峡,突传大消息!加密货币跳水,超8万人爆仓!

特朗普,最新发声!霍尔木兹海峡,突传大消息!加密货币跳水,超8万人爆仓!

证券时报e公司
2026-04-05 21:41:10
别再穿大一码了!遮肉根本不是靠宽松

别再穿大一码了!遮肉根本不是靠宽松

Yuki女人故事
2026-04-04 00:05:15
统“独”两派机场冲突,统派要求郑丽文谈统一,洗刷中华民族羞辱

统“独”两派机场冲突,统派要求郑丽文谈统一,洗刷中华民族羞辱

共工之锚
2026-04-08 00:16:12
一销售帮男子摇中“贵A·A88888”顶级“豹子号”车牌,两人激动到当场大喊,网友直呼:黄金右手

一销售帮男子摇中“贵A·A88888”顶级“豹子号”车牌,两人激动到当场大喊,网友直呼:黄金右手

感觉会火
2026-04-02 08:06:49
官媒为张雪鸣不平!他赢了全世界,却要栽在关系户这?

官媒为张雪鸣不平!他赢了全世界,却要栽在关系户这?

娱乐故事
2026-04-06 20:01:36
马杜罗被捕后暴瘦13公斤

马杜罗被捕后暴瘦13公斤

烽火观天下
2026-04-07 12:34:13
迟重瑞为陈丽华光头36年,竟是因妻子儿子一句话:您光头特别富态

迟重瑞为陈丽华光头36年,竟是因妻子儿子一句话:您光头特别富态

观鱼听雨
2026-04-07 18:58:33
中国不记隔夜仇!巴拿马接到通知,美国终于下场,巴政府自食恶果

中国不记隔夜仇!巴拿马接到通知,美国终于下场,巴政府自食恶果

书纪文谭
2026-04-06 23:14:24
2026-04-08 02:20:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2781188文章数 6479关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

白宫:美伊谈判进展“只有总统知道实际情况”

头条要闻

白宫:美伊谈判进展“只有总统知道实际情况”

体育要闻

拉门斯:我读过写科比、詹姆斯&乔丹等人的书,学习他们的心态

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

艺术
家居
旅游
本地
公开课

艺术要闻

深圳最惨地王复活?70亿起拍,曾规划中国第一高楼!

家居要闻

雅致惬意 感知生活之美

旅游要闻

以花为媒以赛引流 泰安清明迎客83.64万人次

本地新闻

跟着歌声游安徽,听古村回响

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版