网易首页 > 网易号 > 正文 申请入驻

可处理上万变量,攻克高维时序预测难题!华人团队开源模型、基准

0
分享至


新智元报道

编辑:LRST

【新智元导读】华人团队开源新模型U-Cast,像「放大镜+过滤器」一样,从上万条时间序列里秒抓关键层级,预测更快更准;同步发布十领域真实大数据集Time-HD,供全球研究者免费练手,推动高维时序预测进入「ImageNet时刻」。

从金融市场的上千支股票,到智慧城市交通网络的上万个传感器,我们正全面进入一个由高维时间序列数据驱动的时代。

然而,当前主流的时间序列预测(TSF)模型,大多仍停留在仅包含几个或几百个变量的低维环境中进行评估(Table 1)。


当面对成千上万个变量构成的高维复杂系统时(Time-HD),则往往在效率与性能上表现出明显的局限性。

此外,大规模数据集已被证明是多个研究领域取得突破的关键支撑

例如,CV中的ImageNet、MS COCO,NLP中的GLUE、SQuAD,以及Graph中的OGB,都在推动相应领域的发展中发挥了决定性作用。

然而,在时序预测领域,始终缺乏同类的大规模基准,这使得研究进展受到制约。

进一步地,高维环境才能真正释放通道依赖型模型的价值

而在现有的低维数据集上,通道依赖型(Channel-Dependent, CD)模型相较通道独立型(Channel-Independent, CI)模型并未表现出稳定且显著的优势。

这一现象容易引发怀疑,即显式建模通道间关系是否真的有效?

之前有研究提出是维度数量本身限制了CD方法潜在优势的发挥。



通过理论分析(Theorem 1 and 2),他们证明了在高维环境下,当存在非冗余变量时,CD模型的贝叶斯风险(Bayes risk)始终低于CI模型,且这一优势会随着维度增加而不断扩大。

在此基础上,合成数据和真实数据的实验进一步验证了这一结论。

当数据维度变高时,即变量从几百个飙升到上万个时,时序预测会面临两个挑战:

  1. 复杂的层级结构:在大规模系统中,变量之间往往呈现出隐含的层级关系(例如,金融市场中从板块到行业再到具体公司的层次)。现有模型大多无法有效捕捉这种多尺度关联 。

  2. 效率与扩展性瓶颈:传统的依赖通道间交互的模型,在面对上千个变量时,其计算成本和内存消耗会呈指数级增长,变得不切实际。

埃默里大学的华人研究团队近期提出了全新的高维时序预测架构U-Cast,通过层级式潜查询网络高效建模多尺度依赖关系,并结合满秩正则化提升特征解耦能力,在预测精度与效率上均超越现有方法。

为了系统评估模型性能,研究团队同时发布了高维时序预测基准Time-HD,为未来相关研究提供了统一且可扩展的实验基准。


论文链接:https://arxiv.org/pdf/2507.15119

代码链接:https://github.com/UnifiedTSAI/Time-HD-Lib

这项研究强调了两个亟需突破的方向:设计更强大的CD模型,以及构建真正意义上的高维时序预测基准。

U-Cast

高效洞察层级奥秘


为应对上述两大挑战,研究者提出了U-Cast架构,其核心设计包括以下关键组件:

层级式潜查询网络(Hierarchical LatentQueryNetwork):U-Cast不再依赖在所有变量间进行全局注意力计算的传统方式,而是引入一小组可学习的「潜查询」(latent queries)。

这些潜查询如同信息提取器,能够逐层从高维变量中筛选并压缩关键信息,从而高效建构数据的潜在层级结构,实现对复杂多尺度依赖关系的建模。

Channel Embedding


给定输入多条时间序列,T是时序输入长度,先通过Linear层获取其相应的embedding , C代表channel数量(即维度),d代表embedding dimension。

Hierarchical Latent Query Network


每一层都用一个latent query(可学习)作为query与embedding做attention来达到降维()的目的。

Hierarchical Upsampling Network


使用skip connection作为query参与attention来指导维度重建,可以在保留原有信息的基础上增加层次结构信息。

Output Projection


最后使用Linear层将d映射到时序预测长度S

全秩正则化(Full-Rank Regularization)

高维时间序列普遍存在冗余性,导致模型容易陷入学习重复或低效表示。

为此,U-Cast在训练过程中引入一种新颖的正则化目标,以约束表示空间保持更高秩的多样性。

该机制能够有效减少通道间冗余信息,促使模型学习到更加独立且结构化的特征表示,从而提升预测的精度与稳健性。


这里

优化目标(Overall Objective)


最终同时优化ground truth loss和研究者提出的Full-Rank Regularization loss

Time-HD

为高维预测设立新基准


为了验证U-Cast的性能并推动社区发展,研究团队构建了Time-HD——首个专为高维时间序列预测设计的大规模基准,具有以下特性:

高维多尺度16个数据集,变量数从1161到20000,规模包括4个GB级、8个百MB级和4个十MB级,支持分布式和单卡训练。

领域广泛涵盖神经科学、能源、交通、金融、流行病学、云计算、气象、社会行为等10个领域。

来源多样同时包含合成与真实数据。Neurolib与SIRS基于微分方程模拟,适合科学建模与假设检验;其余为真实观测数据,用于检验模型在实际场景的泛化能力。

采样多频覆盖毫秒、分钟、小时和天级采样,并采用频率相关预测步长,更贴近真实应用。

实验效果


精度领先在16个数据集里,U-Cast在12个数据集的MSE指标上排名第一。与iTransformer相比,平均预测误差降低了15%



效率出众U-Cast不仅预测得更准,还更快、更省资源。如下图所示,在达到最低预测误差(MSE)的同时,U-Cast的训练速度(12ms/iter)和显存占用(0.2GB)远低于表现相近的iTransformer(20.8ms, 2.8GB)等模型。

消融实验验证了每个模块对U-Cast的影响,消融掉任何一个模块都会降低U-Cast的表现。


满秩约束到底是否有效?

上图展示了变量的协方差矩阵从随机初始化状态(Epoch 0)到较优收敛状态(Epoch 10)的演化过程。

随着训练迭代,协方差矩阵的结构发生了显著变化,由稠密逐渐转向稀疏。这表明满秩约束能够通过减少通道间的冗余,有效促进表示的解耦。

总结

研究人员通过提出U-Cast模型与发布Time-HD基准,为高维时间序列预测设立了新的标杆:

提供了性能卓越、效率优越的基线模型;

为研究社区探索更大规模、更真实场景的时序预测开辟了新方向。

随着配套代码库Time-HD-Lib的开源,未来高维时序预测研究有望迎来新一轮创新浪潮,助力时序预测迈向高维。

参考资料:

https://arxiv.org/pdf/2507.15119

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哪些弦外之音是你多年后才醒悟的?网友:好多都没听出来,没眼力

哪些弦外之音是你多年后才醒悟的?网友:好多都没听出来,没眼力

带你感受人间冷暖
2025-11-05 00:05:16
湖南李天仇为父报仇,玩弄仇人妻子10年,复仇一夜屠尽13口家人

湖南李天仇为父报仇,玩弄仇人妻子10年,复仇一夜屠尽13口家人

纸鸢奇谭
2024-08-17 14:22:37
“大哥”承诺每月给1万元养家费,要求小弟把事都扛了!入狱后小弟崩溃:我被耍了……

“大哥”承诺每月给1万元养家费,要求小弟把事都扛了!入狱后小弟崩溃:我被耍了……

方圆
2025-11-04 15:38:28
乐视创始人欠122亿巨债跑美七年,400多名老员工让乐视起死回生。

乐视创始人欠122亿巨债跑美七年,400多名老员工让乐视起死回生。

百态人间
2025-11-05 05:35:03
柬埔寨“太子集团”资产又遭冻结:涉26辆豪车、11处豪华公寓等,总值超35亿元

柬埔寨“太子集团”资产又遭冻结:涉26辆豪车、11处豪华公寓等,总值超35亿元

极目新闻
2025-11-05 15:06:20
SGA30+12雷霆半场发力击溃快船,豪取开季8连胜,哈登25+6+6

SGA30+12雷霆半场发力击溃快船,豪取开季8连胜,哈登25+6+6

湖人崛起
2025-11-05 14:33:04
比亚迪和华为的难题,比想象中更糟

比亚迪和华为的难题,比想象中更糟

大佬灼见
2025-11-04 12:59:33
突发!亚太股市,全线大跌!韩国紧急“拔网线”!发生了什么?

突发!亚太股市,全线大跌!韩国紧急“拔网线”!发生了什么?

证券时报e公司
2025-11-05 09:50:13
慕了!清一色的ETF,女方的嫁妆清单...

慕了!清一色的ETF,女方的嫁妆清单...

金石随笔
2025-11-05 00:09:15
高市早苗搭讪澳大利亚总理,让日本网友破防了:这是妈妈桑!

高市早苗搭讪澳大利亚总理,让日本网友破防了:这是妈妈桑!

行者聊官
2025-11-04 12:54:50
宁夏内蒙多地夜空现不明飞行物,目击者称发绿光且速度极快,专家:可能是一颗流星体

宁夏内蒙多地夜空现不明飞行物,目击者称发绿光且速度极快,专家:可能是一颗流星体

极目新闻
2025-11-05 15:06:20
当深圳00后也来抄底:内地客赴港买房,十年砸下8000亿

当深圳00后也来抄底:内地客赴港买房,十年砸下8000亿

南方都市报
2025-11-05 13:54:46
涉嫌严重违纪违法,罗云庆任上被查

涉嫌严重违纪违法,罗云庆任上被查

上观新闻
2025-11-05 06:46:03
男子被警方扣押1000万元,无罪后申诉要求返还 当地公安局:严格按照判决执行,有异议可申诉

男子被警方扣押1000万元,无罪后申诉要求返还 当地公安局:严格按照判决执行,有异议可申诉

红星新闻
2025-11-04 21:58:11
京东1号车下线,价格或低于10万,刘强东开出百万年薪抢人

京东1号车下线,价格或低于10万,刘强东开出百万年薪抢人

21世纪经济报道
2025-11-05 13:58:37
全球首发!刚刚中国开启了无限能源的时代

全球首发!刚刚中国开启了无限能源的时代

一个坏土豆
2025-11-04 20:10:26
爸爸去哪儿6个孩子现状:有人进国家队,有人出家,有人出国断联

爸爸去哪儿6个孩子现状:有人进国家队,有人出家,有人出国断联

观察鉴娱
2025-11-04 09:35:35
神舟二十号飞船推迟返回:地球轨道上对航天器构成潜在威胁的空间碎片估计超100万个,中国空间站曾多次主动实施空间碎片规避

神舟二十号飞船推迟返回:地球轨道上对航天器构成潜在威胁的空间碎片估计超100万个,中国空间站曾多次主动实施空间碎片规避

极目新闻
2025-11-05 11:11:12
赵鸿刚回应被KO后伤情,每天吃止痛药才能睡着,鸽武缘发声将出战

赵鸿刚回应被KO后伤情,每天吃止痛药才能睡着,鸽武缘发声将出战

小海娱计
2025-11-04 16:18:23
TVB资深演员林尚武昨日因病离世,享年75岁,曾演出94年版《射雕英雄传》的丘处机被大众所喜爱

TVB资深演员林尚武昨日因病离世,享年75岁,曾演出94年版《射雕英雄传》的丘处机被大众所喜爱

极目新闻
2025-11-05 11:53:54
2025-11-05 15:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13789文章数 66237关注度
往期回顾 全部

科技要闻

马斯克万亿美元薪酬投票在即,大股东反对

头条要闻

牛弹琴:美国上演极致"流氓外交" 让西方媒体目瞪口呆

头条要闻

牛弹琴:美国上演极致"流氓外交" 让西方媒体目瞪口呆

体育要闻

开拓者的11号签,变成了灰熊未来核心?

娱乐要闻

王家卫事件再次升级,可怜了这些明星

财经要闻

中方官宣!对美关税,调整!

汽车要闻

首家"A+H"豪华新能源车企 赛力斯登陆港交所主板

态度原创

亲子
时尚
旅游
本地
公开课

亲子要闻

从备孕到临产的全周期指南:2025年科学孕育的25个关键细节

2025羽绒服8大流行趋势,温暖时髦过冬天!

旅游要闻

马耳他旅游会奖局荣膺Cvent欧洲卓越奖

本地新闻

秋颜悦色 | 在榆中,秋天是一场盛大的视觉交响

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版