网易首页 > 网易号 > 正文 申请入驻

字节跳动&清华大学开源多模态时序大模型,实现时序数据对话推理

0
分享至

该工作由字节跳动 ByteBrain 团队 × 清华大学合作完成。第一作者为清华大学三年级博士生谢哲,主要研究方向为时序多模态 LLM、异常检测和根因定位。第二作者和第三作者分别为李则言和何晓,均来自字节跳动。通讯作者分别为字节跳动研究科学家张铁赢和清华大学计算机系副教授裴丹。

近年来,多模态大语言模型(MLLM)发展迅速,并在图像、视频、音频等领域取得了突破性成果。然而,相较于这些研究较为成熟的模态,时间序列这一类型的数据与大模型结合的系统研究却较为匮乏。

尽管已经有 TimeLLM 等工作尝试将 LLM 应用于时序任务,但这些研究大多局限于预测类任务,无法满足更复杂的理解与推理需求。随着 LLM 在 AIOps、金融等需要处理时序数据的应用场景中应用愈发广泛,时序问答、推理的能力已成为多模态智能系统的一项基础能力需求。

为此,我们提出了 ChatTS,一种原生支持多变量时序问答与推理的多模态 LLM。ChatTS 引来了HuggingFace 产品负责人 Victor Mustar,以及 SparkNLP 项目负责人 Maziyar Panahi等人的转发和点赞:

ChatTS 论文已经成功入选数据库顶级会议 VLDB 2025。

  • 论文标题:ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning
  • 论文 arXiv 链接:https://arxiv.org/pdf/2412.03104
  • ChatTS 代码和数据集:https://github.com/NetmanAIOps/ChatTS
  • 模型参数:https://huggingface.co/bytedance-research/ChatTS-14B

什么是时序问答任务

传统的时间序列分析方法多基于统计模型或 AI 模型,而这些方法通常需要大量任务特定的训练、特定的数据预处理和结构化的输入输出,缺乏通用性和可解释性。而 LLM 的强语言建模能力和泛化推理能力,为「用自然语言理解时间序列」提供了可能。

然而,目前主流的 LLM 并不能直接处理原始的时间序列数组数据,现有工作要么将时间序列转成文本、图像输入,要么依赖 agent 工具进行间接分析,但都存在不同程度的限制。

因此,我们思考,是否可以构建一种「时间序列原生」的多模态 LLM,使其像处理图像一样,能够原生地理解时间序列的形状、波动与语义含义,并进行进一步的问答和推理

构建时间序列多模态大模型面临诸多挑战

  • 数据稀缺。与图文、语音等领域不同,时间序列+文本的对齐数据非常有限。
  • 时间序列具有高度结构性。时序包含丰富的趋势、周期、局部波动、噪声等形态特征。
  • 时间序列输入往往是多变量、不同长度的。变量之间的关系极具分析价值,但也加大了理解难度。
  • 现有的评估基准未覆盖时间序列多模态建模任务,这也为训练和评估增加了难度。

现有方法

我们将现有尝试将 LLM 应用于时间序列的方式归为三类:文本化方法、图像化方法与 agent 方法。

  • 文本化(Text-Based)方法最为直接,即将时间序列值编码成长文本输入 LLM。其可能存在显著的上下文长度限制,且无法处理多变量场景。
  • 图像化(Vision-Based)方法借助可视化图像输入视觉大模型,但面临图像细节丢失的问题。
  • Agent 方法(Agent-Based)利用 LLM 调用工具获取特征,但该方式严重依赖工具准确性、推理链条极长且容易出现幻觉。

ChatTS: 基于合成数据训练的时序多模态 LLM

面对时间序列与语言对齐数据的极度匮乏问题,我们从根本上摒弃了依赖真实数据标注的路径,而是选择「纯合成驱动」的方式,设计出一个端到端的数据生成、模型训练框架。

一、属性驱动(Attribute-Based)的时间序列生成

我们定义了一套详细的时间序列属性体系,这些属性具有明确的语义与参数,构成了「属性池」。每个时间序列由若干属性组合生成,并对应一段高质量自然语言描述。这种组合方式不仅确保了生成时间序列的多样性与真实性,还能精确对应语言文本的细节表达,避免了传统「图文描述不符」的问题。

二、Time Series Evol-Instruct

仅有静态属性描述还不够,我们还需训练模型掌握复杂的提问、比较与推理能力。我们提出 TSEvol,该方法以一组基础 Q&A 为种子,依托已有 attribute pools,不断演化出多种新问题形式,优化复杂推理场景下的模型能力。

三、原生多模态模型设计

模型结构方面,我们基于 Qwen2.5-14B-Instruct,设计了一个时间序列原生感知的输入结构。时间序列被切分为小 patch,并用轻量级 MLP 编码,嵌入到原始文本上下文中。

与之配套,我们设计了「数值保值归一化机制」。考虑到原始数值在实际业务中非常重要(如最大 CPU 使用率),我们在对序列进行 0-1 归一化时,同时将归一化参数以文本形式保留进 prompt,使模型既能学习序列形态,又不丢失绝对数值的意义。

ChatTS 案例展示

我们做了几个基于真实时间序列的 Case Studies。可以发现,ChatTS 不仅能对多变量时序的形态进行分析,还能输出时序中波动区间的位置与幅度。ChatTS 还能够对没有见过的时序波动模式进行识别,并基于自己的理解给它「起名字」。

此外,ChatTS 的使用场景非常灵活,无需精确的 prompt 输入也能准确响应。例如,我们让它分析时序中的所有「事件」,ChatTS 准确地 get 到了我们的意思,并自动提取出时序中的所有的异常波动。此外,ChatTS 还能实际应用结合,例如结合专家知识,对故障去进行初步的诊断和分析。

评估体系

我们一共收集了 3 个数据集用于评估,包含了 real-world 与合成的时序数据,评测集覆盖了对齐任务与推理任务两大类,共 12 子类的问题类型,以全面评估对比模型性能。

一、对齐任务评估:全方位精准识别时间序列属性

我们将 ChatTS 模型与基于 Text、Vision 和 Agent 的模型进行对比。结果显示,ChatTS 在所有指标上均大幅超越 GPT-4o 及其他基线方法,分类任务 F1 提升 46%–75%,数值任务相对准确率提升超过 80%。

在多变量任务上,ChatTS 优势更为显著:ChatTS 能一次性感知多个变量间的变化趋势与关系,且 token 成本极低,显示出极强的实用性与高效性。

二、推理任务评估:从归纳到因果,全面提升时序理解深度

推理任务包括四类:归纳、演绎、因果、比较。实验结果显示,ChatTS 在所有推理任务上均优于基线,平均提升 25.8%。

思考与展望

ChatTS 展示了一个全新的范式:通过可控合成数据,训练具备真实理解能力的多模态大模型。我们从零出发,仅使用合成数据训练出了一个在真实任务中表现优异的模型,这说明「数据生成 + 模态对齐」的范式具备高度潜力。

当前,ChatTS 聚焦在时序分析的理解与推理任务,未来我们可以拓展其能力至更高阶任务(例如因果推理、根因分析),甚至结合外部知识库、专家规则,实现更强的决策支持能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

南京男子回家迫不及待抱住妻子,结果家中鹦鹉一开口,让他崩溃!

白云故事
2025-03-14 19:05:07
TVB宣布拟改名!以后要叫你...

TVB宣布拟改名!以后要叫你...

东莞潮事儿
2026-03-26 12:32:15
杨振宁猝然离世5个月后,翁帆突传新消息,怀孕传闻早就真相大白

杨振宁猝然离世5个月后,翁帆突传新消息,怀孕传闻早就真相大白

李橑在北漂
2026-03-25 23:30:59
不法之徒村田晃大,正面照曝光

不法之徒村田晃大,正面照曝光

新京报
2026-03-26 11:18:17
福建省委决定,颜桂炀履新(附简历)

福建省委决定,颜桂炀履新(附简历)

人民资讯
2026-03-26 16:28:52
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

孤酒老巷QA
2026-03-25 20:19:35
巴拿马接到通知,赔款156亿还不够,中方扩大反制,港口管控升级

巴拿马接到通知,赔款156亿还不够,中方扩大反制,港口管控升级

小虎新车推荐员
2026-03-26 14:02:10
《逐玉》张凌赫被嘲“粉底液将军”,央视都看不下去了,发文力挺

《逐玉》张凌赫被嘲“粉底液将军”,央视都看不下去了,发文力挺

娱乐故事
2026-03-26 17:11:11
等了整整一年!iOS 26.4正式推送老机封神,国行遗憾背后!

等了整整一年!iOS 26.4正式推送老机封神,国行遗憾背后!

时尚的弄潮
2026-03-25 16:35:26
南京女教师停职风波反转!大批家长发声力挺,恳请恢复岗位与声誉

南京女教师停职风波反转!大批家长发声力挺,恳请恢复岗位与声誉

火山詩话
2026-03-26 06:37:23
风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

乐天闲聊
2026-03-26 03:40:35
这才是大国重器!中国正式摊牌,剑指800万亿宝藏,美欧噩梦成真

这才是大国重器!中国正式摊牌,剑指800万亿宝藏,美欧噩梦成真

丁丁鲤史纪
2026-03-26 18:11:10
外交部:美方及其盟友不要把集团对抗、冲突战乱引入亚太

外交部:美方及其盟友不要把集团对抗、冲突战乱引入亚太

新京报
2026-03-26 15:37:39
曝张雪峰3段婚姻都是闪婚,前妻缅怀满是惋惜,疯狂健身疑为备孕

曝张雪峰3段婚姻都是闪婚,前妻缅怀满是惋惜,疯狂健身疑为备孕

古希腊掌管松饼的神
2026-03-25 12:00:46
山东“老头乐”公司起诉小米汽车,当事企业称已和解

山东“老头乐”公司起诉小米汽车,当事企业称已和解

界面新闻
2026-03-26 16:30:03
广西壮族自治区党委组织部原分管日常工作的副部长崔佐钧被“双开”

广西壮族自治区党委组织部原分管日常工作的副部长崔佐钧被“双开”

界面新闻
2026-03-26 17:11:44
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
两大致命短板,一个悬疑谜题!央媒怒批王励勤,国乒王朝悬了?

两大致命短板,一个悬疑谜题!央媒怒批王励勤,国乒王朝悬了?

成吉思热
2026-03-26 10:06:14
央视直播乒乓球时间表:3月26日CCTV5+转播国乒!附国乒最新消息

央视直播乒乓球时间表:3月26日CCTV5+转播国乒!附国乒最新消息

米果说识
2026-03-26 14:47:03
2026-03-26 18:48:50
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12606文章数 142593关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
数码
时尚
本地
公开课

教育要闻

2026高考捡漏指南:西安藏着4所“就业王炸”院校,考生闭眼冲

数码要闻

苹果MacBook Neo将重塑整个笔电行业!分析师纷纷强调:打不过

皮衣+裙,高级到炸

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版