网易首页 > 网易号 > 正文 申请入驻

蚂蚁集团开源Ring-2.5-1T:首个混合线性架构万亿参数思考模型

0
分享至

IT之家 2 月 13 日消息,今日,蚂蚁集团百灵大模型发布并开源首个混合线性架构的万亿参数思考模型 ——Ring-2.5-1T

据介绍,作为迈向通用智能体时代的关键步骤,团队将混合线性注意力架构在预训练和强化学习上均进行了大规模扩展,一方面利用高效的1:7 MLA + Lightning Linear Attention 架构来提升模型的思考效率和探索空间,另一方面通过扩展强化学习和智能体环境规模来提升模型的思考深度和长程执行能力。

相比此前发布的 Ring-1T,Ring-2.5-1T 在生成效率、思考深度、长程执行上均有大幅提升:

  • 高效生成:得益于高比例的线性注意力机制,在超过 32K 生成长度下,访存规模降低 10 倍以上,成吞吐提升 3 倍以上,尤其适合深度思考和长程执行的任务。
  • 深度思考:在 RLVR 基础上引入 dense reward 来反馈思考过程的严谨性,使得 Ring-2.5-1T 同时实现 IMO 2025 和 CMO 2025 的金牌水平(自测)。
  • 长程执行:通过大规模 fully-async agentic RL训练,显著提升针对复杂任务的长程自主执行能力,使得 Ring-2.5-1T 可以轻松适配 Claude Code 等智能体编程框架和 OpenClaw 个人 AI 助理。


为评估 Ring-2.5-1T 的深度思考和长程执行能力,团队选取了具有代表性的开源思考模型(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)和闭源 API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)作为参考。

Ring-2.5-1T 在数学、代码、逻辑等高难推理任务(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)和智能体搜索、软件工程、工具调用等长程任务执行(Gaia2-search、Tau2-bench、SWE-Bench Verified)上均达到了开源领先水平

团队还额外测试了深度思考模式(heavy thinking mode),通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在 IMO 2025(满分 42 分)中,Ring-2.5-1T 获得 35 分,达到金牌水平;在 CMO 2025(满分 126 分)中取得 105 分,显著高于金牌线(78 分)及国家集训队入选线(87 分)。

此外,Ling 2.5 架构在 Ling 2.0 架构基础上引入了混合线性注意力架构。通过增量训练方式,将 Ling 2.0 架构的 GQA 升级为 1:7 的 MLA + Lightning Linear 结构。具体而言,团队基于此前发布的 Ring-flash-linear-2.0 技术路线,将部分 GQA 层改造为 Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩 KV Cache,将其余 GQA 层近似转换为 MLA ,并对其中的 QK Norm 、Partial RoPE 等特性进行了针对性适配,以增强Ling 2.5 架构在混合注意力架构下的表达能力。


改造后,Ring-2.5-1T 的激活参数量从 51B 提升至 63B。但在混合线性注意力架构的支持下,其推理效率相比 Ling 2.0 仍实现了大幅提升。即便与激活参数仅为 32B 的 KIMI K2 架构相比,1T 规模下的 Ling 2.5 架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显



不过,蚂蚁集团也提到,这一版本模型在 token efficiency 与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T 的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。

IT之家附地址如下:

Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScope:https://modelscope.cn/models/inclusionAI/Ring-2.5-1T

Ling Studio(https://ling.tbox.cn/chat)与 ZenMux(https://zenmux.ai/)的 Ring-2.5-1T Chat 体验页和 API 服务将在近期上线。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
80岁还扮嫩捞金?潘迎紫、赵雅芝穿古装商演,网友:说不出来的怪

80岁还扮嫩捞金?潘迎紫、赵雅芝穿古装商演,网友:说不出来的怪

削桐作琴
2026-04-07 15:14:18
国务院825号令正式落地!这些执法全被叫停,老百姓收好维权干货

国务院825号令正式落地!这些执法全被叫停,老百姓收好维权干货

混沌录
2026-04-07 17:59:04
伊朗发出最后通牒!俄通告全球将参战,法国上将:中估计也要到了

伊朗发出最后通牒!俄通告全球将参战,法国上将:中估计也要到了

观察者小海风
2026-04-07 16:07:23
A股,尾盘传来一个“重磅信号”,周三,或将迎来大变盘!

A股,尾盘传来一个“重磅信号”,周三,或将迎来大变盘!

夜深爱杂谈
2026-04-07 16:09:23
反对派对欧尔班釜底抽薪:上台后修改宪法,欧尔班无法再担任总理

反对派对欧尔班釜底抽薪:上台后修改宪法,欧尔班无法再担任总理

史行途
2026-04-07 03:42:49
34分狂胜,1分险胜!西部第一伪强队诞生,申京别高兴得太早

34分狂胜,1分险胜!西部第一伪强队诞生,申京别高兴得太早

世界体育圈
2026-04-07 20:23:34
三国臭名昭著的4个名人,结果被小说洗白,摇身一变成了正面人物

三国臭名昭著的4个名人,结果被小说洗白,摇身一变成了正面人物

铭记历史呀
2026-04-07 15:47:12
我们并没有用40年走完发达国家200年的路

我们并没有用40年走完发达国家200年的路

文青大叔说
2026-03-13 08:13:38
王楚钦孙颖莎夺冠不足24小时,日媒报道国乒有深意,重点提及一人

王楚钦孙颖莎夺冠不足24小时,日媒报道国乒有深意,重点提及一人

萌兰聊个球
2026-04-06 17:28:58
潘石屹再预言未来楼市,前两次已应验,今明两年或大概率也是对的

潘石屹再预言未来楼市,前两次已应验,今明两年或大概率也是对的

专业聊房君
2026-04-06 17:35:09
张雪母亲改嫁后成为作家!回应:张雪骑车撞人我赔3万 借给他55万

张雪母亲改嫁后成为作家!回应:张雪骑车撞人我赔3万 借给他55万

念洲
2026-04-07 09:37:27
国家动真格,严查国企历史遗留问题!下岗职工工龄社保统统重算

国家动真格,严查国企历史遗留问题!下岗职工工龄社保统统重算

陈博世财经
2026-04-06 14:27:33
伊朗这回开窍了!他们不炸军营,不炸核设施,专门炸这几个大工厂

伊朗这回开窍了!他们不炸军营,不炸核设施,专门炸这几个大工厂

鉴史录
2026-04-07 00:10:03
局势恶化,中方接到高市消息,日本专机将飞越南,对华包围圈成型

局势恶化,中方接到高市消息,日本专机将飞越南,对华包围圈成型

牛锅巴小钒
2026-04-07 17:43:10
李亚鹏含沙射影,官媒下场无缝衔接配合,陈光标遮羞布被撕得粉碎

李亚鹏含沙射影,官媒下场无缝衔接配合,陈光标遮羞布被撕得粉碎

潮鹿逐梦
2026-04-05 16:56:45
陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

一盅情怀
2026-04-07 16:21:17
刚刚,大轰炸!全线大跳水!特朗普威胁:“一个文明将彻底消亡"

刚刚,大轰炸!全线大跳水!特朗普威胁:“一个文明将彻底消亡"

中国基金报
2026-04-07 20:56:22
不装了,摊牌了!日本18岁新星承认,乒超练1年,顶在日本打10年

不装了,摊牌了!日本18岁新星承认,乒超练1年,顶在日本打10年

萌兰聊个球
2026-04-07 20:33:11
深圳一救护车违反调度指令,将患者拉至所属民营医院,家属称因延误抢救致死 涉事医院被处罚

深圳一救护车违反调度指令,将患者拉至所属民营医院,家属称因延误抢救致死 涉事医院被处罚

红星新闻
2026-04-07 13:56:02
2026-04-07 21:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
337851文章数 607117关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

美军拯救飞行员差一点失败 从40英里外用摄像头对准他

头条要闻

美军拯救飞行员差一点失败 从40英里外用摄像头对准他

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

本地
旅游
房产
公开课
军事航空

本地新闻

跟着歌声游安徽,听古村回响

旅游要闻

上游观察|两天春假,却让孩子拥抱了整个春天

房产要闻

重磅!三亚拟出安居房新政!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军营救飞行员出动155架飞机

无障碍浏览 进入关怀版