网易首页 > 网易号 > 正文 申请入驻

蚂蚁集团开源Ring-2.5-1T:首个混合线性架构万亿参数思考模型

0
分享至

IT之家 2 月 13 日消息,今日,蚂蚁集团百灵大模型发布并开源首个混合线性架构的万亿参数思考模型 ——Ring-2.5-1T

据介绍,作为迈向通用智能体时代的关键步骤,团队将混合线性注意力架构在预训练和强化学习上均进行了大规模扩展,一方面利用高效的1:7 MLA + Lightning Linear Attention 架构来提升模型的思考效率和探索空间,另一方面通过扩展强化学习和智能体环境规模来提升模型的思考深度和长程执行能力。

相比此前发布的 Ring-1T,Ring-2.5-1T 在生成效率、思考深度、长程执行上均有大幅提升:

  • 高效生成:得益于高比例的线性注意力机制,在超过 32K 生成长度下,访存规模降低 10 倍以上,成吞吐提升 3 倍以上,尤其适合深度思考和长程执行的任务。
  • 深度思考:在 RLVR 基础上引入 dense reward 来反馈思考过程的严谨性,使得 Ring-2.5-1T 同时实现 IMO 2025 和 CMO 2025 的金牌水平(自测)。
  • 长程执行:通过大规模 fully-async agentic RL训练,显著提升针对复杂任务的长程自主执行能力,使得 Ring-2.5-1T 可以轻松适配 Claude Code 等智能体编程框架和 OpenClaw 个人 AI 助理。


为评估 Ring-2.5-1T 的深度思考和长程执行能力,团队选取了具有代表性的开源思考模型(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)和闭源 API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)作为参考。

Ring-2.5-1T 在数学、代码、逻辑等高难推理任务(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)和智能体搜索、软件工程、工具调用等长程任务执行(Gaia2-search、Tau2-bench、SWE-Bench Verified)上均达到了开源领先水平

团队还额外测试了深度思考模式(heavy thinking mode),通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在 IMO 2025(满分 42 分)中,Ring-2.5-1T 获得 35 分,达到金牌水平;在 CMO 2025(满分 126 分)中取得 105 分,显著高于金牌线(78 分)及国家集训队入选线(87 分)。

此外,Ling 2.5 架构在 Ling 2.0 架构基础上引入了混合线性注意力架构。通过增量训练方式,将 Ling 2.0 架构的 GQA 升级为 1:7 的 MLA + Lightning Linear 结构。具体而言,团队基于此前发布的 Ring-flash-linear-2.0 技术路线,将部分 GQA 层改造为 Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩 KV Cache,将其余 GQA 层近似转换为 MLA ,并对其中的 QK Norm 、Partial RoPE 等特性进行了针对性适配,以增强Ling 2.5 架构在混合注意力架构下的表达能力。


改造后,Ring-2.5-1T 的激活参数量从 51B 提升至 63B。但在混合线性注意力架构的支持下,其推理效率相比 Ling 2.0 仍实现了大幅提升。即便与激活参数仅为 32B 的 KIMI K2 架构相比,1T 规模下的 Ling 2.5 架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显



不过,蚂蚁集团也提到,这一版本模型在 token efficiency 与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T 的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。

IT之家附地址如下:

Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScope:https://modelscope.cn/models/inclusionAI/Ring-2.5-1T

Ling Studio(https://ling.tbox.cn/chat)与 ZenMux(https://zenmux.ai/)的 Ring-2.5-1T Chat 体验页和 API 服务将在近期上线。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
考拉悄然长大,钟丽缇小女儿颜值惊艳,眉眼间尽是妈妈的绝世美貌

考拉悄然长大,钟丽缇小女儿颜值惊艳,眉眼间尽是妈妈的绝世美貌

庭小娱
2026-04-05 17:47:28
广东今日早报!再创CBA纪录,新大外浮出水面,萨林杰休战一周

广东今日早报!再创CBA纪录,新大外浮出水面,萨林杰休战一周

林子说事
2026-04-07 17:14:17
王菲穿两千块夹克和俞飞鸿聚餐,标志性丸子头随性又时髦

王菲穿两千块夹克和俞飞鸿聚餐,标志性丸子头随性又时髦

去山野间追风
2026-04-05 10:25:21
古力娜扎“真空”上阵:是彻底放飞,还是被资本架着走?

古力娜扎“真空”上阵:是彻底放飞,还是被资本架着走?

手工制作阿歼
2026-04-07 17:03:15
康克清告诉采访人员,当年和主席住得近,没少管主席和江青的家事

康克清告诉采访人员,当年和主席住得近,没少管主席和江青的家事

凉州辞
2026-04-07 20:50:03
原来他是赵心童好兄弟,如今英国四川两头跑,主播妻子年轻又漂亮

原来他是赵心童好兄弟,如今英国四川两头跑,主播妻子年轻又漂亮

翰飞观事
2026-04-07 14:42:55
陈丽华公司曝离世内幕,对迟重瑞称呼暴露关系,生前的话字字催泪

陈丽华公司曝离世内幕,对迟重瑞称呼暴露关系,生前的话字字催泪

蓝色海边
2026-04-07 22:21:19
一空姐机上被打,航司霸气出面:打我家空姐,拉入黑名单

一空姐机上被打,航司霸气出面:打我家空姐,拉入黑名单

中国民航人
2026-04-06 18:10:42
霍思燕带狗泰国夺冠!肥肚三层、发际线好假,女儿出镜像女版杜江

霍思燕带狗泰国夺冠!肥肚三层、发际线好假,女儿出镜像女版杜江

每一次点击
2026-04-07 12:01:22
崩得最彻底的专业,连985毕业生都哭诉:越努力越不幸!

崩得最彻底的专业,连985毕业生都哭诉:越努力越不幸!

黯泉
2026-04-05 20:49:28
武汉地铁上座率低,原因引发关注!

武汉地铁上座率低,原因引发关注!

湖心点评
2026-04-07 08:48:05
联合国警告特朗普政府:若袭击伊朗民用设施 或构成战争罪

联合国警告特朗普政府:若袭击伊朗民用设施 或构成战争罪

新京报
2026-04-07 20:17:06
中央官宣,基本养老金调整有望,去年2%,今年能与去年持平吗?

中央官宣,基本养老金调整有望,去年2%,今年能与去年持平吗?

孤城落叶
2026-04-06 21:42:03
国务院824号令:2026殡葬新规,逝者24小时内需办5事

国务院824号令:2026殡葬新规,逝者24小时内需办5事

探索新高度
2026-04-06 18:09:25
别不信!每月工资能够达到“这个数”,你已经超过95%的人了!

别不信!每月工资能够达到“这个数”,你已经超过95%的人了!

CG说科技
2026-04-07 17:56:07
凉透了的专业,顶级硕士也在网络哭诉:月薪4500!

凉透了的专业,顶级硕士也在网络哭诉:月薪4500!

黯泉
2026-04-07 22:03:00
你不在家时,猫咪的一天都是怎么过的?

你不在家时,猫咪的一天都是怎么过的?

猫研所
2026-04-07 16:36:58
伊朗、沙特 石化设施遭袭 油价直线飙升 美油涨破116美元

伊朗、沙特 石化设施遭袭 油价直线飙升 美油涨破116美元

每日经济新闻
2026-04-07 13:41:19
王宝强和女友开京牌大G到青岛,冯清人高马大,衬得宝强像小娇夫

王宝强和女友开京牌大G到青岛,冯清人高马大,衬得宝强像小娇夫

八怪娱
2026-04-07 15:02:12
研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

研究表明:男性嫖娼率6.4%,女性出轨率15%,且越有钱越开放!

黯泉
2026-04-01 17:28:39
2026-04-08 00:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
337906文章数 607117关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

特朗普恐吓4小时摧毁伊朗 伊朗称"打穿"海法未见拦截

头条要闻

特朗普恐吓4小时摧毁伊朗 伊朗称"打穿"海法未见拦截

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

旅游
亲子
本地
游戏
公开课

旅游要闻

三天迎客超四万人次,TOP中央公园成清明假期市民“微度假”热门地

亲子要闻

春天娃长个黄金期,喝对黑豆水,个子悄悄往上窜

本地新闻

跟着歌声游安徽,听古村回响

叫得越凶分越高!Steam"狗叫模拟器"5月1日抢先体验

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版