网易首页 > 网易号 > 正文 申请入驻

业界首个!蚂蚁开源万亿参数混合线性思考模型,IMO金牌水平

0
分享至


智东西
作者 程茜
编辑 李水青

智东西2月13日消息,今天,蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T

根据官方信息,相比蚂蚁2025年10月发布的万亿级思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和长时程任务执行能力三个关键维度上实现提升,且在长文本生成、数学推理与智能体任务执行上达到开源领先水平。

在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低至1/10,生成吞吐提升3倍以上。

在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平,IMO为35分、CMO为105分。


目前,该模型已经适配Claude Code等智能体框架与OpenClaw个人AI助理,支持多步规划与工具调用。

Ring-2.5-1T的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布,官方平台Chat体验页和API服务将在近期上线。

Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScape:https://modelscope.cn/organization/inclusionAI

一、拿下多项开源SOTA,达IMO金牌水平

为了评估Ring-2.5-1T的深度思考与长时任务执行能力,蚂蚁研究人员选择了具有代表性的开源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作为比较。

蚂蚁集团公布的多项权威基准测试结果显示,Ring-2.5-1T在数学、编程和逻辑推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高难度推理任务以及Agent搜索、工具调用和软件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等长时任务执行方面均实现了最先进的开源性能。

此外,蚂蚁还对深度思考(Heavy Thinking)模式下的模型性能进行了额外测试,Ring-2.5-1T在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型。

其中,在IMO 2025(满分42分)中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025(满分126分)中,该模型获得105分,超过金牌分数线78分和国家队集训队选拔线87分。

研究人员比较了Ring-2.5-1T和Ring-1T的答案发现,前者在推理逻辑的严谨性、高级数学证明技术的应用以及答案表述的完整性方面均有提升。

智能体搜索任务Gaia2-search中,Ring-2.5-1T在开源模型中取得了SOTA性能。Gaia2环境强调跨应用工具协作和复杂任务执行能力,Ring-2.5-1T在规划生成和多步工具调用方面均展现出较高的效率和准确性。

二、三大关键维度提升,能快速适配Claude Code、OpenClaw

相比蚂蚁2025年10月发布的万亿级思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和长时程任务执行能力三个关键维度上有显著改进。

首先在生成效率方面,通过采用高比例线性注意力机制,Ring-2.5-1T将内存访问开销降低至1/10,并将超过32K token序列的生成吞吐量提高了3倍以上,适用于深度思考和长时程任务执行。

其次在深度思考层面,该模型在RLVR(基于可验证奖励的强化学习)基础上引入密集奖励机制,为推理过程提供严格性反馈,使Ring-2.5-1T同时达到IMO 2025和CMO 2025(自测)的金奖水平。

最后是长程任务执行,Ring-2.5-1T通过大规模完全异步智能体RL(强化学习)训练,增强了解决复杂任务的长时程自主执行能力,使其能快速适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

三、引入混合线性注意力架构,可提升长程推理场景吞吐量

Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,可提升长文本推理的效率与稳定性。

作为实现自主模型架构的关键进展,Ling 2.5架构在Ling 2.0架构的基础上引入了一种混合线性注意力架构。通过增量训练,研究人员将Ling 2.0架构中的GQA(分组查询注意力)升级为MLA(多头线性注意力)+Lightning Linear结构的1:7比例。

具体来说,基于其先前发布的Ring-flash-linear-2.0技术路线图,研究人员将部分GQA层转换为Lightning Linear注意力,以提升长时程推理场景中的吞吐量。

同时为了进一步压缩KV缓存,研究人员将剩余的GQA层近似转换为MLA,同时针对QK Norm(查询-核归一化)和Partial RoPE(部分旋转位置编码)等特征进行针对性改进,从而增强Ling 2.5架构的表达能力。


在此基础上,模型激活参数规模从前代的51B提升至63B,并且在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现大幅提升。

与仅具备32B激活参数的Kimi K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现优势显著,且随着生成长度增加,效率优势持续扩大。


▲在一台配备8块H20-3e GPU的机器上,批处理大小=64,比较不同生成长度下的解码吞吐量


▲在一台配备8块H200 GPU的机器上,批处理大小=64,比较不同生成长度下的解码吞吐量

结语:从短对话到复杂规划,大模型需突破长文本瓶颈

随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T可以缓解模型在长输出场景下计算开销高、推理速度慢的问题。

此前,传统架构在面对超长文本、多模态内容、复杂业务流程时,普遍面临算力成本高、响应延迟大、部署难度高等问题,蚂蚁百灵团队此次通过底层架构创新,或为行业提供一条兼顾性能、成本与扩展性的技术路径。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李在明手段果然狠辣,当着5000万韩国人的面,宣告尹锡悦最终结局

李在明手段果然狠辣,当着5000万韩国人的面,宣告尹锡悦最终结局

东极妙严
2026-02-12 17:45:44
周薪19万镑!曝马奎尔降薪续约曼联,拒绝加盟意甲,或重返国家队

周薪19万镑!曝马奎尔降薪续约曼联,拒绝加盟意甲,或重返国家队

夏侯看英超
2026-02-14 00:44:54
成都年货市场挤爆了:排队2小时,商家24小时营业,快递直接蹲门口收件

成都年货市场挤爆了:排队2小时,商家24小时营业,快递直接蹲门口收件

红星新闻
2026-02-13 21:26:09
太狂了! 30岁女星捧4.3亿现金无贷款买下豪宅财力震撼全网

太狂了! 30岁女星捧4.3亿现金无贷款买下豪宅财力震撼全网

邢育森
2026-02-11 11:02:42
商务部:希望荷方相向而行,为双方企业协商建设性解决内部纠纷创造有利条件

商务部:希望荷方相向而行,为双方企业协商建设性解决内部纠纷创造有利条件

财闻
2026-02-13 20:59:39
闫学晶风波彻底炸锅!不到24小时中戏两位领导自首 一堆明星被牵扯

闫学晶风波彻底炸锅!不到24小时中戏两位领导自首 一堆明星被牵扯

喜欢历史的阿繁
2026-02-14 01:02:55
中国的优势!哈佛教授:不要高估中国,因为美或许已控制其命脉

中国的优势!哈佛教授:不要高估中国,因为美或许已控制其命脉

舆图看世界
2026-02-06 09:30:03
电动车或将淘汰,替代品已出现,不充电不怕冷,续航超过100公里

电动车或将淘汰,替代品已出现,不充电不怕冷,续航超过100公里

小怪吃美食
2026-02-13 16:02:11
琼斯社媒发文!未收到好的报价,正在保持训练,承诺承担更多责任

琼斯社媒发文!未收到好的报价,正在保持训练,承诺承担更多责任

篮球资讯达人
2026-02-13 21:03:42
看蒋万安给儿子们起的名字,就知道他骨子里的中国人身份,藏不住

看蒋万安给儿子们起的名字,就知道他骨子里的中国人身份,藏不住

来科点谱
2026-02-12 07:19:46
26岁全身溃烂不治而亡,被全家8口吸血多年

26岁全身溃烂不治而亡,被全家8口吸血多年

仙味少女心
2026-01-31 23:14:30
赶超北上广房价,让欧美女孩上瘾的“中国神器”,在海外卖出80亿

赶超北上广房价,让欧美女孩上瘾的“中国神器”,在海外卖出80亿

毒sir财经
2026-02-09 22:22:49
41岁"舅妈"火遍全国!央媒揭开15年无人问津真相,郭京飞早已看穿

41岁"舅妈"火遍全国!央媒揭开15年无人问津真相,郭京飞早已看穿

白面书誏
2025-12-30 16:19:03
林孝埈没想到,孙龙夺银不到12小时,刘少昂凭一特殊举动口碑暴涨

林孝埈没想到,孙龙夺银不到12小时,刘少昂凭一特殊举动口碑暴涨

生活新鲜市
2026-02-14 01:12:48
舆论逆转!国际奥委会撤销处罚,赫拉斯克维奇留驻2026奥运赛场

舆论逆转!国际奥委会撤销处罚,赫拉斯克维奇留驻2026奥运赛场

老马拉车莫少装
2026-02-13 00:00:36
“台湾代表处”更名?立陶宛新政府理性纠偏,抛弃民进党当局

“台湾代表处”更名?立陶宛新政府理性纠偏,抛弃民进党当局

海峡导报社
2026-02-13 00:18:01
婆婆每年除夕夜都要大哭一场、前年哭走大姐20万去年哭走二姐36万

婆婆每年除夕夜都要大哭一场、前年哭走大姐20万去年哭走二姐36万

小影的娱乐
2026-02-14 03:50:52
72岁“唐僧”开始卖房!和陈丽华33年感情成笑话,百亿财产成空?

72岁“唐僧”开始卖房!和陈丽华33年感情成笑话,百亿财产成空?

草莓解说体育
2026-02-10 20:01:01
清华教授蒋国兵:移民加拿大刷油漆半年赚5千,宁愿自杀也不回国

清华教授蒋国兵:移民加拿大刷油漆半年赚5千,宁愿自杀也不回国

青梅侃史啊
2026-02-13 22:02:22
判了,无期!敛财3.8亿,伪装了7年的励志网红,最终还是露馅了

判了,无期!敛财3.8亿,伪装了7年的励志网红,最终还是露馅了

蜉蝣说
2025-10-21 09:19:12
2026-02-14 05:35:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11231文章数 116971关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

大衣哥女儿风光出嫁,农村婚礼超朴素

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

教育
健康
旅游
游戏
艺术

教育要闻

教育家精神万里行|姜竹亭:无声育桃李 大爱启芳华

转头就晕的耳石症,能开车上班吗?

旅游要闻

土耳其自驾行记(八)地中海边的慢时光——卡什小镇

癫疯之坐!今年年夜饭批准坐在黄金马桶上吃

艺术要闻

砸25亿,中原第一高楼绿地造,坐标郑州!

无障碍浏览 进入关怀版