网易首页 > 网易号 > 正文 申请入驻

蚂蚁集团开源万亿思考模型 Ring-2.5-1T,打破大模型“不可能三角”

0
分享至

来源:市场资讯

(来源:观察者网)

(文/陈济深 编辑/张广凯)

长期以来,深度思考模型一直面临一个尴尬的“不可能三角”:想要推理逻辑严密,就得忍受龟速的解码速度和爆炸式的显存开销。

为了绕开这个难题,目前业界主流路径多采用 MoE(混合专家模型)架构,通过只激活部分参数来节省算力,诸多头部模型如以DeepSeek、Kimi、MiniMax均采用了这种架构。

如今,这个行业魔咒被蚂蚁集团找到了解法。

2月13日,蚂蚁集团正式开源了全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T。该模型同时做到了三件过去被认为难以兼得的事:推理速度快、深度思考强、长程任务执行能力突出。


在评测中,Ring-2.5-1T在数学竞赛中拿到IMO金牌级别的35分(满分42),在CMO拿到105分远超国家集训队分数线,同时在32K以上长文本生成场景中将访存规模降至上一代的1/10,生成吞吐量提升超3倍。使得其在搜索、编码这些复杂任务上都能独当一面。

如何又快又好?

Ring-2.5-1T的速度优势来自其底层架构的根本性创新。它基于Ling 2.5架构,采用了混合线性注意力机制——具体来说,是以1:7的比例混搭MLA(多头潜在注意力)和Lightning Linear Attention两种注意力模块。

这一设计源自蚂蚁此前发布的Ring-flash-linear-2.0技术路线。

研发团队通过增量训练的方式,将原有架构中的GQA(分组查询注意力)层分别转化为Lightning Linear Attention和MLA:前者在长程推理中负责拉满吞吐量,后者则极致压缩KV Cache。为防止模型表达能力因架构改造而受损,团队还特别适配了QK Norm和Partial RoPE等特性。

经过这番改造,Ring-2.5-1T的激活参数量从上一代的51B提升至63B,但凭借线性时间复杂度的特性,其推理效率反而大幅提升。

与同为1T参数量级但仅有32B激活参数的Kimi K2架构相比,Ling 2.5架构在长序列推理任务中的吞吐优势十分显著,且随着生成长度增加,效率优势持续扩大。


这意味着长程推理不再是“烧钱又烧显卡”的重资产操作,而变成了一种可以规模化部署的轻量级方案。从“做题家”到“实战派”跑得快只是一面,逻辑够不够硬才是深度思考模型的真正门槛。在思维训练层面,Ring-2.5-1T在RLVR(基于可验证奖励的强化学习)基础上引入了密集奖励机制。不同于只看最终答案对不对的传统方式,这套机制会逐步考察推理过程中每一个环节的严谨性,让模型在逻辑漏洞和高阶证明技巧上都获得了显著提升。

在此基础上,团队还引入了大规模全异步Agentic RL训练,大幅增强了模型在搜索、编码等长链条任务上的自主执行能力。这让Ring-2.5-1T从单纯的数学证明高手,进化为能在复杂实战场景中独当一面的智能体。

蚂蚁研究团队将Ring-2.5-1T与开源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking以及闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等进行了对比。

结果显示,Ring-2.5-1T在IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench等高难度推理任务,以及Gaia2-search、Tau2-bench、SWE-Bench Verified等长时任务执行基准上,均达到了开源最优水平。在Heavy Thinking模式下,Ring-2.5-1T更是在多项数学竞赛和代码生成基准中超越了所有对比模型,包括上述闭源API。


尤其值得一提的是,在IMO 2025(满分42分)中Ring-2.5-1T拿到35分达到金牌水平,在CMO 2025(满分126分)中获得105分,大幅超过金牌线78分和国家集训队选拔线87分。与上一代Ring-1T相比,新模型在推理逻辑的严谨性、高级证明技巧的运用和答案表述的完整性上都有明显进步。生态适配与开源落地Ring-2.5-1T已经适配Claude Code和OpenClaw等主流智能体框架,支持多步规划与工具调用。模型权重与推理代码已在Hugging Face、ModelScope等平台同步开放,官方Chat体验页和API服务也将在近期上线。

除Ring-2.5-1T外,蚂蚁集团同期还发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。前者采用非自回归并行解码技术,推理速度达到535 tokens/s,在HumanEval+编程任务上甚至达到892 tokens/s,还具备独特的Token编辑与逆向推理能力;后者则在视觉、音频、文本的统一表征与生成上实现了突破,打通了多模态的感知与创作能力,支持实时感官交互。

蚂蚁inclusionAI团队的目标很明确:将这些能力做成可复用的底座方案,为开发者提供统一的能力入口。据悉,后续团队还将继续在视频时序理解、复杂图像编辑和长音频实时生成等方向持续发力,推动全模态技术的规模化落地。

随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景延伸,深度思考模型面临的效率瓶颈愈发突出。Ring-2.5-1T通过底层架构的重构,给出了一条兼顾性能、成本与扩展性的技术路径。

当“又快又好又深”不再是不可能三角,深度思考模型的应用边界也将随之打开。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中美外长达成共识,鲁比奥或得到“豁免”,全球方向正在发生变化

中美外长达成共识,鲁比奥或得到“豁免”,全球方向正在发生变化

东极妙严
2026-02-14 18:03:06
美国兵推曝光:中国击沉4艘美航母后,美国或将对京沪进行核打击

美国兵推曝光:中国击沉4艘美航母后,美国或将对京沪进行核打击

纪中百大事
2026-02-14 16:40:09
全家都觉得赚了!21岁的孙子寒假“打工”照顾97岁的奶奶 5元1小时 1天封顶50元

全家都觉得赚了!21岁的孙子寒假“打工”照顾97岁的奶奶 5元1小时 1天封顶50元

闪电新闻
2026-02-14 10:50:57
国际贵金属价格大幅下跌

国际贵金属价格大幅下跌

中国能源网
2026-02-14 10:44:03
冬奥会惊天冷门!21岁美国头号夺冠热门自由滑3跳空+2摔 仅获第8

冬奥会惊天冷门!21岁美国头号夺冠热门自由滑3跳空+2摔 仅获第8

念洲
2026-02-14 06:50:32
央视曝光黄金回收套路:不良商家在足金涂抹洗洁精等让其变黑而压价

央视曝光黄金回收套路:不良商家在足金涂抹洗洁精等让其变黑而压价

每日经济新闻
2026-02-14 21:01:20
台积电突然变卦!3纳米芯片落地日本,这招比稀土断供更致命

台积电突然变卦!3纳米芯片落地日本,这招比稀土断供更致命

粤语音乐喷泉
2026-02-14 20:06:03
你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

夜深爱杂谈
2026-02-01 18:57:04
字节跳动Seedance2.0,收到“地表最强法务部”的律师函

字节跳动Seedance2.0,收到“地表最强法务部”的律师函

本原财经
2026-02-14 13:11:32
夫妻开小炒店8年还清债务 今年“挺直腰杆”回老家过年

夫妻开小炒店8年还清债务 今年“挺直腰杆”回老家过年

红星新闻
2026-02-14 15:41:10
不到四十年,世界就已经大变样

不到四十年,世界就已经大变样

日本物语
2026-02-13 20:31:23
谷爱凌为中国夺牌后,让人恶心的一幕出现了!国际雪联被迫道歉

谷爱凌为中国夺牌后,让人恶心的一幕出现了!国际雪联被迫道歉

十点街球体育
2026-02-14 22:50:51
5个月用AI做了120多个App,职高毕业的小伙在杭州上城开“一人公司” 火到了海外

5个月用AI做了120多个App,职高毕业的小伙在杭州上城开“一人公司” 火到了海外

都市快报橙柿互动
2026-02-13 12:48:31
超市里很多速冻水饺为何价格那么低?因为馅主料不是肉,而是大豆蛋白

超市里很多速冻水饺为何价格那么低?因为馅主料不是肉,而是大豆蛋白

爆角追踪
2026-02-14 22:27:44
暴跌61%,缩水154亿美元!昔日世界第一新能源车企,真卖不动了?

暴跌61%,缩水154亿美元!昔日世界第一新能源车企,真卖不动了?

百科密码
2026-02-12 15:12:02
“我变成阴阳人了!”女子遭健身教练哄骗,半年注射1次类固醇,下体长男性特征、声带变粗

“我变成阴阳人了!”女子遭健身教练哄骗,半年注射1次类固醇,下体长男性特征、声带变粗

观威海
2026-02-14 17:02:11
2026香港富豪榜出炉:霍家排不上号,刘銮雄仅第7,李嘉诚不意外

2026香港富豪榜出炉:霍家排不上号,刘銮雄仅第7,李嘉诚不意外

离离言几许
2026-02-14 11:02:11
受权发布|中华人民共和国国务院令  第831号

受权发布|中华人民共和国国务院令  第831号

新华社
2026-02-14 17:02:05
今年大批校长要落马!

今年大批校长要落马!

行者殷涛
2026-02-13 16:21:19
现场直击慕安会 专家解读:王毅演讲极具针对性

现场直击慕安会 专家解读:王毅演讲极具针对性

看看新闻Knews
2026-02-14 19:56:04
2026-02-15 00:04:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2220860文章数 5476关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

福州街头发现一流浪老人身份成谜 程序员精准破解方言

头条要闻

福州街头发现一流浪老人身份成谜 程序员精准破解方言

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

时尚
健康
旅游
本地
游戏

推广中奖名单-更新至2026年2月3日推广

转头就晕的耳石症,能开车上班吗?

旅游要闻

这个春节不必远走,来芦芽山感受不一样的年味!

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

《零 ~红蝶~ REMAKE》试玩报告:和无名野鬼大战二十回合"/> 主站 商城 论坛 自运营 登录 注册 《零 ~红蝶~ REMAKE》试玩报告:和无...

无障碍浏览 进入关怀版