网易首页 > 网易号 > 正文 申请入驻

蚂蚁集团开源万亿思考模型 Ring-2.5-1T,打破大模型“不可能三角”

0
分享至

来源:市场资讯

(来源:观察者网)

(文/陈济深 编辑/张广凯)

长期以来,深度思考模型一直面临一个尴尬的“不可能三角”:想要推理逻辑严密,就得忍受龟速的解码速度和爆炸式的显存开销。

为了绕开这个难题,目前业界主流路径多采用 MoE(混合专家模型)架构,通过只激活部分参数来节省算力,诸多头部模型如以DeepSeek、Kimi、MiniMax均采用了这种架构。

如今,这个行业魔咒被蚂蚁集团找到了解法。

2月13日,蚂蚁集团正式开源了全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T。该模型同时做到了三件过去被认为难以兼得的事:推理速度快、深度思考强、长程任务执行能力突出。


在评测中,Ring-2.5-1T在数学竞赛中拿到IMO金牌级别的35分(满分42),在CMO拿到105分远超国家集训队分数线,同时在32K以上长文本生成场景中将访存规模降至上一代的1/10,生成吞吐量提升超3倍。使得其在搜索、编码这些复杂任务上都能独当一面。

如何又快又好?

Ring-2.5-1T的速度优势来自其底层架构的根本性创新。它基于Ling 2.5架构,采用了混合线性注意力机制——具体来说,是以1:7的比例混搭MLA(多头潜在注意力)和Lightning Linear Attention两种注意力模块。

这一设计源自蚂蚁此前发布的Ring-flash-linear-2.0技术路线。

研发团队通过增量训练的方式,将原有架构中的GQA(分组查询注意力)层分别转化为Lightning Linear Attention和MLA:前者在长程推理中负责拉满吞吐量,后者则极致压缩KV Cache。为防止模型表达能力因架构改造而受损,团队还特别适配了QK Norm和Partial RoPE等特性。

经过这番改造,Ring-2.5-1T的激活参数量从上一代的51B提升至63B,但凭借线性时间复杂度的特性,其推理效率反而大幅提升。

与同为1T参数量级但仅有32B激活参数的Kimi K2架构相比,Ling 2.5架构在长序列推理任务中的吞吐优势十分显著,且随着生成长度增加,效率优势持续扩大。


这意味着长程推理不再是“烧钱又烧显卡”的重资产操作,而变成了一种可以规模化部署的轻量级方案。从“做题家”到“实战派”跑得快只是一面,逻辑够不够硬才是深度思考模型的真正门槛。在思维训练层面,Ring-2.5-1T在RLVR(基于可验证奖励的强化学习)基础上引入了密集奖励机制。不同于只看最终答案对不对的传统方式,这套机制会逐步考察推理过程中每一个环节的严谨性,让模型在逻辑漏洞和高阶证明技巧上都获得了显著提升。

在此基础上,团队还引入了大规模全异步Agentic RL训练,大幅增强了模型在搜索、编码等长链条任务上的自主执行能力。这让Ring-2.5-1T从单纯的数学证明高手,进化为能在复杂实战场景中独当一面的智能体。

蚂蚁研究团队将Ring-2.5-1T与开源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking以及闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等进行了对比。

结果显示,Ring-2.5-1T在IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench等高难度推理任务,以及Gaia2-search、Tau2-bench、SWE-Bench Verified等长时任务执行基准上,均达到了开源最优水平。在Heavy Thinking模式下,Ring-2.5-1T更是在多项数学竞赛和代码生成基准中超越了所有对比模型,包括上述闭源API。


尤其值得一提的是,在IMO 2025(满分42分)中Ring-2.5-1T拿到35分达到金牌水平,在CMO 2025(满分126分)中获得105分,大幅超过金牌线78分和国家集训队选拔线87分。与上一代Ring-1T相比,新模型在推理逻辑的严谨性、高级证明技巧的运用和答案表述的完整性上都有明显进步。生态适配与开源落地Ring-2.5-1T已经适配Claude Code和OpenClaw等主流智能体框架,支持多步规划与工具调用。模型权重与推理代码已在Hugging Face、ModelScope等平台同步开放,官方Chat体验页和API服务也将在近期上线。

除Ring-2.5-1T外,蚂蚁集团同期还发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。前者采用非自回归并行解码技术,推理速度达到535 tokens/s,在HumanEval+编程任务上甚至达到892 tokens/s,还具备独特的Token编辑与逆向推理能力;后者则在视觉、音频、文本的统一表征与生成上实现了突破,打通了多模态的感知与创作能力,支持实时感官交互。

蚂蚁inclusionAI团队的目标很明确:将这些能力做成可复用的底座方案,为开发者提供统一的能力入口。据悉,后续团队还将继续在视频时序理解、复杂图像编辑和长音频实时生成等方向持续发力,推动全模态技术的规模化落地。

随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景延伸,深度思考模型面临的效率瓶颈愈发突出。Ring-2.5-1T通过底层架构的重构,给出了一条兼顾性能、成本与扩展性的技术路径。

当“又快又好又深”不再是不可能三角,深度思考模型的应用边界也将随之打开。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南永州发生一起交通事故,一辆重型半挂牵引车与一辆小车相撞,致3死3伤

湖南永州发生一起交通事故,一辆重型半挂牵引车与一辆小车相撞,致3死3伤

台州交通广播
2026-04-06 17:40:32
美“最大胆搜救”代价惨烈!损失飞机价值超4亿美元

美“最大胆搜救”代价惨烈!损失飞机价值超4亿美元

看看新闻Knews
2026-04-06 00:12:24
4月起,私家车后备箱新规实施,这3样东西千万别放,查到直接重罚

4月起,私家车后备箱新规实施,这3样东西千万别放,查到直接重罚

复转这些年
2026-04-05 17:43:48
79岁男性聋哑老人买两千多元塑身内衣,穿后难以呼吸,家属:商家说内衣可治病,要求退一赔三;门店:没宣传过排毒治病功效

79岁男性聋哑老人买两千多元塑身内衣,穿后难以呼吸,家属:商家说内衣可治病,要求退一赔三;门店:没宣传过排毒治病功效

大风新闻
2026-04-06 10:12:06
记一次“约炮”被骗的详细经过

记一次“约炮”被骗的详细经过

云上南安
2026-04-06 17:11:46
美国飞行员在伊朗被击落后如何保持隐蔽并维持联络?

美国飞行员在伊朗被击落后如何保持隐蔽并维持联络?

Nee看
2026-04-05 19:57:41
致命错误!以色列是“低配版”日本,已把自己逼上绝路

致命错误!以色列是“低配版”日本,已把自己逼上绝路

毛豆论道
2026-04-05 22:04:17
传疯了!特朗普被传去世,数日未公开露面,引发网友热议

传疯了!特朗普被传去世,数日未公开露面,引发网友热议

魔都姐姐杂谈
2026-04-05 22:00:52
清明后,这3种海鱼正大量上市,纯野生无养殖,再不吃就休渔期了

清明后,这3种海鱼正大量上市,纯野生无养殖,再不吃就休渔期了

神牛
2026-04-06 10:10:30
6岁女童走失后续:有新发现、奶茶店主做出回应,知情人透内幕

6岁女童走失后续:有新发现、奶茶店主做出回应,知情人透内幕

潮鹿逐梦
2026-04-06 10:17:16
美国飞行员逃跑路线曝光,附近有山,耕地,城镇,多山地形救了他

美国飞行员逃跑路线曝光,附近有山,耕地,城镇,多山地形救了他

魔都姐姐杂谈
2026-04-06 17:02:35
伊朗:哈德米遇袭身亡

伊朗:哈德米遇袭身亡

澎湃新闻
2026-04-06 18:06:07
引爆金融圈! 分析师奔赴霍尔木兹战地调研 现场数船: 公开数据漏报50%通行量

引爆金融圈! 分析师奔赴霍尔木兹战地调研 现场数船: 公开数据漏报50%通行量

每日经济新闻
2026-04-06 14:47:30
“中毒人数增至134人”,台媒:台湾高雄春卷中毒事件涉事摊商被罚,案件移送地检署侦办

“中毒人数增至134人”,台媒:台湾高雄春卷中毒事件涉事摊商被罚,案件移送地检署侦办

环球网资讯
2026-04-06 14:21:06
卫星图披露美军营救飞行员行动细节:行动区域布满弹坑

卫星图披露美军营救飞行员行动细节:行动区域布满弹坑

环球网资讯
2026-04-06 17:54:07
消息一出,学界的群聊炸开了:北大数学学院通告

消息一出,学界的群聊炸开了:北大数学学院通告

岁月有情1314
2026-04-05 22:19:00
俄专家:中国公民可以优惠条件办理俄罗斯长期居留许可

俄专家:中国公民可以优惠条件办理俄罗斯长期居留许可

俄罗斯卫星通讯社
2026-04-06 15:06:39
1.5亿欧标价!维尼修斯离队皇马倒计时,英超五大豪门欲抢人!

1.5亿欧标价!维尼修斯离队皇马倒计时,英超五大豪门欲抢人!

田先生篮球
2026-04-06 14:19:39
因上坟太“疯”火遍全国!川渝人的清明,笑着把祖祖敬了

因上坟太“疯”火遍全国!川渝人的清明,笑着把祖祖敬了

匹夫来搞笑
2026-04-06 17:58:17
苹果用户等了10年,这家深圳公司把自拍杆做成了手机壳

苹果用户等了10年,这家深圳公司把自拍杆做成了手机壳

野生运营
2026-04-06 12:46:41
2026-04-06 19:08:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2763986文章数 6457关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

特朗普咆哮式发帖威胁伊朗 美政界人士:他像精神错乱

头条要闻

特朗普咆哮式发帖威胁伊朗 美政界人士:他像精神错乱

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

时尚
亲子
艺术
手机
家居

AI时代,辨别真相的成本变高了

亲子要闻

宝蓝和爸爸叔叔一起去找被藏起来的奇趣蛋,还吃了美味的冰淇淋~

艺术要闻

草书入门的“最强宝典”!因内容太妙,作者不敢留名,比学王羲之都靠谱

手机要闻

OPPO Find X9s Pro再次被确认:小直屏+哈苏增距镜,续航也有惊喜

家居要闻

温馨多元 爱的具象化

无障碍浏览 进入关怀版