网易首页 > 网易号 > 正文 申请入驻

万亿思考模型新速度!蚂蚁开源Ring-2.5-1T

0
分享至

  • 克雷西 发自 凹非寺
    量子位 | 公众号 QbitAI

来来来,狠角色来给春节AI大模型大战升级了。

刚刚,蚂蚁集团正式发布了全球首个开源混合线性架构万亿参数模型Ring-2.5-1T。

这次它在数学逻辑推理和长程自主执行能力上都练就了一身本领。

具体来说,它在IMO拿到了35分的金牌水平,CMO更是轰出105分远超国家集训队线;任务执行方面,则在搜索、编码这些复杂任务上都能独当一面。



而且这次发布,打破了业界长期以来关于深度思考必然要牺牲推理速度和显存的“不可能三角”。

以前大家默认模型要想逻辑严密、想得深,推理解码就得慢成龟速,显存开销还得爆炸。

但Ring-2.5-1T靠架构创新,成功实现在生成长度拉到32K以上时,让访存规模直接降到了1/10以下,同时生成吞吐量暴涨了3倍多。

所以它现在身上挂着两个极具反差感的标签,既是“开源界最聪明”的奥数大神,又是“跑得最快”的万亿参数思考者。

目前它已适配Claude Code、OpenClaw这些主流智能体框架,模型权重和推理代码也已经在Hugging Face、ModelScope等平台同步开放了。

混合架构让效率大幅提升

Ring-2.5-1T之所以能打破深度思考必然牺牲推理速度这一行业魔咒,主要是因为其底层采用了混合线性注意力架构。

这种架构基于Ring-flash-linear-2.0技术路线演进而来。具体来说,其采用了1:7的MLA(Multi-Head Latent Attention)配Lightning Linear Attention的混搭设计。



为了让模型在保持强大推理能力的同时实现线性级的推理速度,团队在训练上采用了增量训练的方式。

他们先把一部分原本的GQA(分组查询注意力)层直接转化为Lightning Linear Attention,这部分专门负责在长程推理场景下把吞吐量拉满;然后为了极致压缩KV Cache,再把剩下的GQA层近似转换为MLA。

但这还不够,为了防止模型表达能力受损,研究团队又专门适配了QK Norm和Partial RoPE这些特性,确保模型性能不降级。

经过这一番底层架构的重构,Ring-2.5-1T直接利用线性时间复杂度的特性,完美解决了长窗口下显存爆炸的难题。

改造后,Ring-2.5-1T的激活参数量从51B提升至63B,但其推理效率相比Ling 2.0仍实现了大幅提升。

这意味着长程推理不再是那种“烧钱又烧显卡”的重资产操作,而是变得相当轻量化,彻底解决了深度思考模型通常推理慢、成本高的痛点。



当然,光跑得快没用,逻辑还得严密。在思维训练上,Ring-2.5-1T引入了密集奖励机制。

这就像老师改卷子时不能只看最后的得数,还得死抠解题步骤里的每一个推导环节,会重点考察思考过程的严谨性,这让模型大幅减少了逻辑漏洞,高阶证明技巧也显著提升。

在此基础上,蚂蚁团队又给它上了大规模全异步Agentic RL训练,显著提升了它在搜索、编码这些长链条任务上的自主执行能力,让它从单纯的“做题家”变成了能真正下场干活的实战派。

Ring-2.5-1T实战演练

接下来把Ring拉出来遛遛,我让Gemini专门设计了一道能把人脑干烧的抽象代数证明题。

这道题目考察的是群论,要求模型在一个有限群里证明非交换群的阶≥27,还得把中心阶和正规子群的底细给摸清。



Ring-2.5-1T接招的姿势也是相当专业。它先是反手掏出Cauchy定理,接着就开始有条不紊地排雷,把阶为1、3、9这些只能是交换群的坑全给避开了。

而且它在证明非交换性的时候,不仅没被那种“3^k阶群肯定交换”的直觉给带偏,还直接把Heisenberg群甩出来当反例,可以说很有逻辑敏感度了。

整个实测看下来,它的逻辑推导严丝合缝。模型不仅把高深定理给吃透了,在处理这种长达好几步的逻辑链条时还没出半点纰漏,特别是对反例的运用直接把它的逻辑深度拉满。



这足以证明密集奖励训练确实让模型长了脑子,它处理这类硬核逻辑任务时的表现,完全是实战派的水准。

测完了硬核的数学难题,咱们再来看看这个实战派选手在系统级编程上,到底稳不稳。

这道代码实测题要求模型用Rust语言从零开始手写一个高并发线程池,模型得在不用任何现成库的情况下,靠Arc、Mutex和Condvar把任务分发逻辑给硬生生地搭出来。

不光得能跑,还得支持“优雅关机”,意思就是主线程在退出的时侯,必须确保所有派发出去的活儿全干完,而且坚决不能出现死锁这种低级错误。

另外还得加个监控模块,万一哪天某个Worker线程直接崩溃了,模型得能自动发现并把线程重启,而且还没处理完的任务队列一个都不能丢,这非常考验模型对内存安全和并发底层的理解。



来看Ring-2.5-1T给出的这份代码,它的处理方式确实非常老练。它通过panic::catch_unwind精准捕获崩溃并配合一个独立的监控线程实现自动重启,这种设计巧妙避开了初学者最容易掉进去的死锁陷阱。

代码在所有权管理与异步通知上的逻辑清晰且老练,优雅关机部分通过活动线程计数与信号量唤醒机制配合,完美达成了任务全部清空的目标。



把统一模态做成可复用底座

除了在架构和推理上的大动作,蚂蚁集团在通用人工智能基模领域保持多线并进,同期发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。

LLaDA2.1采用了非自回归并行解码技术,彻底改变了传统模型逐词预测的生成范式,推理速度达到了535tokens/s,在特定任务(如 HumanEval+编程任务)上的吞吐量甚至达到了更惊人的892tokens/s。

这种架构不仅大幅提升了吞吐效率,也让模型具备了独特的Token编辑与逆向推理能力。它可以直接在推理过程中对文本中间的特定Token进行精准修正,或者基于预设的边界条件进行反向逻辑追溯。

这种灵活性在处理需要高频改写或复杂逻辑回溯的任务时,展现出了比传统自回归模型更强的适配性。



全模态大模型Ming-flash-omni-2.0则是在视觉、音频、文本的统一表征与生成上实现了重大突破。

它在技术底层打通了视觉、音频与文本的边界,通过全模态感知的强化与泛音频统一生成框架,让模型既具备博学的专家级知识储备,又拥有沉浸式的音画同步创作能力。

这种全能型架构,实现了极高响应频率下的实时感官交互。



这一大波技术更新背后的算盘很清楚,蚂蚁inclusionAI是想把这些能力做成可复用底座。

这就是要给行业打个样,给开发者提供一个统一的能力入口,以后想做多模态应用不用再到处找模型拼凑了,直接调这个现成的底座就行。

据称已经明牌的是,接下来团队还会继续死磕视频时序理解、复杂图像编辑和长音频实时生成这几个硬骨头。

这些其实都是全模态技术规模化落地的最后几道关卡,只要把长视频逻辑看懂、把复杂修图搞精、把音频生成弄得更丝滑,全模态AI就能在各种干活场景里真正爆发了。

蚂蚁这一套组合拳打下来,能感觉到他们在春节档这波华山论剑里真不是来凑热闹的,这一本本厚实的成绩单交出来,直接就把技术底蕴给亮透了。

这种从底层逻辑到实战执行的全面爆发,稳稳地证明了他们就是全球AI圈子里最顶尖的那一拨选手,展现出了第一梯队的水平。

蚂蚁现在的路数,已经跳出了单纯炫技的层面,他们正把这些压箱底的本事,变成大家能直接上手的底座方案。

大模型的华山论剑,门槛被蚂蚁卷得更高了。

开源地址
GitHub:https://github.com/inclusionAI/Ring-V2.5
Huggingface:https://huggingface.co/inclusionAI/Ring-2.5-1T
ModelScope:https://www.modelscope.cn/models/inclusionAI/Ring-2.5-1T

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
商场里看到一个小女孩,长得真像刘亦菲

商场里看到一个小女孩,长得真像刘亦菲

乡野小珥
2026-02-08 12:18:03
人民日报“点名”杨紫,言辞犀利,释放两大信号,娱乐圈地位变了

人民日报“点名”杨紫,言辞犀利,释放两大信号,娱乐圈地位变了

查尔菲的笔记
2026-02-14 16:52:08
鲁比奥找王毅密谈1个小时,美方说了什么中国事后一字不提

鲁比奥找王毅密谈1个小时,美方说了什么中国事后一字不提

妙知
2026-02-14 11:05:35
中国奥委会:坚决支持国际奥委会维护奥运赛场不受政治干扰

中国奥委会:坚决支持国际奥委会维护奥运赛场不受政治干扰

澎湃新闻
2026-02-13 10:37:13
王菲当年在大理被堵,推开李嫣自己冲向人堆的视频,你们谁还记得

王菲当年在大理被堵,推开李嫣自己冲向人堆的视频,你们谁还记得

西楼知趣杂谈
2026-02-11 22:13:21
扎心!甘肃某设计院员工提离职,领导直言4500块的工资外面找不到

扎心!甘肃某设计院员工提离职,领导直言4500块的工资外面找不到

火山詩话
2026-02-12 18:35:50
中日首次交锋结束,中方点到为止,日本先放人再警告:别去钓鱼岛

中日首次交锋结束,中方点到为止,日本先放人再警告:别去钓鱼岛

我是孤独的小船
2026-02-14 15:09:52
0.02平方公里挤着5万人?警察不敢进的九龙寨城,1987年被连根拔起

0.02平方公里挤着5万人?警察不敢进的九龙寨城,1987年被连根拔起

老杉说历史
2026-02-06 00:17:10
又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

又揪出来一个巨贪,金额高达9.7亿,首富夫人郝斌跨境逃亡失败了

墨兰史书
2026-01-17 08:30:09
2-1,63岁穆帅发威:率队22轮不败,逼近葡超榜首,继续冲冠军

2-1,63岁穆帅发威:率队22轮不败,逼近葡超榜首,继续冲冠军

俯身冲顶
2026-02-14 06:33:36
湖北女子感染HPV,回家过年的第一批“受害者”出现了……

湖北女子感染HPV,回家过年的第一批“受害者”出现了……

桌子的生活观
2026-02-12 01:15:30
四渡赤水最惊人的真相:他瞒过了所有人,甚至连他自己都骗过了

四渡赤水最惊人的真相:他瞒过了所有人,甚至连他自己都骗过了

文史明鉴
2026-02-13 13:22:10
小泉进次郎的专机还没落地,中国的大门就已经焊死!

小泉进次郎的专机还没落地,中国的大门就已经焊死!

南权先生
2026-02-13 15:21:25
郭富城陪方媛回安徽过年,身高年龄都太有梗,合影画面太微妙

郭富城陪方媛回安徽过年,身高年龄都太有梗,合影画面太微妙

凛若秋霜
2026-02-13 10:16:39
明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

铭记历史呀
2026-01-31 23:08:25
我国六个 “强势” 部门全消失了?

我国六个 “强势” 部门全消失了?

浅深说
2025-11-07 15:39:22
爷爷是中国表演艺术家,老公是北电书记,她用演技狠狠打了众人脸

爷爷是中国表演艺术家,老公是北电书记,她用演技狠狠打了众人脸

让心灵得以栖息
2026-02-14 07:27:46
雅诗兰黛在美起诉沃尔玛,在网上销售假冒产品;中国网友:在山姆、沃尔玛买到假冒大牌化妆品,我说怎么那么便宜?

雅诗兰黛在美起诉沃尔玛,在网上销售假冒产品;中国网友:在山姆、沃尔玛买到假冒大牌化妆品,我说怎么那么便宜?

大风新闻
2026-02-13 08:27:06
中国抛美债,美国财长突然服软:绝不能脱钩!

中国抛美债,美国财长突然服软:绝不能脱钩!

米师傅安装
2026-02-14 15:30:26
杜若溪带公婆去娘家过年,坐18个小时绿皮车,一家八口同框很幸福

杜若溪带公婆去娘家过年,坐18个小时绿皮车,一家八口同框很幸福

八怪娱
2026-02-13 19:51:53
2026-02-14 17:40:49
量子位 incentive-icons
量子位
追踪人工智能动态
12171文章数 176384关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

委石油收入超10亿美元 资金将存入美财政部新开设账户

头条要闻

委石油收入超10亿美元 资金将存入美财政部新开设账户

体育要闻

金博洋:天才少年的奥运终章

娱乐要闻

吴克群变“吴克穷”助农,国台办点赞

财经要闻

春节抢黄金,谁赚到钱了?

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

健康
时尚
房产
手机
亲子

转头就晕的耳石症,能开车上班吗?

穿上这些鞋拥抱春天

房产要闻

三亚新机场,又传出新消息!

手机要闻

iPhone Fold要来了,阔折叠将彻底成为「主流」?

亲子要闻

情人节媳妇一点礼物没准备,老公埋怨感情淡了,媳妇的话让人意外

无障碍浏览 进入关怀版