网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

0
分享至

10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。



(Ring-1T与业界代表性思考模型的性能横评)

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。



(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此外,本次发布的Ring-1T模型继续采用Ling 2.0架构的1T base模型做后训练,Ling 2.0采用了包括高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性实现高效训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。



据了解,截止目前蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

干史人
2026-01-08 22:47:00
故事:42岁女子做试管生下儿子,8年后却找医生痛哭:我还不如不生

故事:42岁女子做试管生下儿子,8年后却找医生痛哭:我还不如不生

涛哥讲堂
2024-08-20 15:47:46
CBA积分榜最新排名出炉!广厦广东稳居前2:辽宁队已下滑至第11?

CBA积分榜最新排名出炉!广厦广东稳居前2:辽宁队已下滑至第11?

篮球快餐车
2026-01-15 04:03:24
“田朴珺们”的上位:这些真相,没人敢明说

“田朴珺们”的上位:这些真相,没人敢明说

红大娘娱乐
2026-01-12 22:10:28
小小改变也能延寿!《柳叶刀》重磅:每天仅增加5分钟运动,就能显著延长寿命

小小改变也能延寿!《柳叶刀》重磅:每天仅增加5分钟运动,就能显著延长寿命

医诺维
2026-01-14 17:06:29
绝了,才刚下课!阿隆索就和皇马翻脸,抱怨高层,下课太委屈

绝了,才刚下课!阿隆索就和皇马翻脸,抱怨高层,下课太委屈

阿泰希特
2026-01-14 11:16:22
贾·莫兰特与灰熊队友在柏林训练中发生激烈争吵,被拍到视频

贾·莫兰特与灰熊队友在柏林训练中发生激烈争吵,被拍到视频

好火子
2026-01-15 01:35:03
石破茂回应中日现状,不是打得过打不过的问题,而是能不能活下去

石破茂回应中日现状,不是打得过打不过的问题,而是能不能活下去

笑谈历史阿晡
2026-01-14 11:26:05
What?!美国3美元的Trader Joe’s帆布袋,在海外被炒到5万美元!?

What?!美国3美元的Trader Joe’s帆布袋,在海外被炒到5万美元!?

北美省钱快报
2026-01-13 07:36:20
国乒大冷门!新科世界冠军输排名155对手,新年首战止步资格赛

国乒大冷门!新科世界冠军输排名155对手,新年首战止步资格赛

全言作品
2026-01-15 00:41:26
告别校外供餐 2027年底所有北京中小学将实现校内食堂供餐

告别校外供餐 2027年底所有北京中小学将实现校内食堂供餐

新京报
2026-01-14 20:24:05
生理性喜欢显而易见,43岁阿Sa高调认爱,给内娱女明星们上了一课

生理性喜欢显而易见,43岁阿Sa高调认爱,给内娱女明星们上了一课

查尔菲的笔记
2026-01-14 22:00:56
广东宏远拒绝输球!全力击败上海男篮,奎因对位张镇麟,央视直播

广东宏远拒绝输球!全力击败上海男篮,奎因对位张镇麟,央视直播

体坛瞎白话
2026-01-14 15:04:40
激烈冲突!T2对阵,山西13分惨败,迪亚洛好日子结束

激烈冲突!T2对阵,山西13分惨败,迪亚洛好日子结束

孤酒老巷QA
2026-01-14 20:35:11
央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

央企“最牛女副处长”落马:两年与上司开房410次,细节曝光

西门老爹
2025-12-16 15:35:31
新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

医护健康科普
2025-08-31 17:07:58
中戏辟谣后,闫学晶儿子又被举报了,如今央媒下场,这下麻烦大了

中戏辟谣后,闫学晶儿子又被举报了,如今央媒下场,这下麻烦大了

叨唠
2026-01-14 04:47:42
动态丨上海警方开展“砺剑2026”集中整治行动;从重处罚!“90后医生被控强奸2名幼女”案再审宣判

动态丨上海警方开展“砺剑2026”集中整治行动;从重处罚!“90后医生被控强奸2名幼女”案再审宣判

上海法治声音
2026-01-14 19:21:10
美股科技股集体下跌

美股科技股集体下跌

第一财经资讯
2026-01-14 23:05:46
楼市大局已定!45%有多套房的家庭,将要面临这4个难题

楼市大局已定!45%有多套房的家庭,将要面临这4个难题

猫叔东山再起
2025-11-23 10:35:03
2026-01-15 06:28:49
财经三剑客 incentive-icons
财经三剑客
爱科技,看科技,侃科技。
2818文章数 2045关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

头条要闻

外媒揭美对伊朗动手方案:派特种部队对高层实施"斩首"

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

健康
艺术
教育
旅游
公开课

血常规3项异常,是身体警报!

艺术要闻

历代书家集字春联大集合

教育要闻

孩子的人生底色,真不是靠补习班

旅游要闻

从荒地到花海:凯里用 10 年造绿,让冬日公园藏满幸福滋味!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版