网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

0
分享至

10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。


(Ring-1T与业界代表性思考模型的性能横评)

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。


(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此外,本次发布的Ring-1T模型继续采用Ling 2.0架构的1T base模型做后训练,Ling 2.0采用了包括高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性实现高效训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。


据了解,截止目前蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
翻车现场!百万网红阿爆人设崩塌,住别墅、戴宝格丽卖惨无人共情

翻车现场!百万网红阿爆人设崩塌,住别墅、戴宝格丽卖惨无人共情

国际阿尝
2026-01-22 09:43:36
医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

霹雳炮
2025-12-04 22:54:47
湖北一大妈跳了20多年广场舞后,拿100多个金镯子去卖,说家里还有金项链没拿,我人好,都是别人送的

湖北一大妈跳了20多年广场舞后,拿100多个金镯子去卖,说家里还有金项链没拿,我人好,都是别人送的

LULU生活家
2025-12-24 18:51:10
维多利亚跳舞内幕公开:当众冷落羞辱儿媳妇,妮可拉哭着离场

维多利亚跳舞内幕公开:当众冷落羞辱儿媳妇,妮可拉哭着离场

琴声飞扬
2026-01-23 09:35:41
狂揽30亿!一双鞋1499元,“童鞋界爱马仕”收割中产,闷声发大财

狂揽30亿!一双鞋1499元,“童鞋界爱马仕”收割中产,闷声发大财

品牌观察官
2026-01-19 16:54:46
2026全市“施工图”定了!珠海将力推这些项目→

2026全市“施工图”定了!珠海将力推这些项目→

珠海发布
2026-01-23 20:41:43
泰国国家旅游局因Lisa旅游宣传图引发争议

泰国国家旅游局因Lisa旅游宣传图引发争议

曼谷陈大叔
2026-01-22 15:59:48
央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

一娱三分地
2025-12-04 17:00:33
靠谱不?曼城主场负倒数第一,枪手完胜红魔,英超冠军本轮悬念终

靠谱不?曼城主场负倒数第一,枪手完胜红魔,英超冠军本轮悬念终

涛哥侃球
2026-01-23 15:17:35
叶文斌妈妈发文感谢祖国,称那些帮助了她的都是大恩人

叶文斌妈妈发文感谢祖国,称那些帮助了她的都是大恩人

映射生活的身影
2026-01-22 14:48:25
不装了,穆帅突爆争议发言!本菲卡很意外,球迷:又开始甩锅了

不装了,穆帅突爆争议发言!本菲卡很意外,球迷:又开始甩锅了

阿泰希特
2026-01-23 13:31:25
毛主席个子确实高,看着他的衣服有点小,这是与五大元帅的合影

毛主席个子确实高,看着他的衣服有点小,这是与五大元帅的合影

大江
2025-11-30 08:27:08
同样是26000分,库里用了17年,科比15年,詹姆斯哈登和邓肯呢?

同样是26000分,库里用了17年,科比15年,詹姆斯哈登和邓肯呢?

老范谈史
2025-12-27 12:02:25
最新!川普小儿子勇救女网友 女主被狂暴男暴打 表现甩亲爹几条街

最新!川普小儿子勇救女网友 女主被狂暴男暴打 表现甩亲爹几条街

北国向锡安
2026-01-23 17:32:33
第98届奥斯卡奖提名公布,《罪人》凭啥创纪录拿下16个提名?

第98届奥斯卡奖提名公布,《罪人》凭啥创纪录拿下16个提名?

阿废冷眼观察所
2026-01-23 13:24:46
医生提醒:服用瑞舒伐他汀,这4种食物要戒掉,再吃容易心肌梗死

医生提醒:服用瑞舒伐他汀,这4种食物要戒掉,再吃容易心肌梗死

健康科普365
2026-01-06 14:15:10
狄龙表示:五年前的詹姆斯,你不可能对他喷垃圾话,因为他太强了

狄龙表示:五年前的詹姆斯,你不可能对他喷垃圾话,因为他太强了

爱体育
2026-01-23 23:16:13
赵心童用时7分07秒打出147满分,历史上仅次于奥沙利文

赵心童用时7分07秒打出147满分,历史上仅次于奥沙利文

懂球帝
2026-01-23 11:24:38
一场追悼会,戳穿向华强夫妇在香港的真实地位,原来李连杰没说谎

一场追悼会,戳穿向华强夫妇在香港的真实地位,原来李连杰没说谎

凡知
2026-01-21 17:14:40
科斯塔:比起穆帅更想和西蒙尼“约架”;踢热刺就是去干仗

科斯塔:比起穆帅更想和西蒙尼“约架”;踢热刺就是去干仗

懂球帝
2026-01-24 00:21:09
2026-01-24 03:04:49
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68405文章数 656059关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

体育要闻

杜兰特鏖战44分钟累瘫 轰36+7却致命失误

娱乐要闻

演员孙涛澄清闫学晶言论 落泪维护妻子

财经要闻

2026年,消费没有新故事?

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

时尚
游戏
房产
家居
数码

今日热点:车银优代言广告被隐藏;《巅峰对决》主演担任米兰冬奥会火炬手……

没有鼠群了!《瘟疫传说》新作回归15年前

房产要闻

正式官宣!三亚又一所名校要来了!

家居要闻

在家度假 160平南洋混搭宅

数码要闻

号称枪战之王!iQOO 15 Ultra首发超感触控肩键:寿命近乎无限

无障碍浏览 进入关怀版