网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

0
分享至

10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。



万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。



(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此外,本次发布的Ring-1T模型继续采用Ling 2.0架构的1T base模型做后训练,Ling 2.0采用了包括高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性实现高效训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。



据了解,截止目前蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浅议章泽天做播客:当一个富太太开始抛头露面

浅议章泽天做播客:当一个富太太开始抛头露面

穿透
2026-01-14 13:51:28
600多万粉丝“马背上的女县长”意外坠马去世,年仅47岁,一周前还在发视频宣传,此前曾多次坠马,遭母亲训斥“不准回家”

600多万粉丝“马背上的女县长”意外坠马去世,年仅47岁,一周前还在发视频宣传,此前曾多次坠马,遭母亲训斥“不准回家”

极目新闻
2026-01-15 00:43:21
亚服第一钟无艳,韩国女留学生在日被霸凌,手握铁锤猛砸八名同学

亚服第一钟无艳,韩国女留学生在日被霸凌,手握铁锤猛砸八名同学

社会酱
2026-01-14 17:02:49
随着丁俊晖2-6不敌特鲁姆普,止步大师赛首轮!8强对阵出炉附赛程

随着丁俊晖2-6不敌特鲁姆普,止步大师赛首轮!8强对阵出炉附赛程

球场没跑道
2026-01-15 00:09:47
韩综镜头下,中国南极站vs韩国世宗王站,差距大到韩网友集体破防

韩综镜头下,中国南极站vs韩国世宗王站,差距大到韩网友集体破防

阿废冷眼观察所
2026-01-14 09:21:49
随着布努扑2点球+比分4-2,尼日利亚出局,非洲杯决赛对阵正式出炉

随着布努扑2点球+比分4-2,尼日利亚出局,非洲杯决赛对阵正式出炉

侧身凌空斩
2026-01-15 06:50:00
伊朗完蛋的话,石油人民币就烂尾了!

伊朗完蛋的话,石油人民币就烂尾了!

扶苏聊历史
2026-01-14 10:17:34
呆呆全家关门走人了!警察成排围着看守,很多地方拉起了警戒线!

呆呆全家关门走人了!警察成排围着看守,很多地方拉起了警戒线!

好贤观史记
2026-01-13 18:08:50
宝能集团姚振华举报观致汽车被贱卖,估价报告显示行政楼每平米单价2千元

宝能集团姚振华举报观致汽车被贱卖,估价报告显示行政楼每平米单价2千元

新京报
2026-01-14 17:24:04
闫学晶风波再升级!一人已被行拘,婚变丑闻被扒,这回恐彻底栽了

闫学晶风波再升级!一人已被行拘,婚变丑闻被扒,这回恐彻底栽了

奇思妙想草叶君
2026-01-14 22:49:54
携程跌超9%!市场监管总局依法对携程集团有限公司立案调查

携程跌超9%!市场监管总局依法对携程集团有限公司立案调查

21世纪经济报道
2026-01-14 16:14:49
委内瑞拉:俄制防空系统为何拉胯?S-300连发两弹击落F-16:无证据

委内瑞拉:俄制防空系统为何拉胯?S-300连发两弹击落F-16:无证据

鹰眼Defence
2026-01-14 17:36:25
突发!携程集团被立案调查,股价盘尾大跌

突发!携程集团被立案调查,股价盘尾大跌

凤凰网财经
2026-01-14 17:21:06
U23亚洲杯国足逼平泰国队历史性出线,17日向四强发起冲击

U23亚洲杯国足逼平泰国队历史性出线,17日向四强发起冲击

红星新闻
2026-01-14 22:09:21
杨贵妃裸体雕像被举报事件,还有更深的讽刺

杨贵妃裸体雕像被举报事件,还有更深的讽刺

清书先生
2026-01-14 17:12:29
伴郎破坏婚礼后续:正脸被扒已社死,目的曝光,新娘发长文表态

伴郎破坏婚礼后续:正脸被扒已社死,目的曝光,新娘发长文表态

史行途
2026-01-13 13:35:16
与辉同行“皖西麻黄鸡”遭打假,产品已下架!直播间83元3只,产业协会:单只养殖成本就超150元,未找到供货记录

与辉同行“皖西麻黄鸡”遭打假,产品已下架!直播间83元3只,产业协会:单只养殖成本就超150元,未找到供货记录

每日经济新闻
2026-01-14 21:47:05
李亚鹏回应欠2600万:医院牌子被房东强拆,500万涨到1100万太贵

李亚鹏回应欠2600万:医院牌子被房东强拆,500万涨到1100万太贵

李健政观察
2026-01-14 16:36:37
闫学晶事件迎来反转!林傲霏中戏毕业照曝光,中戏欺骗了所有考生

闫学晶事件迎来反转!林傲霏中戏毕业照曝光,中戏欺骗了所有考生

阿纂看事
2026-01-14 16:41:41
中国狂抛美债,特朗普紧急发一道总统令,他认为:中国一定会领情

中国狂抛美债,特朗普紧急发一道总统令,他认为:中国一定会领情

策略述
2026-01-14 17:14:31
2026-01-15 08:19:00
光锥智能 incentive-icons
光锥智能
来这里,看千行百业的数字化、智能化。
893文章数 138关注度
往期回顾 全部

科技要闻

反垄断大棒,为何砸向了携程

头条要闻

贺娇龙意外坠马头部重伤离世 最后一条朋友圈与马有关

头条要闻

贺娇龙意外坠马头部重伤离世 最后一条朋友圈与马有关

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

教育
房产
旅游
本地
公开课

教育要闻

孩子可以不成才,但不能不感恩

房产要闻

热销17亿后!天正·三亚湾壹号,被爆违建!

旅游要闻

缙云丨余道勇:时光在天星沟交汇

本地新闻

邵阳公益诉讼检察主题曲:《守望星》

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版