网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

0
分享至

来源:环球网

【环球网科技综合报道】10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。



(Ring-1T与业界代表性思考模型的性能横评)

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。


(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此外,本次发布的Ring-1T模型继续采用Ling 2.0架构的1T base模型做后训练,Ling 2.0采用了包括高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性实现高效训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。


据了解,截至目前蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。 (勃潺)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“四十不惑”的巨力索具:上市十五年净利未破7亿,杨氏家族套现超28亿元

“四十不惑”的巨力索具:上市十五年净利未破7亿,杨氏家族套现超28亿元

凤凰网财经
2026-02-04 18:10:12
山东传来一声巨响,中国在海底挖出“第二国库”,突破技术封锁!

山东传来一声巨响,中国在海底挖出“第二国库”,突破技术封锁!

趣生活
2026-02-04 21:31:41
赵心童世锦赛争黑绝杀希金斯,世界前5选手全军覆没

赵心童世锦赛争黑绝杀希金斯,世界前5选手全军覆没

墨史轩
2026-02-05 04:46:33
笑死!周扬青内涵庆奶整容,被回怼到哑口无言,网友:自取其辱

笑死!周扬青内涵庆奶整容,被回怼到哑口无言,网友:自取其辱

丹妮观
2026-02-02 17:49:06
轰32+12后又砍43+8!CBA又一顶级小外援诞生,能否率队再创奇迹?

轰32+12后又砍43+8!CBA又一顶级小外援诞生,能否率队再创奇迹?

老叶评球
2026-02-04 21:57:40
日本诺贝尔奖得主大江健三郎表示:很遗憾,日本很可能将重复历史

日本诺贝尔奖得主大江健三郎表示:很遗憾,日本很可能将重复历史

议纪史
2025-11-27 14:35:03
史上最长春节假期,南京公交:2月15日—2月23日全国游客可免费乘坐28条“G”字头旅游观光路线

史上最长春节假期,南京公交:2月15日—2月23日全国游客可免费乘坐28条“G”字头旅游观光路线

扬子晚报
2026-02-04 18:21:05
面条立大功!研究发现:糖尿病患者常吃面条,或能降低3种并发症

面条立大功!研究发现:糖尿病患者常吃面条,或能降低3种并发症

岐黄传人孙大夫
2026-01-12 09:05:07
墙倒众人推!无缘冠军的孙颖莎到底输在哪?邓亚萍的话一针见血

墙倒众人推!无缘冠军的孙颖莎到底输在哪?邓亚萍的话一针见血

丁丁鲤史纪
2025-11-17 15:58:28
大奖赛16强出炉附赛程,赵心童、肖国栋迎战强敌,8强中国锁定2席

大奖赛16强出炉附赛程,赵心童、肖国栋迎战强敌,8强中国锁定2席

球场没跑道
2026-02-04 23:57:23
台湾人魏明仁“胆大妄为”:在台湾建毛主席纪念馆,升共产党党旗

台湾人魏明仁“胆大妄为”:在台湾建毛主席纪念馆,升共产党党旗

春风秋雨
2026-02-03 19:40:05
伊朗最高领袖哈梅内伊:如果美国挑起战争,这次冲突将不再局限于一地;美方发布“林肯”号航母在阿拉伯海接受补给视频

伊朗最高领袖哈梅内伊:如果美国挑起战争,这次冲突将不再局限于一地;美方发布“林肯”号航母在阿拉伯海接受补给视频

每日经济新闻
2026-02-01 21:46:27
20年前,张冕为护胡歌离世,胡歌许诺赡养其父母,如今他做到了吗

20年前,张冕为护胡歌离世,胡歌许诺赡养其父母,如今他做到了吗

情感大头说说
2026-02-05 02:56:55
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
1965,风暴前的宁静

1965,风暴前的宁静

方待夜半听君语
2026-02-01 07:43:54
真相大白!孙颖莎亚洲杯大胜原因曝光,邱贻可为何没有指导莎莎?

真相大白!孙颖莎亚洲杯大胜原因曝光,邱贻可为何没有指导莎莎?

曹说体育
2026-02-04 12:51:25
金银急速跳水:黄金由涨转跌,最新报4922美元/盎司;现货白银日内跌幅2%,报83.5美元/盎司

金银急速跳水:黄金由涨转跌,最新报4922美元/盎司;现货白银日内跌幅2%,报83.5美元/盎司

极目新闻
2026-02-04 08:41:51
黑石罕见重大投资失误

黑石罕见重大投资失误

新浪财经
2026-02-04 18:25:34
这回真洗不白了,大S临终细节首次曝光,原来汪小菲没说错

这回真洗不白了,大S临终细节首次曝光,原来汪小菲没说错

阿废冷眼观察所
2026-02-05 03:14:26
2026-02-05 05:39:00
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1322856文章数 2709095关注度
往期回顾 全部

科技要闻

太烦人遭投诉!元宝红包链接被微信屏蔽

头条要闻

女子痛斥爱泼斯坦:我一次又一次被强奸 他禽兽不如

头条要闻

女子痛斥爱泼斯坦:我一次又一次被强奸 他禽兽不如

体育要闻

哈登回应交易:不想让自己拖累快船的未来

娱乐要闻

春晚主持人阵容曝光,5位都是老面孔

财经要闻

白银,突然暴涨

汽车要闻

综合续航1730km 5座中级电混SUV吉利银河M7官图发布

态度原创

艺术
亲子
时尚
房产
家居

艺术要闻

快过年了,送大家49张图片!谁看谁幸福!

亲子要闻

麻腮风疫苗到底要不要给孩子打?听听儿科医生怎么说

60岁的刘嘉玲、章小蕙太美了!港女的魅力从不是少女感

房产要闻

还在涨!成交量连飙四个月 海口二手房开始稳了!

家居要闻

灰白意境 光影奏鸣曲

无障碍浏览 进入关怀版