网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

0
分享至

10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥林匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。


(Ring-1T与业界代表性思考模型的性能横评)

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。


(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此外,本次发布的Ring-1T模型继续采用Ling 2.0架构的1T base模型做后训练,Ling 2.0采用了包括高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性实现高效训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。


据了解,截至目前蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长电科技,反败为胜!

长电科技,反败为胜!

投研邦V
2025-11-01 19:38:06
她长那么漂亮,可惜一直没有火起来,非常有实力的

她长那么漂亮,可惜一直没有火起来,非常有实力的

普陀动物世界
2025-11-01 14:39:54
金价11月1日:大家要有心理准备了,下周,金价或将迎来大风暴

金价11月1日:大家要有心理准备了,下周,金价或将迎来大风暴

娱乐八卦木木子
2025-11-01 03:26:58
生孩子上瘾?张柏芝又怀4胎?知情人坦言情况属实,但孩子生父仍是谜

生孩子上瘾?张柏芝又怀4胎?知情人坦言情况属实,但孩子生父仍是谜

八星人
2025-11-01 13:06:12
小米前高管王腾公布新去向:和手机行业说再见,正是闯的年纪

小米前高管王腾公布新去向:和手机行业说再见,正是闯的年纪

南方都市报
2025-11-01 23:10:18
刘强东疑回应和章泽天冷战传闻,几十字曝3点讯息,该和汪峰学学

刘强东疑回应和章泽天冷战传闻,几十字曝3点讯息,该和汪峰学学

古希腊掌管松饼的神
2025-11-01 20:22:08
赵本山到三亚清水湾自家别墅度假,下雨天逛街,专人撑伞悠闲气派

赵本山到三亚清水湾自家别墅度假,下雨天逛街,专人撑伞悠闲气派

小娱乐悠悠
2025-10-31 13:49:17
很快,大家就会自觉交出手里的存款,冲入股市

很快,大家就会自觉交出手里的存款,冲入股市

流苏晚晴
2025-10-28 19:09:42
王家卫好样的,这下全网都知道唐嫣洁身自好了

王家卫好样的,这下全网都知道唐嫣洁身自好了

娱乐故事
2025-11-01 21:36:09
你只是来体验生命的,不是来害怕的

你只是来体验生命的,不是来害怕的

青苹果sht
2025-11-01 05:52:54
又一则励志新闻翻车了!

又一则励志新闻翻车了!

清书先生
2025-10-21 15:51:40
特朗普说中美关系很好,将来会更好

特朗普说中美关系很好,将来会更好

一个坏土豆
2025-10-31 20:26:47
已确认!是知名演员杨紫

已确认!是知名演员杨紫

鲁中晨报
2025-11-01 10:03:06
知三当三,逼走刚生二胎原配,被央视除名20年后,她如今怎样了?

知三当三,逼走刚生二胎原配,被央视除名20年后,她如今怎样了?

冷紫葉
2025-10-24 15:38:32
特朗普光环下的选战!奥巴马出山救场,两州州长宝座争夺白热化

特朗普光环下的选战!奥巴马出山救场,两州州长宝座争夺白热化

史虇的生活科普
2025-11-02 00:55:15
“新疆棉”事件5年后,那个丑态百出的“反华妖女”,如今怎样了

“新疆棉”事件5年后,那个丑态百出的“反华妖女”,如今怎样了

博览历史
2025-09-10 20:25:07
朱拉尼没想到中国动真格,发现只要中国不答应,美俄支持也没用!

朱拉尼没想到中国动真格,发现只要中国不答应,美俄支持也没用!

头条爆料007
2025-11-01 08:55:22
全运会单打抽签尴尬解了!樊振东陈梦皆列第4 女单争冠更具开放性

全运会单打抽签尴尬解了!樊振东陈梦皆列第4 女单争冠更具开放性

劲爆体坛
2025-11-01 09:34:06
1-0,2-1!皇马志在复仇!姆巴佩率队冲击:西甲4连胜+8连斩

1-0,2-1!皇马志在复仇!姆巴佩率队冲击:西甲4连胜+8连斩

万花筒体育球球
2025-11-01 11:36:17
未来几年,将是微利世界,凯文凯利建议普通人,要守住松鼠法则

未来几年,将是微利世界,凯文凯利建议普通人,要守住松鼠法则

阿胖读书
2025-09-14 14:42:38
2025-11-02 06:31:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
218188文章数 743232关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

美国防长国务卿受威胁 躲进军事基地

头条要闻

美国防长国务卿受威胁 躲进军事基地

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

换新一口价11.98万 第三代蓝电E5 PLUS开启预售

态度原创

数码
时尚
手机
教育
公开课

数码要闻

预热 2026 FIFA 足球世界杯,闪迪推出多款授权设计存储产品

伊姐周六热推:电视剧《树影迷宫》;电视剧《锦月令》......

手机要闻

疑似OPPO Find X10被曝光:2亿潜望镜确认加持,其他厂商怎么玩?

教育要闻

高中数学,从不亏待认真思考的人

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版