网易首页 > 网易号 > 正文 申请入驻

蚂蚁万亿参数思考模型Ring-1发布即开源,刷新多项开源SOTA

0
分享至

10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。作为一款思考模型,Ring-1T也表现出了极佳的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。



(Ring-1T与业界代表性思考模型的性能横评)

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。



(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此外,本次发布的Ring-1T模型继续采用Ling 2.0架构的1T base模型做后训练,Ling 2.0采用了包括高度稀疏的MoE架构,1/32的专家激活比、FP8混合精度、MTP等诸多特性实现高效训练与推理。在后训练阶段,蚂蚁百灵团队通过LongCoT-SFT + RLVR + RLHF多阶段训练,显著提升了模型的复杂推理能力以及指令跟随和创意写作等通用能力。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。



据了解,截止目前蚂蚁百灵大模型已经发布18款模型,已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布,百灵大模型也正式步入2.0阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美专家一致认为:想战胜中国只有一个法子,但这条红线美不敢跨越

美专家一致认为:想战胜中国只有一个法子,但这条红线美不敢跨越

阿七说史
2025-10-31 17:17:14
影星哈里斯·福特抨击特朗普:随心所欲赚得盆满钵满,世界却走向毁灭

影星哈里斯·福特抨击特朗普:随心所欲赚得盆满钵满,世界却走向毁灭

爆角追踪
2025-11-02 10:48:56
面对荷方断供!安世中国再硬刚

面对荷方断供!安世中国再硬刚

看看新闻Knews
2025-11-02 12:43:04
山姆一张不雅照,刺痛3亿中产!

山姆一张不雅照,刺痛3亿中产!

广告案例精选
2025-11-02 17:37:27
周末两大利空!科技股被一致看空,国常会、证监会重磅

周末两大利空!科技股被一致看空,国常会、证监会重磅

看财经show
2025-11-02 15:53:39
这回要排队买丰田了,新SUV比奥迪Q5L还漂亮,油耗仅4.2L!

这回要排队买丰田了,新SUV比奥迪Q5L还漂亮,油耗仅4.2L!

周哥一影视
2025-11-02 10:00:37
突发!石景山游乐园起火,官方通报——

突发!石景山游乐园起火,官方通报——

BRTV新闻
2025-11-02 17:50:18
国民党主席位置坐稳,郑丽文摊牌了:两岸不回归和平,其他是侈谈

国民党主席位置坐稳,郑丽文摊牌了:两岸不回归和平,其他是侈谈

董董历史烩
2025-11-01 14:13:05
薄一波直接打断原副总理姬鹏飞电话,说:他大逆不道,别执迷不悟

薄一波直接打断原副总理姬鹏飞电话,说:他大逆不道,别执迷不悟

大运河时空
2025-11-01 18:00:03
不少广东人收到“百里挑一”短信,省统计局回应

不少广东人收到“百里挑一”短信,省统计局回应

番禺台
2025-11-02 00:08:40
抄家1070亿!美英韩开始全球搜捕陈志,才知道:网红前女友早看穿

抄家1070亿!美英韩开始全球搜捕陈志,才知道:网红前女友早看穿

热风追逐者
2025-10-27 12:18:15
跌幅超60%!苏州昆山房价呈现大幅雪崩态势,从单价30000跌至8000

跌幅超60%!苏州昆山房价呈现大幅雪崩态势,从单价30000跌至8000

火山诗话
2025-11-02 15:24:56
痛心!徐州3名孩子失联后遗体在河中找到,其中包括一对姐弟

痛心!徐州3名孩子失联后遗体在河中找到,其中包括一对姐弟

极目新闻
2025-11-02 13:25:07
56岁大妈下单盲人按摩 “特殊服务”,竟称:“伸进按才管用”

56岁大妈下单盲人按摩 “特殊服务”,竟称:“伸进按才管用”

云端小院
2025-11-02 09:05:55
中央批准:王道席任湖南省委常委

中央批准:王道席任湖南省委常委

政知新媒体
2025-11-02 18:57:00
开拓者官宣下放杨瀚森!去发展联盟进行训练 两天后对阵湖人回归

开拓者官宣下放杨瀚森!去发展联盟进行训练 两天后对阵湖人回归

罗说NBA
2025-11-02 05:35:28
WTT冠军赛再爆冷!申裕斌1-4惨败出局,怪胶手强势晋级决赛

WTT冠军赛再爆冷!申裕斌1-4惨败出局,怪胶手强势晋级决赛

全言作品
2025-11-02 18:44:38
正面硬刚婆婆是啥体验?网友:我直接说不想住一起,让老公二选一

正面硬刚婆婆是啥体验?网友:我直接说不想住一起,让老公二选一

带你感受人间冷暖
2025-11-02 00:10:03
中方刚复购大豆,美国又变脸,美贸易代表通告全球,继续调查中国

中方刚复购大豆,美国又变脸,美贸易代表通告全球,继续调查中国

叮当当科技
2025-11-02 00:09:19
1斤豆芽卖28.8元?网友直呼“吃不起”,知名餐饮品牌回应

1斤豆芽卖28.8元?网友直呼“吃不起”,知名餐饮品牌回应

都市快报橙柿互动
2025-11-02 16:20:16
2025-11-02 20:44:49
派财经 incentive-icons
派财经
聚焦数字经济内容服务机构
845文章数 909关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

原价百万1针的CAR-T有望纳入创新药目录

头条要闻

原价百万1针的CAR-T有望纳入创新药目录

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

家居
手机
房产
数码
军事航空

家居要闻

吸睛艺术 富有传奇色彩

手机要闻

同样开售三天,小米、vivo、荣耀、OPPO新旗舰销量对比

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

数码要闻

威联通推出 AI NAS TVS-AIh1688ATX,可选英特尔酷睿 Ultra 9 285

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版