网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布并开源万亿参数思考模型Ring-1T 综合能力逼近GPT-5

0
分享至

【TechWeb】10月14日消息,今天凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。

Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力,此次百灵团队挑战了难度更高的IMO2025(国际数学奥利匹克)赛题,将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T仅用一次解出了第1、3、4、5题,相当于IMO银牌水平,成为首个能拿IMO国际奥数奖的开源系统。Ring-1T在第三次尝试IMO时对第2题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与Gemini 2.5 Pro 相同的“4048”(正确答案为2112)。


作为一款思考模型,Ring-1T也表现出了很好的通用能力,在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩。在面向严谨领域的医疗问答HealthBench测评中,Ring-1T也以最高分取得开源领域最佳。

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。据介绍,在Ring-1T模型中,蚂蚁采用了自研的“棒冰(icepop)”算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。

此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统ASystem(其中包含已开源的高性能强化学习框架AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模RL训练稳定跑成日常。

据百灵团队透露,Ring-1T模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

最近,百灵团队动作频频,先是9月30日发布了Ring-1T的预览版Ring-1T-preview,二者都是思考模型,也就是推理模型。10月9日,蚂蚁集团发布了万亿参数通用大语言模型Ling-1T,这个是非思考模型。

截至目前,蚂蚁百灵大模型已经发布18款模型,形成从160亿总参数到1万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型:通用大语言模型Ling-1T、思考模型Ring-1T。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国际油价大跌

国际油价大跌

第一财经资讯
2026-02-02 09:28:11
她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

阿胡
2026-01-21 17:34:15
闫学晶凉了!儿子新疆班再实锤,疑被顶替考生发声,舆论反扑中戏

闫学晶凉了!儿子新疆班再实锤,疑被顶替考生发声,舆论反扑中戏

李健政观察
2026-02-02 12:23:28
爆大冷!埃梅里耻辱一战:多踢1人主场落败,争冠形势迅速恶化

爆大冷!埃梅里耻辱一战:多踢1人主场落败,争冠形势迅速恶化

足球狗说
2026-02-02 00:19:11
要输给姆巴佩了?姆巴佩少用近70场情况下 就超了大罗生涯总进球

要输给姆巴佩了?姆巴佩少用近70场情况下 就超了大罗生涯总进球

体坛八点半的那些事儿
2026-02-02 17:30:12
特斯拉:第三代特斯拉人形机器人即将亮相,预计年产百万台

特斯拉:第三代特斯拉人形机器人即将亮相,预计年产百万台

界面新闻
2026-02-02 12:13:55
全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

西楼知趣杂谈
2026-01-31 13:18:43
20年来首次动刀!带薪年假或增至10天起,条例修订只是个开始?

20年来首次动刀!带薪年假或增至10天起,条例修订只是个开始?

boss外传
2026-02-01 18:00:03
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
“谁还敢用你?”211女硕士被体制内劝退,网友看清现实:自找的

“谁还敢用你?”211女硕士被体制内劝退,网友看清现实:自找的

妍妍教育日记
2025-12-26 18:10:09
大S纪念雕像揭幕,周渝民、言承旭等好友到场,孩子未出席。

大S纪念雕像揭幕,周渝民、言承旭等好友到场,孩子未出席。

话娱论影
2026-02-02 14:52:46
4连胜难保帅位,张庆鹏下课倒计时?曝接班人浮出水面,会是他?

4连胜难保帅位,张庆鹏下课倒计时?曝接班人浮出水面,会是他?

萌兰聊个球
2026-02-02 13:20:13
畸形儿风波后,阚清子首度表态,早产女婴夭折传闻终于真相大白

畸形儿风波后,阚清子首度表态,早产女婴夭折传闻终于真相大白

小椰的奶奶
2026-02-02 00:10:15
普京对美国发出通牒后,不到24小时,特朗普让步,美国人要心碎了

普京对美国发出通牒后,不到24小时,特朗普让步,美国人要心碎了

现代小青青慕慕
2026-02-02 14:31:28
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
央媒怒批、坑害老百姓!臭名昭著的几个相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的几个相声演员,各个难以原谅

无力的滋味
2026-02-01 11:32:33
对张庆鹏竖中指?沈梓捷情绪失控一路怒喷 北控或已失控

对张庆鹏竖中指?沈梓捷情绪失控一路怒喷 北控或已失控

大嘴爵爷侃球
2026-02-02 09:31:34
江苏大一女生开养老院,无人入住却有近400名客户,员工全是60后

江苏大一女生开养老院,无人入住却有近400名客户,员工全是60后

法老不说教
2026-01-16 23:26:38
眼见日军战俘无食可吃,曾克林调拨55头牛羊接济,竟换回26架整备完好的飞机

眼见日军战俘无食可吃,曾克林调拨55头牛羊接济,竟换回26架整备完好的飞机

史海孤雁
2026-01-30 17:34:13
现货白银日内跌幅扩大至10%,报76.89美元/盎司

现货白银日内跌幅扩大至10%,报76.89美元/盎司

每日经济新闻
2026-02-02 07:26:07
2026-02-02 18:00:49
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
15712文章数 43056关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

小鹏机器人首秀摔了 此前因步态太拟真被疑"真人套壳"

头条要闻

小鹏机器人首秀摔了 此前因步态太拟真被疑"真人套壳"

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

商品期货暴跌 全球股市遭遇"黑色星期一"

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

手机
家居
时尚
教育
公开课

手机要闻

人民日报头版力挺,OPPO折叠屏技术引苹果学习!

家居要闻

现代几何彩拼 智焕童梦居

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

教育要闻

养孩子要花68万?教育降级的风来了,聪明的家长这样“精准养娃”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版