网易首页 > 网易号 > 正文 申请入驻

蚂蚁首个万亿参数推理大模型,开源!

0
分享至

智东西9月30日消息,今天,蚂蚁百灵大模型宣布开源其思考模型Ring-1T的预览版——Ring-1T-preview,参数量达1000B(1万亿)

开源链接:

Hugging Face:https://huggingface.co/inclusionAI/Ring-1T-preview

魔搭社区:https://modelscope.cn/models?page=1&tabKey=task

该模型延续Ling 2.0的MoE架构,在20T高质量语料上完成预训练,结合此前公开的棒冰(icepop)方法,在自研开源高效强化学习系统ASystem上进行了针对推理能力的RLVR训练

在AIME 2025(美国数学邀请赛),Ring-1T通过纯自然语言推理即可取得92.6的高分,进一步逼近GPT-5 with thinking(no tools)的94.6水平。

此外,在哈佛-麻省理工数学竞赛HMMT 2025,竞赛级代码生成任务LiveCodeBench v6、CodeForces上,以及抽象推理基准ARC-AGI-1等任务中,Ring-1T均超越Gemini-2.5-pro和DeepSeek-V3.1-Terminus-Thinking

为了进一步探索Ring-1T早期版本的推理上限,研究团队将其接入多智能体框架AWorld,并在IMO 2025(国际数学奥林匹克竞赛)上进行了纯自然语言推理测试。

此前,Ring-flash-2.0在允许三次推理尝试的设定下,直到第三次才勉强解出第3题。相比之下,Ring-1T在本次测试中仅用一次推理就解出了第3题,并且在第1、2、4、5题上也能一次性给出部分正确答案。

百灵团队称Ring-1T仍在持续训练中,此次发布的预览版仍存在语种混杂、推理重复、身份认知错误等问题,希望通过开源社区的反馈,进一步完善Ring-1T的功能。

从今年3月到现在,蚂蚁一直在对百灵大模型进行迭代优化。3月,蚂蚁开源了两款MoE(混合专家)大语言模型Ling-Lite和Ling-Plus,并在4月发布了Ling-Lite的更新版本Ling-lite-0415。4月初,轻量级推理模型Ring-lite-distill-preview和混合线性长推理模型Ring-lite-linear-preview开源。

5月,蚂蚁发布了MoE架构的全模态大模型Ming-lite-omni-preview和Ming-lite-uni,并开源了统一多模态大模型Ming-lite-omni和Ling-lite-1.5

6月,在Ling-lite-1.5的基础上,蚂蚁发布了轻量级推理模型Ring-lite。7月,其发布了Ming-lite-omni v1.5Ring-lite-2507Ling-lite-1.5-2507

9月,蚂蚁开源语言模型Ling-mini-2.0,在此基础上推出了推理模型Ring-mini-2.0和轻量版Ling-flash-2.0以及思考模型Ring-flash-2.0

上周五,蚂蚁也才刚刚开源两款思考模型——Ring-flash-linear-2.0 与 Ring-mini-linear-2.0,还同步发布两大自研融合算子,即FP8融合算子线性Attention推理融合算子

结语:百灵大模型在复杂逻辑推理能力上下“狠功夫”

百灵大模型团队此次开源,是想要通过开放早期成果,汇聚社区智慧,对于Ring-1T进行“查漏补缺”。

从AIME到IMO国际顶级数学竞赛的初步测试表现来看,Ring-1T在复杂逻辑推理能力上进一步提升,正式版本的性能值得期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
站在中国领土,伊外长提一请求,不求军事援助,特朗普急喊话中国

站在中国领土,伊外长提一请求,不求军事援助,特朗普急喊话中国

近史谈
2026-05-07 23:06:13
38岁老板娘沦为陪睡工具:揭秘黑茶高端骗局,入局者10有9个离婚

38岁老板娘沦为陪睡工具:揭秘黑茶高端骗局,入局者10有9个离婚

云景侃记
2026-02-12 22:21:30
一个被低估的开源工具,正在吃掉PDF付费软件的市场

一个被低估的开源工具,正在吃掉PDF付费软件的市场

硬核玩家2哈
2026-05-06 21:39:21
一天中,最佳的性生活时间是在几点?早上好还是晚上好?出乎意料

一天中,最佳的性生活时间是在几点?早上好还是晚上好?出乎意料

医学原创故事会
2026-05-07 23:54:03
越南人去北京旅行,回国后摇头感叹:中国已经算是顶尖国家了~

越南人去北京旅行,回国后摇头感叹:中国已经算是顶尖国家了~

椰青美食分享
2026-05-02 18:45:09
“老师最烦这种现眼包家长”,宝妈穿紧身裙参加运动会,被嘲

“老师最烦这种现眼包家长”,宝妈穿紧身裙参加运动会,被嘲

番外行
2026-04-15 10:03:50
警惕:上了年纪再过性生活,最怕这2点!保护男性精气,做好4点

警惕:上了年纪再过性生活,最怕这2点!保护男性精气,做好4点

周哥一影视
2026-04-08 12:20:15
耻辱!拜仁出局头号罪人!他亲手毁掉欧冠翻盘希望

耻辱!拜仁出局头号罪人!他亲手毁掉欧冠翻盘希望

奶盖熊本熊
2026-05-07 05:34:03
两人毁了整部剧,一个全程瞪眼一个满脸疲态,难怪网友的弃剧一片

两人毁了整部剧,一个全程瞪眼一个满脸疲态,难怪网友的弃剧一片

洲洲影视娱评
2026-05-07 20:30:57
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

兴趣知识
2026-05-08 00:23:54
TVB女星突然宣布改名,网友好奇改姓原因!真实本名竟是陈晓华

TVB女星突然宣布改名,网友好奇改姓原因!真实本名竟是陈晓华

生命之泉的奥秘
2026-05-07 08:23:13
壮观!长剑-100列阵

壮观!长剑-100列阵

武器纵论
2026-05-05 17:01:40
台股收盘再创历史新高,年内累涨44.78%

台股收盘再创历史新高,年内累涨44.78%

财闻
2026-05-07 14:00:20
刚刚,段永平调仓了!买入这家公司

刚刚,段永平调仓了!买入这家公司

格隆汇
2026-05-07 13:55:05
夺冠仅1天,人民日报接连点名吴宜泽,释放3个强烈信号,字字珠玑

夺冠仅1天,人民日报接连点名吴宜泽,释放3个强烈信号,字字珠玑

寻墨阁
2026-05-06 06:33:51
疯了!乌杰里上任就出王炸!3笔交易赌未来,弗拉格有望复刻传奇

疯了!乌杰里上任就出王炸!3笔交易赌未来,弗拉格有望复刻传奇

梦忆之浅
2026-05-07 16:12:33
从印度来到中国旅游,白人夫妇一脸不屑,却在第一天就被完全震撼

从印度来到中国旅游,白人夫妇一脸不屑,却在第一天就被完全震撼

白云故事
2025-09-11 23:10:02
二手CD播放器涨到天价!闲鱼卖5999元,比当年全新还贵

二手CD播放器涨到天价!闲鱼卖5999元,比当年全新还贵

金科技观察家
2026-04-06 18:03:53
家里千万千万别放这些绿植啊!!!(保命必看)

家里千万千万别放这些绿植啊!!!(保命必看)

上观新闻
2026-05-07 19:14:14
2026-05-08 04:07:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11766文章数 117062关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

本地
手机
数码
亲子
公开课

本地新闻

用青花瓷的方式,打开西溪湿地

手机要闻

麒麟9050+双潜望+超声波指纹,华为Mate90 Pro Max迎重磅升级!

数码要闻

酷冷至尊elite 461系列机箱首发199元起:M-ATX海景房设计

亲子要闻

只祝她“母亲节快乐”是不够的

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版