网易首页 > 网易号 > 正文 申请入驻

蚂蚁发布万亿参数旗舰模型 Ling-1T并开源

0
分享至

【TechWeb】10月9日消息,今天凌晨,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现。另外,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T 均取得领先成绩,多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。Ling-1T用更少的Token实现了更高的准确率,展现出在推理精度和思考效率综合能力上的优势。

据蚂蚁百灵团队透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)提升模型高效思考和精准推理能力。

值得一提的是,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和15%+ 的端到端加速。

在强化学习阶段,蚂蚁百灵团队创提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准的对齐。

另外,蚂蚁百灵团队提出了“语法-功能-美学”的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上,Ling-1T 得分59.31,在可视化和前端开发任务领域,仅次于Gemini-2.5-Pro-lowthink的得分60.28。

据了解,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。目前,开发者通过Hugging Face和蚂蚁百宝箱等平台都可以体验Ling-1T模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在车站见到妈妈,妈妈一激动对着孩子喊出了猫的名字,网友:一些养宠后遗症

在车站见到妈妈,妈妈一激动对着孩子喊出了猫的名字,网友:一些养宠后遗症

拜见喵主子
2026-05-08 11:24:51
碳酸钠与碳酸氢钠:性质、用途及区别

碳酸钠与碳酸氢钠:性质、用途及区别

宗老师化学知识学习
2026-04-29 10:08:00
小姐姐穿着黑丝和高跟鞋翘着二郎腿坐在沙发上的样子太有女人味了

小姐姐穿着黑丝和高跟鞋翘着二郎腿坐在沙发上的样子太有女人味了

牛弹琴123456
2026-04-30 10:35:26
他,扛起又一个任正非时刻!

他,扛起又一个任正非时刻!

华商韬略
2026-05-09 10:32:50
北京部分地区有雷阵雨+冰雹!明日气温或创今年新高,今夏会特别热吗?

北京部分地区有雷阵雨+冰雹!明日气温或创今年新高,今夏会特别热吗?

新浪财经
2026-05-10 03:56:54
举报一个查一个!耿同学举报3位大学院长和教授,同济院长被免职还差南开和中山

举报一个查一个!耿同学举报3位大学院长和教授,同济院长被免职还差南开和中山

可达鸭面面观
2026-05-07 13:03:19
37岁杨颖杂志照让人心酸,眼神散了资源跌了,从顶流到不敢认

37岁杨颖杂志照让人心酸,眼神散了资源跌了,从顶流到不敢认

童叔不飙车
2026-05-09 21:24:53
一人一方,定制免疫!中国首款mRNA癌症疫苗落地,11大癌种可申请

一人一方,定制免疫!中国首款mRNA癌症疫苗落地,11大癌种可申请

无癌家园i
2026-05-09 15:12:40
58岁大姐每天吃一把南瓜子,半年后去体检,医生问吃了啥?

58岁大姐每天吃一把南瓜子,半年后去体检,医生问吃了啥?

健康之光
2026-05-07 17:45:07
2003年,陈小春张柏芝两人同游曼谷,游泳池旁张柏芝穿着比基尼

2003年,陈小春张柏芝两人同游曼谷,游泳池旁张柏芝穿着比基尼

可乐谈情感
2026-05-10 03:45:13
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
为什么新冠阳过以后,大部分人查出肺结节?为你揭开真相!

为什么新冠阳过以后,大部分人查出肺结节?为你揭开真相!

健康之光
2026-05-10 06:30:08
100 日元兑 4.33 元:日本用三十年,把自己熬成了 “廉价国家”

100 日元兑 4.33 元:日本用三十年,把自己熬成了 “廉价国家”

深析古今
2026-03-31 10:10:57
“天花板级好儿媳”钱天一,退役后把球馆开在王昶家乡照顾婆婆

“天花板级好儿媳”钱天一,退役后把球馆开在王昶家乡照顾婆婆

手工制作阿歼
2026-05-10 04:33:51
一句“别染发”上热搜,染发产品成抽检不合规榜单“常客”

一句“别染发”上热搜,染发产品成抽检不合规榜单“常客”

新京报
2026-05-08 16:20:47
狗子脖子被水壶套住,这样生活了四年?!都快嵌进肉里,终于取下来了...

狗子脖子被水壶套住,这样生活了四年?!都快嵌进肉里,终于取下来了...

英国那些事儿
2026-05-08 23:22:11
陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

就一点
2026-04-29 17:28:35
海关总署:前4个月我国货物贸易进出口总值增长14.9% 外贸延续良好增长态势

海关总署:前4个月我国货物贸易进出口总值增长14.9% 外贸延续良好增长态势

财联社
2026-05-09 10:57:06
皇马的内鬼就是他!高层怀疑索拉里泄密,他的处境变得尴尬

皇马的内鬼就是他!高层怀疑索拉里泄密,他的处境变得尴尬

懂个球
2026-05-09 15:31:10
投资31亿!京东深圳总部大楼封顶

投资31亿!京东深圳总部大楼封顶

GA环球建筑
2026-05-09 23:30:48
2026-05-10 09:40:49
TechWeb incentive-icons
TechWeb
做有态度的互联网资讯。
17719文章数 43092关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

牛弹琴:74岁法国政坛老将对华清醒表态 让人刮目相看

头条要闻

牛弹琴:74岁法国政坛老将对华清醒表态 让人刮目相看

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出!

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

家居
手机
亲子
公开课
军事航空

家居要闻

菁英人居 全能豪宅

手机要闻

iQOO 15T首发天玑9500特别版:实测帧率无敌 稳如泰山

亲子要闻

自己就给自己确诊了!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版