网易首页 > 网易号 > 正文 申请入驻

蚂蚁通过(异构计算)优化训练 1 万亿 token:节省 127 万元

0
分享至

2025 年 3 月 24 日,《彭博社》报道, 蚂蚁集团使用国产半导体来开发用于训练 AI 模型的技术,有望将成本降低 20%。

蚂蚁集团使用国产芯片,采用“混合专家”机器学习方法训练模型。 其得到的结果与英伟达芯片(比如 H800)的结果相似。

蚂蚁集团仍在使用英伟达 GPU 进行 AI 开发,但现在其最新模型主要依赖替代芯片,包括来自 AMD 的芯片和国产芯片。

自从 DeepSeek 展示了如何以远低于 OpenAI 和谷歌数十亿美元的投入训练功能强大的模型以来,这场竞争愈演愈烈。

蚂蚁集团本月发表了一篇研究论文,声称其模型在某些基准测试中有时优于Meta Platforms。

混元(DeepSeek)对论文的解读:

蚂蚁集团大幅降低了推理或支持 AI 服务的成本。

随着诸多公司向 AI 领域投入大量资金,混合专家模型已成为一种流行的选择,因谷歌和 DeepSeek 等公司使用而获得了认可。这项技术将任务划分为更小的数据集,就像在一支专家团队中每个专家专注于工作的一部分,从而使整个过程更高效。蚂蚁在电子邮件声明中拒绝发表评论。

然而,混合专家模型的训练通常依赖高性能芯片,就像英伟达销售的 GPU。

蚂蚁集团一直在研究如何更有效地训练 LLM ,并克服这一限制。

论文标题明确了这一点,因为该公司设定的目标是“不使用高级 GPU”来扩展模型。

这与英伟达的思路背道而驰。

英伟达 CEO 黄仁勋认为,即使出现了像 DeepSeek 的 R1 这样更高效的模型,计算需求也会增长。他认为公司需要更好的芯片来创造更多收入,而不是需要更便宜的芯片来削减成本。他坚持奉行制造拥有更多处理核心、晶体管和更庞大内存容量的大型 GPU 这一策略。

蚂蚁集团表示,使用高性能硬件训练 1 万亿个 token 的成本约为 635 万元人民币(88 万美元),但其经过优化的方法使用低规格硬件就有望将这一成本降至 508 万元人民币。

token 是模型为了解世界并为用户查询提供实用响应而获取的信息单位。

蚂蚁集团计划利用其为工业 AI 解决方案(包括医疗和金融)开 发的大语言模型 : Ling-Plus 和 Ling-Lite 方 面 的最新突破。

蚂蚁集团今年收购了中国在线平台好大夫,以加强其在医疗保健领域的 AI 服务。它还有一款名为支小宝的 AI“生活助手”应用程序和金融咨询 AI 服务蚂小财。

蚂蚁集团在论文中表示,在英文理解方面,与 Meta 的 Llama 模型之一相比,Ling-Lite 模型在一项关键基准测试上表现更胜一筹。

Ling-Lite 模型和 Ling-Plus 模型在中文基准测试中均优于 DeepSeek 的同类模型。

蚂蚁集团已开放了 Ling 模型的源代码。

Ling - Lite 包含 168 亿个参数,这些参数是可调整的设置,就像旋钮和表盘一样,以控制模型的性能。

Ling-Plus 有 2900 亿个参数,在语言模型领域被认为比较大。

相比之下,据《麻省理工技术评论》报道,专家估计 ChatGPT 的 GPT-4.5 有 1.8 万亿个参数,DeepSeek-R1 则有 6710 亿个参数。

蚂蚁集团在模型训练的一些方面面临挑战,包括稳定性。

论文指出,哪怕硬件或模型结构的小小变化也会导致问题,包括模型错误率上升。

开源链接:https://huggingface.co/inclusionAI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
豪门悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇马2-1,利物浦3-1晋级八强

豪门悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇马2-1,利物浦3-1晋级八强

侧身凌空斩
2026-03-07 06:10:33
男子犯困开智驾,以100km/h速度扎进施工区:事故发生后未能及时接管车辆,连撞30米长水马都没停,视频曝光

男子犯困开智驾,以100km/h速度扎进施工区:事故发生后未能及时接管车辆,连撞30米长水马都没停,视频曝光

大风新闻
2026-03-07 10:05:02
伊拉克库尔德第一夫人宣言:我们不是任人驱使的炮灰!

伊拉克库尔德第一夫人宣言:我们不是任人驱使的炮灰!

胜研集
2026-03-06 13:44:23
项立刚质问莫言不为伊朗儿童说话,项立刚为中国患儿捐款了吗?

项立刚质问莫言不为伊朗儿童说话,项立刚为中国患儿捐款了吗?

书写者
2026-03-06 19:33:38
王茜四字回应《重案六组》翻拍,这大概是内娱,挨过最狠的打脸了

王茜四字回应《重案六组》翻拍,这大概是内娱,挨过最狠的打脸了

娱文速递
2026-03-06 17:32:29
中国造红旗导弹被击毁!

中国造红旗导弹被击毁!

烽火观天下
2026-03-06 20:23:13
唏嘘!昔日状元富尔茨被G联赛球队认领 若表现出色有望加盟猛龙

唏嘘!昔日状元富尔茨被G联赛球队认领 若表现出色有望加盟猛龙

罗说NBA
2026-03-07 05:32:11
特朗普:要“让伊朗再次伟大!”伊朗大使:决不投降

特朗普:要“让伊朗再次伟大!”伊朗大使:决不投降

上观新闻
2026-03-07 09:17:06
特朗普大祸临头!伊朗已公开放话,全球将变得更混乱?

特朗普大祸临头!伊朗已公开放话,全球将变得更混乱?

毛豆论道
2026-03-06 18:26:34
直接承认抄袭!长城汽车董事长道歉,魏建军低头认错没甩锅

直接承认抄袭!长城汽车董事长道歉,魏建军低头认错没甩锅

商悟社
2026-03-06 22:02:03
乌克兰被曝正帮美国对抗伊朗无人机,泽连斯基:已收到美国请求!专家:一架无人机3万多美元,一枚拦截导弹上百万美元,“完全不可持续”

乌克兰被曝正帮美国对抗伊朗无人机,泽连斯基:已收到美国请求!专家:一架无人机3万多美元,一枚拦截导弹上百万美元,“完全不可持续”

每日经济新闻
2026-03-07 01:03:56
办事大厅收材料的人,半年都能收1600多万 省委书记怒了:“吃拿卡要、损害企业利益的,迟早都会被查处”

办事大厅收材料的人,半年都能收1600多万 省委书记怒了:“吃拿卡要、损害企业利益的,迟早都会被查处”

大风新闻
2026-03-06 16:46:09
萝莉岛,是进入核心圈层的投名状,你猜他们为什么都穿红皮鞋

萝莉岛,是进入核心圈层的投名状,你猜他们为什么都穿红皮鞋

百晓生谈历史
2026-03-05 22:00:08
从巴拿马到马杜罗、哈梅内伊,再到古巴,川普正在强力改变世界

从巴拿马到马杜罗、哈梅内伊,再到古巴,川普正在强力改变世界

壹家言
2026-03-06 09:07:17
意外!姜至鹏红牌属于误判?权威结论来了,生日夜染红引发热议

意外!姜至鹏红牌属于误判?权威结论来了,生日夜染红引发热议

罗掌柜体育
2026-03-07 06:00:06
戏子当道,是央国企管理中的一大痛点

戏子当道,是央国企管理中的一大痛点

细说职场
2026-03-06 20:01:27
女子退婚不退彩礼,男子将硫酸倒进小舅子嘴里,让他用彩礼钱整容

女子退婚不退彩礼,男子将硫酸倒进小舅子嘴里,让他用彩礼钱整容

阅微札记
2026-03-06 11:40:57
广东一女子不愿上班常年坐街边,因长得好看被路人投喂:又懒又馋

广东一女子不愿上班常年坐街边,因长得好看被路人投喂:又懒又馋

明智家庭教育
2026-03-06 17:19:16
中东打仗,驻韩美军异动?

中东打仗,驻韩美军异动?

新民周刊
2026-03-07 09:17:30
大量滞留在迪拜的黄金,正折价出售

大量滞留在迪拜的黄金,正折价出售

中国能源网
2026-03-07 09:15:13
2026-03-07 10:59:00
云头条 incentive-icons
云头条
引领科技变革,连接技术与商业。
19034文章数 27290关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

媒体:美国打仗遇到人口3000万以上国家就没法全身而退

头条要闻

媒体:美国打仗遇到人口3000万以上国家就没法全身而退

体育要闻

中国象棋,正在被一个越南人攻陷?

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

房产
游戏
本地
公开课
军事航空

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

《丧尸交易所》登陆Steam 僵尸末世商店经营战斗

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:使用无人机击中美军"林肯"号航母

无障碍浏览 进入关怀版