网易首页 > 网易号 > 正文 申请入驻

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

0
分享至

李彦宏有些无奈。

“过去,AI产业结构像一个正金字塔,最底层的芯片拿到了绝大部分的价值;芯片之上的模型,赚到的钱可能不到芯片的1/10;模型之上的AI应用,又小了一个数量级。”在百度世界大会上,百度创始人李彦宏说道,“这个产业结构是非常不健康的,是不可持续的,因为芯片并不直接产生价值,应用才能够产生价值。”

但更无奈的是,在当前的宏观和产业环境下,要打破这种倒挂结构,要赚模型层或者应用层十倍以及百倍的价值,最好的办法就是把芯片层重新掌握在自己手里。

百度不得不自研芯片。在英伟达的“芯片铁幕”之下,这不是百度一家公司面临的问题,无论是海外厂商如亚马逊、微软、谷歌以及OpenAI,还是国内企业如阿里、华为、腾讯,都不得不启动自研芯片战略。

百度的昆仑芯团队成立于2011年,很早就参与到了AI计算产业的新周期,在大模型时代有了极大的加速,从早年的AlexNet以及更早的语音识别模型,开始用FPGA做计算加速,再到后来的大型推荐系统流行,昆仑芯开始自己做芯片。

2021年,昆仑芯从百度集团拆分,也赶上了大模型萌芽阶段,着手定义面向大模型的新一代芯片,譬如P800。

本次大会上,百度智能云事业群总裁沈抖公布了两款自研AI芯片,昆仑芯M100和M300,以及天池256和512超节点的相关规划。


大模型之后,芯片更简单还是更难?

以前芯片厂商需要面对不同场景、不同数据、不同算法以及不同应用,很难形成规模和系统的迭代。

Transformer的出现统一了模型架构,把输入输出都统一成Token,统一的框架也带来了计算架构的统一,芯片厂商在做芯片时,可以有非常明确的目标,实现极致的性能,并且可以充分利用整个产业链的供给能力,实现更低让成本做的非常低,更好的计算芯片直接推动应用发展,应用繁荣又能够给计算芯片带来更大的规模,产业由此进入正循环。

新技术带来产业的新变化,从技术可行到产业可行,某种程度而言,做一个为当前大模型定向优化的芯片更容易了。

但是,新的挑战在于技术没有边界,应用也没有边界,所有做算力的团队都无法百分百确定,未来大模型乃至AI产业会朝着什么方向发展,典型如Scaling Law,模型参数从百亿、千亿到万亿级模型,大幅推高算力、能源、基础设施成本,应用的生长也几乎不可预测,

这也意味着,面向未来而做的芯片变得更难了。虽然无法精准预测未来,至少可以确定大方向,算力最终绕不开两个根本问题:效率问题与规模问题。

随着大模型应用全面渗透,人均每天的 Token 消耗动辄数万甚至百万级,几年前一张 GPU 每秒只能处理十几个 Token,现在行业都在追求从算力卡中榨出更多的tokens,直接关乎最企业终的竞争力。

例如降低计算精度:从 BF16 到 FP8、FP4,通过牺牲冗余精度换取数倍算力提升,每一次精度下降,对应算力倍数提升;再如,模型训练方式在变,芯片架构也必须跟着变,不断针对模型架构上优化整个芯片的PPA。

如今做芯片,已经不能只做芯片,系统才是把算力真正释放出来的关键环节,超节点就是一个实证。超节点不是新概念,但在大模型时代终于找到了“刚需场景”。服务器内联数十甚至上百张卡,再到未来的千节点互联,相比单机单卡,这类系统能带来量级上的成本下降。

效率问题人人都能理解,而规模问题只有足够大的规模才能真正感受到。从千卡到几万卡,再到未来可能出现的百万卡集群,系统会在某些阈值上发生“质变”,成百上千的隐性问题会同时涌现。

例如稳定性急剧下降,在千卡规模下,98%的稳定性还能接受;但到了万卡,这个数字会指数式下跌,任何节点的波动都会被放大成系统级故障。训练的精度也难以保障,大量微小差异会在长时间训练后,可能累积成最终精度的大幅偏差,而这样的验证往往需要 2~3 个月,是极其昂贵的学习成本。

当 AI 应用以指数方式增长,算力不再是简单的“堆卡”,而是站上了一条新的工程学和科学探索路线。

昆仑芯的路线

过去几年,昆仑芯已经量产了三代,第一代更多部署在百度内部的数据中心,第二代开始面向市场全面开放,如今已有大量企业用户在大规模使用,第三代则赶上了大模型时代的浪潮,无论推理还是训练,都在互联网、运营商、金融、能源等行业得到了广泛落地。

据悉,目前百度内部绝大多数的大模型推理任务,都由昆仑芯P800支持,百度还基于P800的5000卡单一集群,高性价比地训练出了领先的多模态模型,目前该训练集群已经扩展到万卡以上,可用于训练更大规模的模型。

在本次大会上,M100 与 M300 系列正式亮相。M100针对大规模推理场景做了优化,同时也是一颗全能型芯片,MoE模型的推理性能大幅提升,将在2026年初正式上市。

M300 定位高端,兼具强推理与强训练能力,针对超大规模的多模态模型的训练和推理任务做了深入优化,将于2027年初正式上市。

昆仑芯的软件栈高度兼容主流 CUDA 生态,从编程语法到深度学习框架,都能无缝适配。据透露,昆仑芯的客户不局限于互联网产业,从电信运营商的核心系统,再到能源、电力、金融等行业,都已经有落地项目。

不止是在百度内部广泛使用,昆仑芯也在互联网、金融、能源、制造、交通和教育等多个行业落地,包括招商银行、南方电网、中国钢研、国家管网、吉利汽车以及国内头部互联网大厂和运营商等上百家客户,交付规模从几十卡到数万卡。

沈抖现场也表示, 单芯片的强大是基础条件,现在的大模型训练和推理都不是一颗芯片能完成的,而是多颗芯片协同工作,尤其在MoE模型上,卡与卡之间的通信量急剧增加,需要把几十张、上百张卡组成一个超节点,让它们像“一颗超级芯片”一样紧密连接,大幅提升卡间通信效率。

“超节点”方案非常考验AI infra厂商在芯片、内存、通信、供电、冷却上的全栈协同能力。

2025年4月,百度基于昆仑芯P800上市了32卡和64卡的超节点,在现有超节点的基础上,天池256将256张P800放到同一个节点内,相比4月发布的超节点,单实例的卡间互联总带宽提升4倍,性能提升50%以上。

对比同等卡数的P800集群,天池256超节点在主流大模型的推理任务上,单卡吞吐提升超过3.5倍。

天池512同样基于P800,它在天池256基础上,卡数翻倍,卡间互联总带宽也再翻一倍,单个天池512超节点,就能完成万亿参数模型的训练,这两款超节点产品,将分别在明年上半年和下半年正式上市。

另外,百度也在基于新发布的昆仑芯M系列研发千卡级别的超节点,从27年下半年开始,将陆续推出相应的千卡、四千卡超节点。“未来5年,昆仑芯每年都会推出新产品”,沈抖表示。 (本文作者 张帅,编辑 盖虹达)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国王归来!詹姆斯预计今日赛季首秀战爵士:开启第23季成历史首人

国王归来!詹姆斯预计今日赛季首秀战爵士:开启第23季成历史首人

罗说NBA
2025-11-19 05:38:30
宁波医院院长被死亡女婴家属围堵,现场回应耐人寻味!舆论两边倒

宁波医院院长被死亡女婴家属围堵,现场回应耐人寻味!舆论两边倒

爱写的樱桃
2025-11-18 19:17:04
詹姆斯不会出战2028年奥运!库里参赛可能也极低 美媒预测新成员

詹姆斯不会出战2028年奥运!库里参赛可能也极低 美媒预测新成员

罗说NBA
2025-11-19 05:44:17
随着韩国1-0越南,熊猫杯最终积分榜:国足屈居亚军,汪士钦染红

随着韩国1-0越南,熊猫杯最终积分榜:国足屈居亚军,汪士钦染红

侃球熊弟
2025-11-18 17:26:04
妻子与朋友存在不正当两性关系,丈夫驾车撞向男方致死被判死缓,上诉被驳回

妻子与朋友存在不正当两性关系,丈夫驾车撞向男方致死被判死缓,上诉被驳回

红星新闻
2025-11-18 16:27:27
摇晃了几下,突然爆炸!很多广东人家里都有……

摇晃了几下,突然爆炸!很多广东人家里都有……

深圳晚报
2025-11-18 21:59:44
85比78爆冷夺冠!广东男篮狂揽6枚金牌:杜锋早已笑得合不拢嘴?

85比78爆冷夺冠!广东男篮狂揽6枚金牌:杜锋早已笑得合不拢嘴?

篮球快餐车
2025-11-19 06:48:36
甲流杀疯了!中年扛5天丢命,医生喊停3种饭,做好2件事能救命

甲流杀疯了!中年扛5天丢命,医生喊停3种饭,做好2件事能救命

荷兰豆爱健康
2025-11-18 07:03:47
16名台湾游客点披萨被骂“狗屎中国人”!市政府“灭火”

16名台湾游客点披萨被骂“狗屎中国人”!市政府“灭火”

意烩
2025-11-18 01:35:04
喻恩泰好友反击了!爆料史林子多次偷情出轨,并曝出露骨聊天截图

喻恩泰好友反击了!爆料史林子多次偷情出轨,并曝出露骨聊天截图

萌神木木
2025-11-18 19:36:17
省会城市政府主要领导密集调整

省会城市政府主要领导密集调整

鲁中晨报
2025-11-18 22:35:05
上海赴日男子在日媒前声称,不在乎政府的呼吁,花钱是自己的自由

上海赴日男子在日媒前声称,不在乎政府的呼吁,花钱是自己的自由

我心纵横天地间
2025-11-18 19:01:13
勇士又把文班亚马“废了”,这下马刺百分百跌出季后赛资格区…!

勇士又把文班亚马“废了”,这下马刺百分百跌出季后赛资格区…!

田先生篮球
2025-11-18 22:32:34
终于明白为什么有些App打死都不适配鸿蒙系统了!

终于明白为什么有些App打死都不适配鸿蒙系统了!

大白聊IT
2025-11-18 17:18:04
近一年5.1万家咖啡店倒闭!刚入冬就有大批门店“阵亡”

近一年5.1万家咖啡店倒闭!刚入冬就有大批门店“阵亡”

赢商网新媒体
2025-11-18 21:19:09
几十万香港人到广东买社保医保!参保人:月交898元,退休后领4年就能回本;公立医疗排队动辄两三年,自费比内地贵几倍

几十万香港人到广东买社保医保!参保人:月交898元,退休后领4年就能回本;公立医疗排队动辄两三年,自费比内地贵几倍

每日经济新闻
2025-11-18 23:38:06
马斯克透露:特斯拉不玩特权这套,职场无阶级,吃饭停车完全平等!网友:这样老板赚得更多

马斯克透露:特斯拉不玩特权这套,职场无阶级,吃饭停车完全平等!网友:这样老板赚得更多

大白聊IT
2025-11-18 17:17:40
特朗普:美国当年“愚蠢地”放手,导致台湾现在生产了几乎100%的芯片,太丢脸了

特朗普:美国当年“愚蠢地”放手,导致台湾现在生产了几乎100%的芯片,太丢脸了

极目新闻
2025-11-18 22:18:48
中方代表:日本毫无资格要求成为安理会常任理事国

中方代表:日本毫无资格要求成为安理会常任理事国

国际在线
2025-11-19 07:07:07
江苏科技大学博导郭某涉嫌学术造假、侵占国家科研经费等被带走调查,简历多处与事实不符,校方回应:已离职

江苏科技大学博导郭某涉嫌学术造假、侵占国家科研经费等被带走调查,简历多处与事实不符,校方回应:已离职

新浪财经
2025-11-18 20:21:02
2025-11-19 09:55:00
Barrons巴伦
Barrons巴伦
Barron’s,《巴伦周刊》官方中文平台,这里有全球资本市场前沿资讯、金融分析、市场洞察和行业解读
399文章数 13关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

南部空军发布"别太狂":我和战机凌空一击 将它"干掉"

头条要闻

南部空军发布"别太狂":我和战机凌空一击 将它"干掉"

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

大规模宕机!美国多个网站崩了

汽车要闻

脱胎换骨的优秀底盘Get 新款享界S9动态驾驶体验

态度原创

教育
时尚
数码
家居
游戏

教育要闻

孩子的英语学习

拍照不用露脸也很美!4个心机pose学起来,朋友圈狂收赞

数码要闻

华为二合一平板电脑MatePad Edge官宣 25日下午发布

家居要闻

彰显奢华 意式经典风格

《湮灭之潮》新内容预热 将在Xbox发布会亮相

无障碍浏览 进入关怀版