网易首页 > 网易号 > 正文 申请入驻

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

0
分享至

李彦宏有些无奈。

“过去,AI产业结构像一个正金字塔,最底层的芯片拿到了绝大部分的价值;芯片之上的模型,赚到的钱可能不到芯片的1/10;模型之上的AI应用,又小了一个数量级。”在百度世界大会上,百度创始人李彦宏说道,“这个产业结构是非常不健康的,是不可持续的,因为芯片并不直接产生价值,应用才能够产生价值。”

但更无奈的是,在当前的宏观和产业环境下,要打破这种倒挂结构,要赚模型层或者应用层十倍以及百倍的价值,最好的办法就是把芯片层重新掌握在自己手里。

百度不得不自研芯片。在英伟达的“芯片铁幕”之下,这不是百度一家公司面临的问题,无论是海外厂商如亚马逊、微软、谷歌以及OpenAI,还是国内企业如阿里、华为、腾讯,都不得不启动自研芯片战略。

百度的昆仑芯团队成立于2011年,很早就参与到了AI计算产业的新周期,在大模型时代有了极大的加速,从早年的AlexNet以及更早的语音识别模型,开始用FPGA做计算加速,再到后来的大型推荐系统流行,昆仑芯开始自己做芯片。

2021年,昆仑芯从百度集团拆分,也赶上了大模型萌芽阶段,着手定义面向大模型的新一代芯片,譬如P800。

本次大会上,百度智能云事业群总裁沈抖公布了两款自研AI芯片,昆仑芯M100和M300,以及天池256和512超节点的相关规划。


大模型之后,芯片更简单还是更难?

以前芯片厂商需要面对不同场景、不同数据、不同算法以及不同应用,很难形成规模和系统的迭代。

Transformer的出现统一了模型架构,把输入输出都统一成Token,统一的框架也带来了计算架构的统一,芯片厂商在做芯片时,可以有非常明确的目标,实现极致的性能,并且可以充分利用整个产业链的供给能力,实现更低让成本做的非常低,更好的计算芯片直接推动应用发展,应用繁荣又能够给计算芯片带来更大的规模,产业由此进入正循环。

新技术带来产业的新变化,从技术可行到产业可行,某种程度而言,做一个为当前大模型定向优化的芯片更容易了。

但是,新的挑战在于技术没有边界,应用也没有边界,所有做算力的团队都无法百分百确定,未来大模型乃至AI产业会朝着什么方向发展,典型如Scaling Law,模型参数从百亿、千亿到万亿级模型,大幅推高算力、能源、基础设施成本,应用的生长也几乎不可预测,

这也意味着,面向未来而做的芯片变得更难了。虽然无法精准预测未来,至少可以确定大方向,算力最终绕不开两个根本问题:效率问题与规模问题。

随着大模型应用全面渗透,人均每天的 Token 消耗动辄数万甚至百万级,几年前一张 GPU 每秒只能处理十几个 Token,现在行业都在追求从算力卡中榨出更多的tokens,直接关乎最企业终的竞争力。

例如降低计算精度:从 BF16 到 FP8、FP4,通过牺牲冗余精度换取数倍算力提升,每一次精度下降,对应算力倍数提升;再如,模型训练方式在变,芯片架构也必须跟着变,不断针对模型架构上优化整个芯片的PPA。

如今做芯片,已经不能只做芯片,系统才是把算力真正释放出来的关键环节,超节点就是一个实证。超节点不是新概念,但在大模型时代终于找到了“刚需场景”。服务器内联数十甚至上百张卡,再到未来的千节点互联,相比单机单卡,这类系统能带来量级上的成本下降。

效率问题人人都能理解,而规模问题只有足够大的规模才能真正感受到。从千卡到几万卡,再到未来可能出现的百万卡集群,系统会在某些阈值上发生“质变”,成百上千的隐性问题会同时涌现。

例如稳定性急剧下降,在千卡规模下,98%的稳定性还能接受;但到了万卡,这个数字会指数式下跌,任何节点的波动都会被放大成系统级故障。训练的精度也难以保障,大量微小差异会在长时间训练后,可能累积成最终精度的大幅偏差,而这样的验证往往需要 2~3 个月,是极其昂贵的学习成本。

当 AI 应用以指数方式增长,算力不再是简单的“堆卡”,而是站上了一条新的工程学和科学探索路线。

昆仑芯的路线

过去几年,昆仑芯已经量产了三代,第一代更多部署在百度内部的数据中心,第二代开始面向市场全面开放,如今已有大量企业用户在大规模使用,第三代则赶上了大模型时代的浪潮,无论推理还是训练,都在互联网、运营商、金融、能源等行业得到了广泛落地。

据悉,目前百度内部绝大多数的大模型推理任务,都由昆仑芯P800支持,百度还基于P800的5000卡单一集群,高性价比地训练出了领先的多模态模型,目前该训练集群已经扩展到万卡以上,可用于训练更大规模的模型。

在本次大会上,M100 与 M300 系列正式亮相。M100针对大规模推理场景做了优化,同时也是一颗全能型芯片,MoE模型的推理性能大幅提升,将在2026年初正式上市。

M300 定位高端,兼具强推理与强训练能力,针对超大规模的多模态模型的训练和推理任务做了深入优化,将于2027年初正式上市。

昆仑芯的软件栈高度兼容主流 CUDA 生态,从编程语法到深度学习框架,都能无缝适配。据透露,昆仑芯的客户不局限于互联网产业,从电信运营商的核心系统,再到能源、电力、金融等行业,都已经有落地项目。

不止是在百度内部广泛使用,昆仑芯也在互联网、金融、能源、制造、交通和教育等多个行业落地,包括招商银行、南方电网、中国钢研、国家管网、吉利汽车以及国内头部互联网大厂和运营商等上百家客户,交付规模从几十卡到数万卡。

沈抖现场也表示, 单芯片的强大是基础条件,现在的大模型训练和推理都不是一颗芯片能完成的,而是多颗芯片协同工作,尤其在MoE模型上,卡与卡之间的通信量急剧增加,需要把几十张、上百张卡组成一个超节点,让它们像“一颗超级芯片”一样紧密连接,大幅提升卡间通信效率。

“超节点”方案非常考验AI infra厂商在芯片、内存、通信、供电、冷却上的全栈协同能力。

2025年4月,百度基于昆仑芯P800上市了32卡和64卡的超节点,在现有超节点的基础上,天池256将256张P800放到同一个节点内,相比4月发布的超节点,单实例的卡间互联总带宽提升4倍,性能提升50%以上。

对比同等卡数的P800集群,天池256超节点在主流大模型的推理任务上,单卡吞吐提升超过3.5倍。

天池512同样基于P800,它在天池256基础上,卡数翻倍,卡间互联总带宽也再翻一倍,单个天池512超节点,就能完成万亿参数模型的训练,这两款超节点产品,将分别在明年上半年和下半年正式上市。

另外,百度也在基于新发布的昆仑芯M系列研发千卡级别的超节点,从27年下半年开始,将陆续推出相应的千卡、四千卡超节点。“未来5年,昆仑芯每年都会推出新产品”,沈抖表示。 (本文作者 | 张帅,编辑 | 盖虹达)

更多对全球市场、跨国公司和中国经济的深度分析与独家洞察,欢迎访问 Barron's巴伦中文网官方网站

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曝穆帅与曼联闹翻根源!博格巴并非罪魁,格雷泽强留一人引爆矛盾

曝穆帅与曼联闹翻根源!博格巴并非罪魁,格雷泽强留一人引爆矛盾

罗米的曼联博客
2025-12-16 13:36:44
失地不收是高明之策?被强占60年的藏南,已成印度摆脱不了的噩梦

失地不收是高明之策?被强占60年的藏南,已成印度摆脱不了的噩梦

我心纵横天地间
2025-12-15 16:44:20
原来有这么多不体面但挣钱的小生意!原来都是闷声发大财啊!

原来有这么多不体面但挣钱的小生意!原来都是闷声发大财啊!

另子维爱读史
2025-12-06 22:09:07
乒乓总决赛结束,女单世界最新排名,王曼昱蒯曼排名更新

乒乓总决赛结束,女单世界最新排名,王曼昱蒯曼排名更新

吴蛛旅行ing
2025-12-16 06:05:15
穆里尼奥让17岁小孩,三天在欧冠和联赛首秀,至于22岁,抱歉老了

穆里尼奥让17岁小孩,三天在欧冠和联赛首秀,至于22岁,抱歉老了

穆里尼奥主义者
2025-12-16 16:44:00
笑喷了!妈妈从未怀疑过自己的手艺!网友:全天下最统一的自信!

笑喷了!妈妈从未怀疑过自己的手艺!网友:全天下最统一的自信!

墙头草
2025-12-16 07:49:47
三连败 + 0:3 横扫!王楠女儿遇 “小魔王”,这是国乒未来宿敌?

三连败 + 0:3 横扫!王楠女儿遇 “小魔王”,这是国乒未来宿敌?

阿晞体育
2025-12-16 09:29:19
广州街头又出现这种骗局!很多街坊吃大亏!

广州街头又出现这种骗局!很多街坊吃大亏!

广州生活美食圈
2025-12-16 11:32:21
歌手黄绮珊发文悼念何晴,两人为多年好友,何晴曾劝黄绮珊不要整容

歌手黄绮珊发文悼念何晴,两人为多年好友,何晴曾劝黄绮珊不要整容

潇湘晨报
2025-12-15 10:58:15
玛莎拉蒂直降54万!上海门店两天售罄,开店九年头一次

玛莎拉蒂直降54万!上海门店两天售罄,开店九年头一次

齐鲁壹点
2025-12-15 22:29:12
2003年,陈赓之子升官之际接到威胁电话:想升官先拿200万疏通费

2003年,陈赓之子升官之际接到威胁电话:想升官先拿200万疏通费

纪实文录
2025-05-08 16:55:52
江青保健医生的难言之隐:一日7顿饭,吃饭不敢出声,顿顿吃豆腐

江青保健医生的难言之隐:一日7顿饭,吃饭不敢出声,顿顿吃豆腐

春秋砚
2025-12-06 15:45:09
一个都跑不掉!华为600万年薪高管,带13人偷芯片,如今下场解气

一个都跑不掉!华为600万年薪高管,带13人偷芯片,如今下场解气

涵豆说娱
2025-11-07 17:47:01
拉姆塞:我的合同被美洲狮终止了,这令我感到意外且失望

拉姆塞:我的合同被美洲狮终止了,这令我感到意外且失望

懂球帝
2025-12-16 10:10:16
全线大跌!超19万人爆仓!

全线大跌!超19万人爆仓!

新浪财经
2025-12-16 20:27:04
越南实施“重整江山”改革,公务员已裁减2万人,7000多乡坊撤销

越南实施“重整江山”改革,公务员已裁减2万人,7000多乡坊撤销

环球热点快评
2025-12-16 16:29:23
放假通知!2026中小学寒假时间确定!家长直呼:托管难求,咋办?

放假通知!2026中小学寒假时间确定!家长直呼:托管难求,咋办?

复转这些年
2025-12-16 09:30:01
全球英语能力排名:韩国48位、日本96位、中国呢?

全球英语能力排名:韩国48位、日本96位、中国呢?

随波荡漾的漂流瓶
2025-12-16 17:20:06
何晴儿子回忆妈妈10年抗癌路!2015年频繁头疼,去世前昏迷了很久

何晴儿子回忆妈妈10年抗癌路!2015年频繁头疼,去世前昏迷了很久

李健政观察
2025-12-15 22:49:51
中国曝光关键武器,美俄都没攻克的世界难题,被中国80岁老头拿下

中国曝光关键武器,美俄都没攻克的世界难题,被中国80岁老头拿下

梦史
2025-12-16 11:36:51
2025-12-16 21:08:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
127655文章数 861484关注度
往期回顾 全部

科技要闻

马斯克彻底放手!特斯拉股价一夜狂欢

头条要闻

日本民众看大熊猫每个参观点限停1分钟 官网一度崩溃

头条要闻

日本民众看大熊猫每个参观点限停1分钟 官网一度崩溃

体育要闻

杨瀚森18+10首次两双 关键攻防统治G联赛

娱乐要闻

《双轨》遭网友举报,称剧情三观不正

财经要闻

浙金中心暴雷始末:祥源控股设计的骗局?

汽车要闻

打造全域安全2.0,吉利的新“长征”

态度原创

本地
游戏
艺术
教育
家居

本地新闻

云游安徽|寻迹六安,三处旧址回望烽火岁月

真·出洋相!被魔兽国服嫌弃的时光服,反成了老外主播的流量密码

艺术要闻

16位画家17幅静物花卉,你喜欢哪位的呢?

教育要闻

有人当面指责你的孩子,高情商爸妈这样做

家居要闻

温馨独栋 驼色与浅色碰撞

无障碍浏览 进入关怀版