今年夏天黄仁勋穿着皮衣落地北京那事儿,当时科技圈都炸了,他带来了H20芯片,说这是专门给中国市场做的“特供款”,算是“解禁”的信号。
结果刚入秋,9月份就变天了,先是有人说H20有“后门”,不安全还不够先进,市场没人愿意买,接着就传要停产。
英伟达想重回中国市场的路,这下走得磕磕绊绊,黄仁勋后来接受采访时说“中国AI芯片只落后几纳秒,不是两三年”,这话听着有点急。
毕竟英伟达在中国的营收掉得厉害,今年二季度才27.69亿美元,比去年同期少了快四分之一,去年全年还赚了171亿呢。
更可惜的是,他们自己预测今年中国市场有500亿商机,现在H20停了,新计划的B30A还没影,三季度业绩测算里都没算H20对华出口的情况,这空窗期可不就给别人留了位置?
英伟达“掉链子”,国产芯片刚好“接活儿”
本来大家买算力芯片,第一反应都是选英伟达,毕竟这些年生成式AI火起来,英伟达GPU性能强、驱动稳,还有个CUDA生态跟“护城河”似的。
去年全球智算中心GPU卖了385万颗,英伟达占了快98%,说是垄断也不为过。
但现在情况不一样了,国外大厂一边买英伟达一边自己造芯,国内因为政策拿不到先进芯片,只能找替代。
而英伟达留下的市场空间,足够国产厂商好好拼一把,就说寒武纪吧,今年上半年收入28.81亿,比去年涨了43倍还多,第一次实现盈利,净赚10个亿。
8月28号那天股价直接涨了15.73%,收盘价成了A股第一,这势头确实猛,国产芯片能起来,政策也帮了不少忙。
今年鼓励发展国产算力的政策一个接一个,互联网大厂和运营商也舍得往算力上砸钱,这就给国产芯片打开了销路。
摩根士丹利最近出了个报告,说中国正在建自己的AI生态,到2027年AI芯片自给率能从去年的34%涨到82%,这速度比预想中快多了。
华为寒武纪抢头名,其他玩家也没闲着
现在想接H20“班”的国产厂商里,华为和寒武纪是最被看好的。
先看华为昇腾,910B和910C的单卡算力都超过了H20,还搞了个CloudMatrix384超节点集群,算下来BF16算力比英伟达的NVL72系统还高。
今年计划卖40万颗910B,主要给运营商和地方算力中心,还有30万颗910C卖给互联网大厂,到现在超节点已经部署了300多套,这规模确实吓人。
寒武纪走的是另一条路,它的思元590芯片,FP16算力能到300TFLOPS以上,是少数能达到这水平的国产芯片。
本来想觉得它会跟华为一样拼通用芯片,后来发现不是,它做的是ASIC专用集成电路,专门适配云服务器、边缘计算这些场景。
在延迟、功耗敏感的地方性价比更高,避开了和英伟达硬刚生态的短板,这路子挺聪明。
除了这两家,其他厂商也没闲着,昆仑芯靠“类CUDA生态”,前不久中标了中国移动的采购项目,拿下了前三个分项的头名,订单规模有十亿级。
摩尔线程今年上半年营收7.02亿,正在谈的AI智算合同超17亿,还跟中国移动签了过万亿的合作,封装订单就有10亿。
沐曦股份也中了两个AI训推一体机的大单,加起来14.88亿,到8月份在手订单有11.4亿,客户里还有新华三这样的大企业。
搞不清的是,虽然国产芯片订单不少,但想追上英伟达还是难。
最明显的就是制程差距,华为用的是中芯国际的7nm多重曝光工艺,良率才30%多,而英伟达用的是台积电3nm工艺,良率80%。
这就导致昇腾910C的单卡BF16算力只相当于英伟达GB200的31%。
供应链也不稳定,壁仞科技的BR100芯片,因为台积电不给代工,到现在没法量产,这地缘风险确实让人头疼。
更难的是软件生态,英伟达的CUDA有400万开发者,就像电脑的Windows系统,能跑几万种模型。
而国产芯片呢,某机器人公司的CTO王枫说,华为芯片现在只适配了160多种模型,想把英伟达上的模型迁过来,得把算子一个个“翻译”成国产芯片能懂的语言。
还得重构分布式计算,顺利的话性能只能发挥70%到80%,不顺利就剩30%到40%,人力和测试成本还得几千万,不过国产厂商也在想办法破局。
华为搞全栈自研,自己做HBM存储、灵衢UB互联技术,还弄了个CANN架构兼容CUDA,虽然转换后性能会损耗15%到20%,但至少能降低迁移门槛。
其他厂商大多先做CUDA兼容,用性价比吸引客户,等站稳脚跟再建自己的生态。
还有的厂商会派工程师驻场帮客户调试,某芯片研发人员唐诗说,这在英伟达是不可能的,英伟达的支持只给大客户,小客户只能自己查文档。
现在国产芯片在推理场景和边缘计算已经有成本优势了,但想替代H20做千亿参数以上的大模型训练,还得两三年。
毕竟迁移成本太高,互联网大厂换国产芯片,不光买硬件,还得改IDC的供电、网络,成本是硬件的2到3倍,华为集群还得额外花散热、电力的钱。
谁让H20有安全风险还可能断供呢,厂商和客户只能一起扛。
总的来说,英伟达H20遇阻给了国产AI芯片一个难得的机会,现在有订单、有政策、有突破,但制程、供应链、生态这三座大山还得慢慢搬。
并非明智之举的是指望短期内全面替代英伟达,但至少现在能看到国产芯片在一步步突围,从“能用”到“好用”,再到“比英伟达好用”,这条路虽然长,但至少走在了正确的方向上。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.