文 | 硅基观察
10月29日,英伟达股价大涨,成为全球第一家市值突破5万亿美元的企业。而在2023年5月30日,英伟达才刚刚迈入万亿美元市值俱乐部。
英伟达的爆发,再次证明了“卖铲人”的价值。引爆这一轮AI行情的大模型公司们普遍尚未盈利,但英伟达两年赚了超过1000亿美元。
在整个生态中,英伟达成为唯一一家赚到巨额实际利润的企业,反映出AI产业链并未处于健康状态。但各家公司别无选择,GPU具备处理大量并行计算的能力,天然适合大模型训练和推理。而GPU行业玩家寥寥,英伟达在AI计算加速芯片领域处于实质性垄断地位,2024年全球市场份额超过80%。
这种情况下,问题出现了:英伟达的垄断优势能保持多久?市场上何时出现一个足以抗衡英伟达的挑战者?
目前来看,除老对手AMD外,市面上存在两类挑战者,一类是试图摆脱英伟达GPU依赖的国际巨头,以谷歌为代表;另一类则是面临美国AI芯片出口制裁困境下,不得不自主研发AI计算加速芯片的中国企业,包括华为、寒武纪、摩尔线程、海光信息、壁仞科技等。
这些企业都不愿意接受被英伟达“卡脖子”,因此不断投入资金研发技术或扶持竞争势力。AMD、摩尔线程沿用GPU路线,直接正面硬刚;谷歌、华为等企业则选择比GPU效率更高的ASIC路线,虽然难题不少,但潜力巨大。
从技术和商业层面来看,毫无疑问,英伟达很难长期保持垄断优势,未来行业内必然将出现足以抗衡英伟达的挑战者,剩下的只是时间问题。
国际巨头和国内对手,挑战英伟达
目前来看,这些挑战者与英伟达仍有明显差距,但潜力也不容小觑。
在这些挑战者中,AMD是英伟达的老对手。据官方数据,AMD当前量产的最新产品MI355X芯片推理性能优于英伟达B200,仅次于英伟达当前最强量产产品B300。
但整体来看,MI355X虽然采用了台积电的3nm工艺,但并没有显著领先4nm的英伟达B200,同时在软件生态、互联、数据传输等领域显著落后于英伟达。
除AMD外,国内外两类英伟达的挑战者,第一类是以谷歌为代表的国际巨头。
谷歌是AI领域的老牌巨头,底蕴深厚,早在2013年就开始了TPU(Tensor Processing Unit,张量处理单元)的研发,这是一款专为机器学习和深度学习任务加速设计的专用集成电路芯片(ASIC),2016年5月首次公开并应用于AlphaGo上,目前已经迭代至第7代。
今年4月发布的Ironwood TPU v7,在单芯片FP8算力、内存配置、内存带宽等方面已经媲美英伟达B200。同时,超强的规模扩展能力,也被视为谷歌TPU的最大优势。目前,推出Claude模型的Anthropic是谷歌最大的客户之一。
不过,谷歌TPU目前并不对外出售商品,仅以谷歌云服务对外出租算力,其生态体系也有待完善,目前客户群体远不如英伟达。
除谷歌之外,几乎所有大型AI公司都在加速自研AI芯片。如OpenAI和xAI一边大举购买英伟达芯片,另一边推动自研算力芯片进展,Meta也被媒体爆出正与博通合作开发定制芯片。
国内则是另一番景象。从2022年开始,美国开始限制对中国的AI芯片出口,之后不断升级,目前英伟达H20可以进入国内市场,但被曝出有“漏洞后门”,存在安全风险,未来市场销售存在较大不确定性,英伟达算力更高的H100及更高等级的产品仍被禁止进入国内市场。
在这种情况下,国内企业加速算力替代步伐,形成多条路线,如摩尔线程与英伟达一样主打全功能GPU,既支持AI计算加速,也具备图形渲染、视频解码、物理仿真等功能。
目前,摩尔线程是国内唯一一家量产的全功能GPU(既能做图形显示渲染也能进行AI计算加速)企业,在招股书中,摩尔线程表示,其最新的S5000计算加速卡在FP32精度上,算力为32TFlops,这一数据接近英伟达的H20的44TFLOPS。
海光信息、壁仞科技、沐曦股份等企业则与AMD类似主打GPGPU(省去图形功能专做AI计算加速),专注执行AI计算加速业务。华为海思、寒武纪两者为非GPU路线,也采用与谷歌一样的ASIC路线,定制AI计算加速芯片,推出NPU(嵌入式神经网络处理器)产品。
华为目前量产的昇腾910C,据媒体报道其推理性能已经达到英伟达H100的60%。今年8月,据华为云CEO张平安介绍,华为云服务生产效率已经达到英伟达H20芯片的3倍。
寒武纪是国内ASIC路线先行者,其现有的思元590芯片,外界普遍认为其性能达到英伟达A100的80%。
2024年,国内AI计算加速市场,英伟达排名第一,仍占据54.4%的市场份额。华为海思份额为21.4%,AMD市场份额为15.3%。
从市场份额来看,华为海思是国内AI计算加速芯片龙头,其他国产AI芯片企业仍有待突破。在大国竞争的逻辑下,国产算力正在加速发展,成为替代英伟达的另一支重要力量。
综合来看,国内外AI计算企业,已经形成了抗衡英伟达的两条主线,在行业发展的迫切需求下,这场挑战英伟达的长期战役已经打响。
ASIC技术,或为抗衡英伟达的关键
目前来看,英伟达的竞争对手距离英伟达尚有着明显差距,但从技术和商业角度来看,英伟达的垄断地位很难长期保持下去。
技术层面,近年来不断发展的大模型以及备受关注的世界模型,均需对海量数据进行处理,因此对算力的需求持续增长。
展望未来,除非有颠覆性的技术出现,AI模型必然也需要面对更多各层面数据,从而实现真正的人工智能。这也意味着,AI行业的算力需求很难停止。
从这个基础出发,用专门定制的AI计算芯片(即ASIC)替代现有的GPU更符合半导体芯片的迭代逻辑:效率优先。
“效率优先”的逻辑在半导体行业历史悠久,在目前芯片种类中,能效比排序为ASIC>FPGA(现场可编程门阵列)>GPU>CPU。在对效率的追求下,行业应用芯片大多遵循上述逻辑进行迭代。
众所周知,人们最早用CPU进行图像渲染,之后为了提升效率,出现了专门用于处理像素点的GPU,更专业的产品带来了更强的处理效率。
在此前的比特币矿机领域也是如此。人们最早用家用电脑CPU就能挖比特币,但随着挖矿难度提升,人们转向效率更高的GPU。
之后,为了进一步提升挖矿效率,企业专门开发出FPGA。后续随着挖矿算法固定,ASIC芯片成为最终选择。
GPU可以运行大量并行计算,通用性和灵活性更强。AI的计算任务较为单一,ASIC芯片则完全为AI训练和推理定制,计算能力上限更高,具备较强的取代GPU的潜力,这也是谷歌、华为等企业选择ASIC路线的原因之一。
目前全球表现最为突出的ASIC芯片即是前文所说的谷歌TPU,其纸面实力已经媲美英伟达次旗舰产品B200,也被市场认为是英伟达的最强对手。
去年7月底,苹果公司曾发布过一篇论文,展示苹果公司用谷歌TPU芯片训练其AI 模型。消息一出,英伟达股价暴跌超7%。
除此之外,国内华为海思、寒武纪的NPU,在特定领域上也呈现出了对英伟达GPU的一定替代作用。
商业层面的逻辑更为简单,基于AI行业对算力的庞大需求将长期存在的预期,无论从成本还是供应链安全方面考虑,AI巨头们必然将持续推动自研AI芯片或扶持新的AI芯片供应商的进程,这一点将是毫无疑问的。
目前,英伟达也在不断调整布局以应对被替代的风险。技术层面,布局ASIC领域。此前有消息称,英伟达已成立ASIC部门,将招募超过1000名芯片设计、软件开发和AI研究人员。
历史发展中,英伟达也曾借鉴谷歌TPU推出了Tensor Core来进行矩阵运算。在这之后,从Volta、Ampere、Hopper到最新的Blackwell架构,Tensor Core数量和尺寸不断增加,从而带来了更强的计算能力。
商业层面,近年来英伟达进行了密集的AI领域投资,投资对象不仅有OpenAI、xAI这些巨头,也有一些具备潜力的中小型公司,从广泛的投资布局来绑定下游客户、押注潜在的技术路线和发展方向,强化自身生态体系,以抵御可能的发展风险。
不过,从任何角度来看,AI行业都不想要一个处于垄断地位的英伟达,抗衡英伟达的挑战者的出现,或许只是时间问题。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.