![]()
4月24日,英伟达股价上涨超4%。这是自去年10月底以来,时隔近6个月,英伟达市值再次突破5万亿美元。怎么做到的?
善友教授说,“回忆过去,往往会有一种叙事上的错觉,觉得一切都是慷慨激昂、势如破竹的。”但如果你听了《英伟达第一季:黄仁勋的生死豪赌》,一定记得那个在巨头压迫下不断错位竞争、离破产永远只有30 天的黄仁勋。
英伟达在商业世界中通过竞争完成崛起,靠的是战略和产品。随后,黄仁勋和英伟达选择了一条更难的路,开启了一场横跨16年的理念之旅:
无视CPU垄断的行业惯性,在CUDA长期没有商业回报、被视作资金黑洞的至暗岁月里,深耕加速计算。从单一赛道破界生长,最终抓住Transformer技术机遇,从追赶者蜕变为规则制定者。
上周,李善友教授带来重磅系列课程之《英伟达第二季:黄仁勋的信仰远征》,回溯了这场堪称惊心动魄的自我颠覆。如何以第一性原理扎根底层创新,用极致长期主义穿越周期,挣脱竞争的桎梏,完成从“赢过别人”到“成就自我”的蜕变?
(文章仅为课程1/10,请前往APP看课)
![]()
![]()
一场“不战而胜”的史诗级竞争
在商业世界中,真正的驱动力其实只有两个:第一个是竞争,第二个是做自己。
越是竞争,越容易把你禁锢在既有的价值网络里。你的竞争对手会和你共同生成一个生态系统,有一股力量不断把你拽回原来的位置。大多数人对此并不自知,反而以为自己很努力,在不断攻城略地。
如果说黄仁勋上半场的核心关键词是“竞争”,不断向右上角突破、挑战巨头;当他成为巨头,必须思考一个新的问题:如何防止被别人颠覆?
![]()
它的上半场,是一个以竞争为驱动力、以成功为驱动力、甚至以恐惧为驱动力的故事;而到了下半场,它逐渐变成了一个“做自己”的故事。你会明显发现,2003年之后的英伟达,仿佛成为了一个真正“活着的组织体”,全新的创意、关键词,经由不同的人不断涌现出来。
关键词1:并行计算
英伟达最早的关键词是“图形处理”。GPU在进行图形处理时,本身就需要完成大量复杂计算,例如浮点运算、矩阵相关运算等。
2002年、2003年之后,出现了一个出乎意料的现象:科学家和研究人员发现经过改造和适配之后,GPU竟然能够胜任那些CPU难以高效处理的复杂计算任务。
![]()
斯坦福大学计算机科学领域的重要学者比尔·达利有一个长期理念,认为CPU代表的串行计算在很多场景下效率有限,一直在设想一种更大规模的并行计算体系。当科学家们开始使用GPU进行计算时,达利发现:英伟达的GPU,就是他所倡导的并行计算理念的最佳载体之一。于是,他写了多篇论文,推动这一方向的发展与传播。
直到这时,黄仁勋才最终顿悟到:英伟达真正的基因是并行计算。这个转变,确实非常精彩。随后他邀请比尔·达利加入英伟达,担任首席科学家。
关键词2CUDA
接下来,从“并行处理”走向“并行计算”需要一个架构。这个架构,正是构成英伟达核心护城河之一的东西:CUDA。
英伟达的GPU最初是可编程的,主要用于图形和渲染相关开发。如果那些科学家想把GPU用于自己的科研计算,必须先把自己的问题“翻译”为图形问题。即便如此困难,一些足够执着、足够专业的研究人员,真的把自己的实际问题翻译成了这类可执行函数,并应用在蛋白质折叠、磁共振成像、物理、化学、天文等诸多领域。
这件事再次震撼了黄仁勋。
黄仁勋迅速意识到,“可计算性”有可能帮助英伟达进入更广阔的领域。从知道到做到之间隔着很多层障碍。其实,真正的“知道”本应接近于知行合一。
2006年,英伟达推出了CUDA,也推出了G80。G80是第一代支持CUDA架构、能够有效执行通用并行计算任务的重要GPU产品之一,包含128个流处理器,能够并行运行大量计算线程。英特尔当时主流CPU的核心数量和并行处理能力完全不在一个量级。
![]()
有了CUDA之后,GPU就不再只是一个图形处理器,而开始成为一个通用并行计算平台。在它之上可以支持多种上层开发语言,任何掌握相应编程工具和接口的人,都可以来使用它。
G80的研发投入持续了四年,总成本约4.75亿美元。此后,英伟达持续投入巨额资金推广CUDA,激励开发者、举办开发者大会、建设工具链与生态体系。
![]()
黄仁勋真正做成的大事,核心上其实就是两件——GPU和CUDA。后面很多年,它其实是在等待这两项基础能力迎来属于自己的时代红利。它并不是一个典型的“先有明确需求,再去满足需求”的故事,而是一个先从内部涌现出某种能力和方向,然后再逐渐创造出需求和市场的故事。
回忆过去,往往会有一种叙事上的错觉,觉得一切都是慷慨激昂、势如破竹的。但CUDA在很长一段时间里,都被资本市场视为一个“资金黑洞”。大约在之后六年,甚至更长时间里,几乎没有多少人真正相信这件事。
当时,有一个著名的激进投资者史密斯介入。在他的压力之下,黄仁勋不得不去和其他投资人沟通,才保住了自己CEO的位置。他承诺要更加专注,放弃了一部分业务,但依然坚持做CUDA。没有收入、没有客户、没有应用,为什么还要坚持?于是,第三个关键词就要出来了。
关键词3:加速计算
计算机的基本范式长期都是围绕CPU组织起来的。而今天我们所说的超级计算机,其核心能力越来越多地建立在GPU加速之上。为什么会这样?
![]()
摩尔定律其实埋着一个“bug”:当晶体管尺寸小到一定程度之后,会越来越受到量子效应影响,其中一个典型现象,就是量子隧穿效应,从而导致漏电、功耗失控、器件稳定性下降等问题。从第一性原理来看,摩尔定律并不是可以无限延续的工程神话。
英特尔工程师其实早就讨论过相关问题,但大型成功组织往往会对自己既有路径形成强烈执念。到了2005年前后,CPU单核主频提升受限,传统依赖频率和缩放持续提升性能的路径开始放缓。
黄仁勋赌的是就是这样一件事:总有一天,当你那条传统路径无法继续高效进步的时候,你的大量市场会开始向我转移。
英伟达可以说打赢了一场“不战而胜”的史诗级竞争。
它从未进入CPU主战场,而是在更深层的技术范式变化中完成了超越。GPU强调的是“那些特别复杂、并行度极高、传统CPU难以高效完成的任务,我能做得更好”的“加速计算”。
英伟达后来推出的DGX,具有非常强的象征意义:它是一台以GPU为核心、面向加速计算和AI训练的系统级机器。然而这件事,在当时其实是被严重低估的。
到这里,供给侧的技术维度,其实已经被我们拈出来了:供给单点已经有了,产品单点也已经有了。
这一切,非常热血、非常鼓舞人心。但问题是:有没有需求?没有。有没有市场维度?也没有。有没有现成的战场?其实也没有。
这几个最关键的词,没有一个是黄仁勋凭空“想”出来的。他看见了这些东西的出现,感应到了它们,然后迅速回应,并立刻意识到它们的重要性,接着果断去做。
他的笃定到了什么程度?笃定到我还不知道市场在哪里,也不知道需求在哪里,但我知道,我正在做一件大事。后来等了多久呢?大约又等了六年,才等到AlexNet让深度学习真正引爆GPU计算需求;再往后,又经过多年演化,才等到“算力”成为一个被整个产业广泛认知和追逐的市场。从最初布局CUDA开始算,这是一个横跨十多年、近乎16年的等待。
什么样的力量,能够支撑一个人、一个组织,这样坚持下去?我想,最后只能落到一个词上:信念。
文章仅为课程1/10,请前往APP看课
![]()
真正的“战场”浮现
关键词4:人工智能·神经网络
大家可以感受一下:黄仁勋的第二季,那个味道、那个频率、那个能量,都不同了。当你走上第二季这条“成为自己”“以商入道”的路时,它并不会按照你头脑中预设的方式出现。
在需求尚未显现的时候,我靠什么来支撑自己继续走下去?从根本上说,支撑它的是第一性原理;从理念层面说,支撑它的是信念。但从战术层面上讲,我还需要一个能够指引自己的正反馈指标。
在寻找需求侧、寻找市场路径的过程中,我需要某种正反馈,让我知道自己大概率是对的。黄仁勋为此提出了一个非常重要的概念,叫作:Early indicator of future success,“未来成功的早期指标”。
这一段,对“理念型创业者”尤其重要。
重点并不在于赚钱,而在于找方向、找市场、找真正重要的需求。
英伟达大概花了十年左右的时间,去寻找这样的信号。它最早的两个用户之一,是来自医疗研究领域的研究人员,希望用GPU来提升乳腺影像分析相关设备的计算能力。他们给英伟达写信,黄仁勋立刻邀请对方参与测试与合作。
投入了数百万美元,只卖出了两张显卡。即便如此,黄仁勋依然非常高兴。
直到今天,黄仁勋和英伟达一直在做一件事,那就是:AI for Science。近年的诺贝尔物理学奖、化学奖背后,很多关键研究工作都深度使用了英伟达的计算平台。
黄仁勋经常讲一个故事。他在台湾大学见到一位教授。这位教授是物理学家,他想计算宇宙大爆炸之后物质演化的过程,传统CPU根本很难胜任。后来,这位教授的儿子在美国告诉他:你可以试试用游戏显卡来做这件事情。于是,这位教授自己搭建了一套基于GPU的计算系统,把这项工作做出来了。
后来,当这位教授见到黄仁勋时,对黄仁勋表达了极深的感激。他说:感谢你,让我能够在有生之年完成我的毕生事业。
“毕生事业”这个词,后来就成了黄仁勋非常重视的一个表达。他一直在寻找这样的信号:什么样的场景,虽然今天没有形成清晰的商业市场,却在价值上极其重大;什么样的用户,虽然规模很小,却在方向上极其关键。
这背后体现的,正是我们所说的那种“理念”与“信念”的力量。你会发现,英伟达不再以竞争作为根本驱动力了。和上半季相比,这是不是一种脱胎换骨?
另外一个问题是:我到底应该做什么?
答案是:去做那件只有我才能做的事情。
英伟达当时已经在非常主动地寻找GPU的应用领域了,可它仍然没有真正想到:人工智能会成为那个最大的方向。
最早识别出关键方向的人之一,正是今天AI历史中的关键人物——Geoffrey Hinton。“并行计算×神经网络”有可能代表未来。Hinton在学术会议上不断向大家讲:你们应该用GPU来跑神经网络。他甚至主动给英伟达写过邮件,大意是:我刚刚在一个会议上向大家推荐了你们的GPU,你能不能送我两块?
这件事本身很有戏剧性。黄仁勋当时仍然没有立刻意识到这件事的全部意义。
他是怎么真正意识到这件事重要性的?
Bryan Catanzaro(英伟达早期专注于深度学习方向的关键人物之一)敏锐地看到了这个变化,并且基于CUDA体系,推动了一个面向神经网络加速的关键软件库——cuDNN。你可以直接调用cuDNN,去高效地训练和运行神经网络。当Catanzaro最初向主管展示这个想法时,时间已经到了2013年前后,他甚至一度被泼了冷水。于是,他决定越级汇报。
![]()
黄仁勋几乎是立刻就明白了这件事的重要性。他把Catanzaro叫到办公室,对他说:这是千载难逢的项目。就由你来干。公司有几千人,你想调动谁就调动谁。英伟达几乎是立刻以公司级资源投入到这个方向中。
到这个时候,方向已经隐约看见了,
但真正的大市场还没有完全形成。
2017年,Google Brain发表了那篇震撼世界的论文:Attention Is All You Need。它提出了“自注意力机制”,并进一步提出了一种新的神经网络架构:Transformer。
这个架构极其简洁,但能力极其强大。它允许一个序列中的每一个token,与其他所有token建立联系,这就是所谓的自注意力。更关键的是,Transformer天然更适合并行计算。
黄仁勋几乎是瞬间理解了Transformer的意义:它不再是某个专门任务的小模型,而是可能成为一种普适能力的底层架构。于是,黄仁勋让团队迅速为Transformer方向开发专门的优化编译器和加速方案。大模型训练时间从原来按月计算,被大幅压缩到了按天甚至更短周期计算。
所以走到这里,价值网络开始真正成形了。
这个时候,Open AI上场,成为最大推力。
2018年左右,Ilya意识到:Transformer是通往通用智能的新路径。立即把Open AI的整个工作重心转到Transformer上。2022年11月30日,ChatGPT的公开发布,成为一个关键节点。
最终,ChatGPT引爆了To C消费互联网市场的需求。五天用户破百万,两个月用户过亿,ChatGPT成为历史上增长最快的消费级互联网产品之一。
科学家实验室里的论文工作,是不会形成那样持续且巨大的算力消耗的;但一旦进入大众使用场景,情况就完全不同了。直到这个时候,技术乘以市场,这个真正的价值网络才算刚刚成立。如果你要给这个阵地命名,它就叫:AGI的入口市场。这个阵地有多大?可能是一个万亿美元级别的生态位。真正的“泼天富贵”才开始出现。
关键词5:算力
当市场真正开始出现之后,那个“十倍级”的需求到底是什么,我们也就看清楚了:算力。
微软先后对Open AI投入了巨额资源,而其中非常重要的一部分并不是简单以现金形式体现,而是以云基础设施能力来支撑Open AI的训练和部署。微软云所提供的这部分核心AI算力,底层大量依赖的,正是英伟达的GPU。
到2022年,终于等到了“算力”这个词真正成为时代级需求的时刻。
英伟达第二季的基因到底是什么?大家还记得那句话吗?3D图形对芯片性能的需求永不满足。于是,一个自指性的内循环就形成了。这就是英伟达第一季的基因结构。那么今天,我认为一个新的“基因双螺旋”已经出现了。一端是大模型,其代表公司是Open AI;另一端是算力平台,其代表公司是英伟达。
![]()
大模型对GPU性能的需求,几乎可以说是永不满足的。
Open AI的增长,已经呈现出一种近似“双重指数”的特征——第一,用户规模在增长;第二,更重要的是,单个用户对token和计算资源的消耗也在快速增长。
Sam Altman也逐渐意识到另一层“scaling law”:如果我拥有更多算力,我不仅可以服务更多用户,更重要的是,我可能获得更强的产品能力、更大的商业化空间,以及更高的收入天花板。也就是说,算力不只是成本,它还可能成为收入和能力上限的决定因素。
为什么今天像Meta这样的公司,会如此激进地投入算力?因为它们相信:算力和产品能力、用户价值、收入之间,存在一个更深层的正向关系。“算力”,它不再只是一个技术词汇,而成了这个时代最核心的战略词汇之一。
关键词6 :AI基座
最后一个关键词:英伟达的产品,到底是什么?
英伟达首先当然是一家硬件公司。可问题在于,如果只把它理解为一家“做芯片的公司”,又显得不够准确。在这里,我们可以看到,他重新识别了谁才是我的真正顾客。
他判断:大模型的增长将是指数级的。过去以CPU为中心的数据中心,必然会逐步转化为以GPU为中心的数据中心。更深层的顾客,其实是数据中心,是那些为大模型提供算力基础设施和服务的数据中心体系。
更厉害的是,他甚至试图重新定义什么叫“数据中心”。他说,过去的数据中心,更像是一个成本中心;而未来的数据中心,将像制造工厂一样,持续产出某种新的价值单位。它生产什么?它生产的是token。而如果顺着这个逻辑往下推,未来这个世界的一种核心“生产单元”或者“价值单位”,很可能就是token。
结果,整个行业都逐渐接受了这一概念,开始大规模建设数据中心,或者说建设“AI工厂”。而这些AI工厂里采购的GPU,主要又是谁的?几乎还是他的。
过去,我们所有的智力与智能,原则上都只能从人类大脑中产生。今天,某种意义上,这是人类历史上第一次,大规模的“智能产出”不再完全依赖人类个体大脑。
我们都看过《黑客帝国》。在电影里,有一个巨大的系统,里面是成批的人类大脑和身体,被当作能量来源。如果你把它和刚才那个“AI工厂”的概念对照一下,你会发现两者在更深的意义上是相通的:未来大规模的智能生产,可能会越来越脱离单个人类大脑,而由机器系统持续地产生、放大和分发。这才是真正的质变。
所以,当我们再回头问:英伟达的产品到底是什么?我认为,更准确的答案是:基础设施。是从GPU芯片一路延伸到整个AI基础设施。我把它简化成一个词,叫作:AI基座。
![]()
所谓商业之道,在这里就是:看见自己,并成为自己。它不再以竞争为起点,而是重新定义产业、重新定义顾客,甚至在某种程度上重新定义这个时代。
黄仁勋基于第一性原理和长期信念,押中了一个时代级结构。不仅仅是ChatGPT,后来Gemini、Claude……各大模型公司的训练与部署需求,都在共同推高对它的采购,“全球顶级科技公司都在拼命争取英伟达的供货能力”。
2024年6月,英伟达市值曾达到约3.3万亿美元,成为全球市值最高的公司之一。此后,它长期处在全球市值最高公司序列之中。从已经发生的现实看,英伟达的影响力已经足够惊人。
延展 :英伟达有没有可能被别人颠覆?
英伟达今天所处的位置,已经越来越像过去CPU所处的位置。英伟达有没有可能被别人颠覆?
从历史规律看,任何位于右上角的位置,都不应该假定自己永远不可被颠覆。那么,它未来可能被颠覆的关键词会是什么?我认为,仍然是那个词:专用。
这其实就是英伟达自己曾经走过的路。过去,英伟达是“专用”的——它最初的专用加速,最终打败了英特尔的通用计算。到了AI时代,英伟达自己的加速计算平台在某种意义上又逐渐“通用化”了。那么未来有没有可能再次出现一类新的“专用加速”,反过来超越今天这种通用加速平台呢?
每次有人问黄仁勋这个问题,他几乎都会非常坚决地回答:No way。我觉得,黄仁勋当然有他的理由,但他也会有自己的路径依赖和包袱。第一个包袱是什么?就是英伟达GPU最初的第一曲线,毕竟是游戏。要知道,英伟达的GPU发展路径在很长一段时间里,都是左手托着游戏,右手托着AI。
也就是说,它不可能完全摆脱游戏这个历史起点。可是,新一代的芯片如果从第一天起就完全只为AI而设计,根本不考虑游戏需求,会不会产生新的变化?
它还有第二个包袱,就是刚才讲过的CUDA生态。CUDA之下有大量软件库,有非常多不同的应用领域。AI并不是唯一方向。其它应用领域某种意义上也构成了CUDA体系的复杂性和历史负担。未来的新生代体系,会不会直接只为AI构建一套更极致、更聚焦的专用栈?这也完全有可能。
这里面最重要的潜在对手之一是谁?就是谷歌的TPU。今天AI时代事实上出现了两个重要阵营:一个阵营是谷歌:TPU+大模型+云+应用生态;另一个阵营是OpenAI+英伟达+微软云的开放协作式联盟。
谁会赢?现在还很难下结论。但至少可以确定的一点是:第二选择已经开始出现了。
文章仅为课程1/10,请前往APP看课
![]()
以商入道
过去十几年,我一直在讲课、研究、陪伴这个时代。我希望会有真正的原创性创新出来。我有一个很强烈的感受:AI时代会出现一批真正“理念型”的创新者,会出现真正原创、世界级的创新者。
黄仁勋这个案例,对我们并不只是一个商业案例,而是一种时代预演。
黄仁勋在下半场,很大程度上是在一次次共鸣与共振之中,把这些关键词接了出来,然后把它们合成了一个活着的东西。我把这个东西叫作:组织体。
黄仁勋几乎是少数一个始终更强调AI正面价值、极少公开突出其负面风险的人。对于黄仁勋而言,今天唯一最重要的事情,就是:赶紧上车,尽快上车,尽快学会如何使用AI。
我会觉得:如果说马斯克想让人类成为跨行星物种,那么黄仁勋想做的,也许是让人类成为一种“跨智能物种”。在他的设想里,每一个人都能够驾驭AI,借助AI去放大自己的能力。
他甚至有一套非常清晰的经济学直觉:人类社会中相当大的一部分GDP,本质上都与认知、知识、判断、设计、沟通、决策等“脑力活动”有关。如果AI能够显著增强这部分能力,那么全球经济就会因此增加数万亿美元规模的产出。
在他的信念里,AI不是为了取代人类,而是为了增强人类。
![]()
回到“以商入道”,我想最后落成两句话。
第一句话:找到那件只有我才能做的事。我坚定地相信,每个人来到这个世界时,都带着一点点这样的东西。只不过,走着走着,你在竞争里、在惯性里、在社会评价体系里被裹挟,慢慢把那一点点东西忘掉了。
它不一定伟大,不一定惊天动地,也不一定非得改写整个时代。它可能只是在你所在的那个具体领域里,推进一扇很小的门,一点点。
我们这代人总是习惯先看结果,但这个案例告诉我们:真正做自己,反而可能做得最大。
第二句话:通过那件事来服务他人。“人”这个东西,其实你是看不见自己的。你必须出去,去碰撞,去和别人撞,去和事情撞,在一次次互动、承担、修正之中,你才会慢慢知道自己是谁。
严格来说,那件事本身也许并没有那么重要,它只是一个载体。但正是通过把这件事推进到边界、推进到极致,在这个过程中,我看见了我是谁。这就是“以商入道”的真正气息。最后,商业结果往往反而会更大。
人生下半场,最酣畅淋漓的一件事,就是重新找到“我是谁”。踩在这个本来面目之上,去创造那件只有你该做的事。我想,这大概是最幸福的一种状态。
最后一个问题,我想留一个种子给大家:那件只有我才能做的事,到底是什么?经由那件事,我最终会走向那个终极而唯一重要的问题:我是谁?
我最真诚地祝福我们每一个人:在离开这个世界之前,都能够回答出这个问题。我觉得,这大概是唯一一种真正不负此生的活法。
文章仅为课程1/10,请前往APP看课
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.