比业绩上会讲的好,有料多了,关于 Openclaw,关于 CSP 的融资问题,关于新的“三个支柱”,建议精读:
NVIDIA(英伟达)
2026年3月4日 美国东部时间下午1:00
摩根士丹利科技、媒体与电信会议
公司参加者:黄仁勋 - 联合创始人、首席执行官、总裁兼董事
问答环节
问题1:战略、文化、技术层面,哪些要素共同促成了英伟达的超高速规模增长?
黄仁勋:要讲清楚这个问题,恐怕得花37分13秒甚至更久。显然,英伟达不是一夜之间建立起来的,我们花了33年。我记得公司上市时股价是13美元,不过刚看到资料显示是12美元,是我记高了,回忆总是比实际更乐观。当时公司的估值大约是3亿美元。
马克·埃德斯通为我们的投资者做了极其充分的准备,以至于那次IPO路演,投资者实际上只问了一个问题,真的是只有一个问题的路演。
那个问题是:你们什么时候会倒闭?我不是在开玩笑。这个问题的回答难度,和你刚才问我的问题不相上下。
答案其实很清晰,我们创立公司的初衷,就是要打造一个全新的计算平台、一种全新的计算方式。并非旧的计算方式有误,而是新的方式,是解决一些独特问题的关键。
我们极其擅长的领域就是算法,核心原因是软件的内循环通常只占代码的5%左右,却占用了99%的计算时间。在我们创立公司的那个年代,精通计算机算法的人寥寥无几,而其中最重要的算法之一,就是计算机图形学——对光线以及光在空间中传播的仿真技术。
彼时,计算机图形学已被应用在动画电影等领域,我们创立公司时,《侏罗纪公园》还登上过知名杂志的封面。
那段时间,计算机图形学的能力飞速提升,我们能用它模拟虚拟现实,并将其应用到一个当时尚不存在的新产业——视频游戏。可以说,3D图形在我们这一代实现了现代化和消费化,整个视频游戏产业,也是由英伟达推动形成的。
![]()
我说的“我们这一代”,核心是英伟达整合了所有相关技术与资源。我们在游戏行业备受尊敬且深耕至今,核心原因就是我们创造了现代视频游戏产业,从相关算法到各类技术库,都是英伟达的核心贡献。如今的计算机图形行业,没有RTX技术,就没有当下的一切;如果没有我们为各类游戏引擎贡献的算法,大家也无法体验到如今的各类优质游戏。所以英伟达从33年前成立的第一天起,就深耕算法领域。
如今的加速计算,需要所谓的“全栈能力”,包括架构设计、芯片设计、底层技术库、以及前向集成能力。现在行业里有“前置部署工程师”的新概念,但英伟达33年前就有了DevTech工程师。
我们把这些工程师派驻到全球的游戏行业、游戏公司和游戏引擎开发团队,将英伟达的技术深度集成到他们的游戏引擎中。如今,史诗游戏的虚幻引擎中,英伟达技术无处不在;几乎所有游戏开发商的研发中,都有英伟达技术的身影。这就是所有游戏在英伟达平台上运行效果最佳的核心原因,也是英伟达成为全球最大游戏平台的关键。
可能大家不知道,全球有数亿活跃的GeForce显卡玩家,其中很多人后来成为了人工智能研究者,这一切都源于GeForce GTX 580显卡——伊利亚·苏茨克维、亚历克斯·克里泽夫斯基和杰弗里·辛顿,正是在辛顿的建议下,他们购买了这款显卡,进而发现了CUDA技术。所以英伟达的第一个核心定位,是一家全栈型公司。
还有一段很多人不知道的早期历史,当时个人电脑的架构,与当下的计算机图形能力完全不兼容,我们因此研发了名为Direct NVIDIA的新技术,让应用程序能直接与我们的API通信。后来我们将这项技术开放给核心企业,最终演变成了如今的DirectX。这种应用程序与硬件的通信方式,在当时是革命性的,绕过了大量拖慢系统速度的冗余软件,让加速计算成为可能。
我们还提出了将虚拟化帧缓冲内存引入系统内存的理念,最初这项技术名为AGP,后来发展为PCI Express。为了让个人电脑支持视频游戏和3D图形,当时众多系统架构都被重新设计。
正是这种“全栈创新整合算法+重构系统架构打造新计算系统”的理念和专业能力,促成了DGX-1的诞生——这是全球首款人工智能超级计算机,我们亲手将它交付到了旧金山,距离后来成为OpenAI的公司非常近。
这种核心的理念和专业能力,英伟达坚持了整整33年。公司的文化、组织架构,都是围绕全栈能力设计的,整个体系的核心目标,就是打造新的技术栈和新的系统架构,这是我们实现持续突破的关键。
我们的起点是英伟达的图形卡GeForce,这本身就是一项技术奇迹,它与操作系统、系统架构的集成方式,彻底重塑了此前计算机的运行模式。
这种全栈能力,我们在DGX-1上完美落地,也应用在了首款超级计算集群上——这款集群后来交付给了萨提亚,成为微软的首款超级计算机。
大家可能注意到,微软的首款超级计算机和英伟达的超级计算机,基准测试结果完全一致,哪怕是对上万块GPU的系统性能测算,结果也分毫不差。核心原因就是这款超级计算机由英伟达设计,并交付给了微软Azure云。
这款系统基于InfiniBand技术和安培架构的A100芯片打造,而A100也成为了OpenAI使用的首个计算集群核心芯片。所以我们对全栈、全系统的技术路线极具信心,不坚持这种路线,就无法始终站在技术前沿。
实际上,想要跟上英伟达的步伐很难,因为我们并非每年只研发一款芯片,而是每年打造一整套基础设施——我们自主研发CPU,革新了CPU的设计方式,未来大家会看到更多相关成果;我们也彻底革新了GPU设计,通过NVLink技术实现GPU间的高速连接,重塑了计算机的整体构建方式;再结合Spectrum-X这款新型人工智能以太网,我们实现了所有硬件的高效互联。如今的英伟达,掌控着整个技术栈,熟知所有核心芯片的底层逻辑。
掌控整个技术栈和所有核心芯片,才能实现每年的持续革新;如果做不到这一点,年度创新就会变得极其困难。因为这相当于要整合大量不同类型的组件,若无法全局掌控,就很难将每年的各类创新成果融合落地,这本质上是全栈层面的核心问题。这就是英伟达能走到今天的核心原因。
问题2:企业级人工智能市场的规模、变化、落地节奏,以及未来的发展趋势是怎样的?
黄仁勋:这是个非常好的问题。过去两年,人工智能领域经历了三个关键拐点。第一个拐点的技术基础,其实已经摆在明面上数月之久——GPT-3问世后沉寂了数月,直到有人为它开发了封装程序,将其转化为ChatGPT,做成API接口,让所有人都能便捷使用。
正如你所说,第一个拐点是生成式人工智能,核心能力是将信息从一种形式转换为另一种形式,并通过自回归方式生成令牌(token)。
但生成式人工智能有一个核心问题:容易产生“幻觉”(生成虚假信息)。这并非技术本身有根本性缺陷,也不是模型没有学到正确的知识,而是因为它没有以上下文信息、相关真实信息为基础。
这就引出了第二个拐点:推理型人工智能的诞生。推理型人工智能的核心,是基于研究、基于事实,将生成式能力与语义分析结合,也就是我们所说的“检索增强生成”,本质上是“条件生成”——生成的内容,会基于上下文、真实依据或相关研究资料。
第二代人工智能因此具备了推理、自我反思和自我纠正的能力,就像人有时候会后悔说出的话并想要修正一样,人工智能能实时做到这一点。所以第二代人工智能的输出内容更有依据,也更可靠。
这一技术突破,在科技行业引发了极大的好奇和热情,所有人都开始投身其中,因为大家看到了它的潜力。而ChatGPT的实用性也因此暴涨,它生成的令牌数量比第一代生成式模型多了约100倍,模型规模也扩大了约10倍,对应的计算需求提升了约1000倍。同时,因为实用性大幅提升,它的使用量更是增长了约100万倍。使用量、实用性和可靠性的结合,让我们看到了人工智能行业的下一轮增长。
归根结底,第二代推理型人工智能的核心是提供真实、有价值的信息,本质上是一个更具事实性的聊天机器人,大家也常将其用于研究工作——我们的需求不再是“搜索信息”,而是“直接获取答案”,ChatGPT满足了这一需求,这就是人工智能的第二个拐点。
我们现在正经历第三个拐点,这项技术其实也已经摆在明面上很久了:人工智能能够使用文件、访问文件并调用各类工具。如今的人工智能,能推理、能思考、能使用工具、能解决问题,还能进行搜索和规划。
当前人工智能领域最重大的现象,就是OpenClaw的发布——它可能是有史以来最重要的单一软件发布。看看它的普及速度:Linux用了约30年才达到如今的普及度,而OpenClaw仅用了3周,就超越了Linux,成为历史上下载量最高的开源软件。
哪怕用半对数坐标看它的增长曲线,也是近乎垂直的直线上升,我从未见过这样的增长速度。
这一技术的核心变化,体现在人工智能的提示词(Prompt)上:过去的提示词都是“什么是”“何时”“谁是”这类查询式问题,而现在的提示词变成了“创建”“做”“构建”“写”这类操作式指令。简单来说,过去的提示词是“查询需求”,现在的是“任务需求”——向人工智能下达具体任务,用富有表现力的语言描述意图,人工智能就能自主推断、深入思考,完成任务。
它会自主开展研究、阅读资料、查看工具手册;如果需要使用从未接触过的工具,它会先学习工具手册,再从网络上搜集相关知识,最终应用工具完成任务。
我们从第一代生成式模型的单一响应,发展到第二代推理模型1000倍规模的令牌生成,而如今的智能代理(我们公司内部称之为“claws”),消耗的令牌数量又比第二代多了约100万倍。这些智能代理会在后台持续运行,英伟达内部就部署了大量这类智能代理,它们全天候工作,为我们开发工具、编写软件。
这一变化的核心影响是:企业的计算需求呈爆炸式增长,不只是英伟达,每家公司的计算需求都在急剧攀升。
问题3:支撑海量计算需求的融资方式、资本支出规划,以及人工智能工厂的经济模型未来会如何发展?
黄仁勋:有几个核心观点非常重要。首先很感谢你用到“工厂”这个词,几年前我就说过,如今大家所说的“数据中心”,早已不是传统意义上存储数据的中心,而是生产令牌的设施——以生产令牌为核心目的的设施,就是“人工智能工厂”。
当时有人说,这个说法听起来很“粗糙”,但实际上人工智能工厂是高度精细化的,核心就是生产令牌。没人愿意建传统数据中心,因为没人能确定其投资回报;但所有人都愿意建工厂,因为工厂能创造明确的利润。
现在我们可以确定:人工智能工厂直接生产令牌,而令牌具备明确的商业变现价值。计算能力越强,生产的令牌就越多;令牌越多,企业的营收就越高。企业营收与计算能力呈直接正相关,这是铁一般的事实。
比如Anthropic,如果其计算能力提升3倍,营收必然也提升3倍——它目前的发展,受限于计算资源和工厂产能,这和梅赛德斯受限于工厂产能、任何企业受限于核心产能的逻辑完全一致。OpenAI也是如此,更多的计算资源,必然带来更高的营收。所以第一个核心结论:计算能力=营收。
而更宏观的结论是:计算能力=GDP,一个国家的计算能力,直接决定其GDP水平,这一点我们同样确信。
第二个核心观点,英伟达之所以能取得如今的成功,核心是我们从端到端实现了系统的全栈工程化设计,从底层架构开始,就围绕“高效生成令牌”打造,英伟达的“每瓦特令牌产出”,比竞争对手高出整整一个数量级。
这一指标的重要性不言而喻:假设一家人工智能工厂的供电功率是1吉瓦,若英伟达的每瓦特令牌产出是其他方案的10倍,那么这家工厂的营收就是其他方案的10倍。这也是历史上第一次,企业工厂选择的计算机架构,必须经过CEO亲自审核——因为企业的供电容量是固定的,比如明年只有1吉瓦或2.3吉瓦的供电能力,若选错了系统,直接会影响下一年的营收,这一点我们已经在市场中看到了实际案例。
专业机构SemiAnalysis做过最详尽的基准测试,最终认定英伟达是“推理之王”。而“推理之王”的核心评判指标,就是每秒令牌数、每瓦特令牌数,本质是令牌的生产效率和每美元的令牌产出。英伟达在每瓦特、每美元的性能表现上,都远超竞争对手,这意味着我们能以最低的成本生产令牌,差距之大,达到一个数量级。
所以人工智能的第二个核心认知是:人工智能就是工厂,而工厂始终受限于电力资源。无论有多少厂房,单座厂房的供电容量都是固定的(100兆瓦或1吉瓦),因此每瓦特令牌产出,是决定企业营收的核心指标,企业在这一决策上必须极其谨慎,再也不是靠PPT就能拿到投资的时代,没人会拿500亿美元,去押注一份PPT。
补充提问:如何解决人工智能工厂的融资问题?
黄仁勋:我来直接说说融资的核心逻辑。首先,大家必须相信一个前提:软件至关重要,软件掌控着世界,我想在座的各位都认可这一点。
第二个前提:未来,所有软件都会具备“代理性”(agentic),不存在“愚笨”的软件。这意味着,每一家软件公司,最终都会成为具备代理能力的公司。这些公司会同时使用开放模型和封闭模型——开放模型是指自己下载、自行微调的模型,封闭模型则是外部提供的成熟模型。
这种模式,和企业的人力架构完全一致:企业有正式员工、有培养中的储备人才、有外包人员、也会聘请行业专家完成专项工作。企业的核心目标,不是亲自完成所有工作,而是确保工作能高效完成,人工智能模型的使用逻辑,也是如此。
因此每家企业都会意识到:人工智能模型,一部分可以租用,一部分可以自己构建。这就像企业对待人力的方式,对待“数字劳动力”,同样适用这一逻辑。未来的软件公司,不再只是租用工具,还会租用“能使用工具的数字专家”——因为人工智能代理,在使用专业工具方面,具备极强的能力。
如今的IT行业规模已达数万亿美元,行业内的企业都是“工具租赁者”;而未来,这些企业会成为“智能代理租赁者”,这意味着未来的软件行业规模,会比现在大得多。
大家可以想想自己看好的软件公司,比如楷登电子(Cadence)、新思科技(Synopsys)、西门子(Siemens),它们的未来规模会大幅扩张,但其业务模式会发生根本变化:如今它们本质是软件授权公司,而未来,它们还会出租令牌、专用令牌。这意味着,如今这个价值2万亿美元、几乎不消耗令牌的行业,未来会成为令牌的海量消耗者——这就是人工智能工厂融资的核心资金来源。
如今的IT行业,单是行业本身,就会在云端消耗海量令牌,无论是开放模型还是其他模型,都会带来持续的计算需求,进而支撑人工智能工厂的资本支出。
问题4:令牌经济面临内存、电力许可、专业人才(如电工)等多重约束,这些约束会如何发展?若人工智能工厂的建设周期拉长,是否会带来负面影响?
黄仁勋:我恰恰看好“约束”,因为在资源受限的环境下,企业别无选择,只能选择最优的技术和方案,不会随意试错。如果数据中心的土地、电力、基础设施都受限于,企业绝不会随便部署一套系统,只会选择能明确实现“高每瓦特令牌产出”的方案。
而英伟达,是全球唯一一家能为企业提供“全流程人工智能工厂搭建服务”的公司——从企业确定产能需求的那一刻起,我们就能为其搭建起完整的人工智能工厂。在座的各位,只要有搭建人工智能工厂的需求,我都愿意提供帮助,只需要联系英伟达的一位对接人,就能快速切入人工智能工厂业务。我们有成熟的专业能力,有经过市场验证的架构,也清楚工厂建成后会有海量的需求,能帮助企业快速实现商业化。
所以资源受限的核心影响,是企业必须做出最优选择,因为这直接决定下一年的营收——对于云服务提供商、软件提供商的CEO来说,选错计算架构,就像英伟达选错代工厂、选错内存芯片一样,会对企业发展造成致命影响,因此他们绝不会做出错误选择。
其次,英伟达的规模优势,让我们能牢牢掌控供应链。我们会将大量资金用于保障供应链安全,从内存、晶圆、CoWoS封装技术,到整机、连接器、线缆,甚至是铜材、多层陶瓷电容这类基础元器件,英伟达都实现了供应链的全面保障。这也是英伟达强劲的资产负债表,具备战略意义的核心原因——如今的资产负债表,不仅是财务实力的体现,更是供应链掌控力的核心支撑。
当萨提亚(微软)要求我们帮忙搭建数吉瓦算力的人工智能工厂时,我们能立刻给出“没问题”的答复,核心就是供应链的全面保障。我们会提前与供应链企业达成合作,比如告诉DRAM工厂“放心建厂,英伟达会全面采购”,这种明确的需求承诺,能为供应链企业提供稳定的信心,这也是英伟达的核心优势。
所以我认为,资源稀缺的现状,对英伟达来说是极大的利好——它会让企业更坚定地选择最优的、经过市场验证的技术和方案,而英伟达就是这一选择的核心答案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.