黄仁勋MS TMT纪要|微软|英伟达|人工智能|知名企业

分享至

比业绩上会讲的好，有料多了，关于 Openclaw，关于 CSP 的融资问题，关于新的“三个支柱”，建议精读：

NVIDIA（英伟达）

2026年3月4日美国东部时间下午1:00

摩根士丹利科技、媒体与电信会议
公司参加者：黄仁勋 - 联合创始人、首席执行官、总裁兼董事
问答环节
问题1：战略、文化、技术层面，哪些要素共同促成了英伟达的超高速规模增长？
黄仁勋：要讲清楚这个问题，恐怕得花37分13秒甚至更久。显然，英伟达不是一夜之间建立起来的，我们花了33年。我记得公司上市时股价是13美元，不过刚看到资料显示是12美元，是我记高了，回忆总是比实际更乐观。当时公司的估值大约是3亿美元。

马克·埃德斯通为我们的投资者做了极其充分的准备，以至于那次IPO路演，投资者实际上只问了一个问题，真的是只有一个问题的路演。

那个问题是：你们什么时候会倒闭？我不是在开玩笑。这个问题的回答难度，和你刚才问我的问题不相上下。

答案其实很清晰，我们创立公司的初衷，就是要打造一个全新的计算平台、一种全新的计算方式。并非旧的计算方式有误，而是新的方式，是解决一些独特问题的关键。

我们极其擅长的领域就是算法，核心原因是软件的内循环通常只占代码的5%左右，却占用了99%的计算时间。在我们创立公司的那个年代，精通计算机算法的人寥寥无几，而其中最重要的算法之一，就是计算机图形学——对光线以及光在空间中传播的仿真技术。

彼时，计算机图形学已被应用在动画电影等领域，我们创立公司时，《侏罗纪公园》还登上过知名杂志的封面。

那段时间，计算机图形学的能力飞速提升，我们能用它模拟虚拟现实，并将其应用到一个当时尚不存在的新产业——视频游戏。可以说，3D图形在我们这一代实现了现代化和消费化，整个视频游戏产业，也是由英伟达推动形成的。

我说的“我们这一代”，核心是英伟达整合了所有相关技术与资源。我们在游戏行业备受尊敬且深耕至今，核心原因就是我们创造了现代视频游戏产业，从相关算法到各类技术库，都是英伟达的核心贡献。如今的计算机图形行业，没有RTX技术，就没有当下的一切；如果没有我们为各类游戏引擎贡献的算法，大家也无法体验到如今的各类优质游戏。所以英伟达从33年前成立的第一天起，就深耕算法领域。

如今的加速计算，需要所谓的“全栈能力”，包括架构设计、芯片设计、底层技术库、以及前向集成能力。现在行业里有“前置部署工程师”的新概念，但英伟达33年前就有了DevTech工程师。

我们把这些工程师派驻到全球的游戏行业、游戏公司和游戏引擎开发团队，将英伟达的技术深度集成到他们的游戏引擎中。如今，史诗游戏的虚幻引擎中，英伟达技术无处不在；几乎所有游戏开发商的研发中，都有英伟达技术的身影。这就是所有游戏在英伟达平台上运行效果最佳的核心原因，也是英伟达成为全球最大游戏平台的关键。

可能大家不知道，全球有数亿活跃的GeForce显卡玩家，其中很多人后来成为了人工智能研究者，这一切都源于GeForce GTX 580显卡——伊利亚·苏茨克维、亚历克斯·克里泽夫斯基和杰弗里·辛顿，正是在辛顿的建议下，他们购买了这款显卡，进而发现了CUDA技术。所以英伟达的第一个核心定位，是一家全栈型公司。

还有一段很多人不知道的早期历史，当时个人电脑的架构，与当下的计算机图形能力完全不兼容，我们因此研发了名为Direct NVIDIA的新技术，让应用程序能直接与我们的API通信。后来我们将这项技术开放给核心企业，最终演变成了如今的DirectX。这种应用程序与硬件的通信方式，在当时是革命性的，绕过了大量拖慢系统速度的冗余软件，让加速计算成为可能。

我们还提出了将虚拟化帧缓冲内存引入系统内存的理念，最初这项技术名为AGP，后来发展为PCI Express。为了让个人电脑支持视频游戏和3D图形，当时众多系统架构都被重新设计。

正是这种“全栈创新整合算法+重构系统架构打造新计算系统”的理念和专业能力，促成了DGX-1的诞生——这是全球首款人工智能超级计算机，我们亲手将它交付到了旧金山，距离后来成为OpenAI的公司非常近。

这种核心的理念和专业能力，英伟达坚持了整整33年。公司的文化、组织架构，都是围绕全栈能力设计的，整个体系的核心目标，就是打造新的技术栈和新的系统架构，这是我们实现持续突破的关键。
我们的起点是英伟达的图形卡GeForce，这本身就是一项技术奇迹，它与操作系统、系统架构的集成方式，彻底重塑了此前计算机的运行模式。

这种全栈能力，我们在DGX-1上完美落地，也应用在了首款超级计算集群上——这款集群后来交付给了萨提亚，成为微软的首款超级计算机。

大家可能注意到，微软的首款超级计算机和英伟达的超级计算机，基准测试结果完全一致，哪怕是对上万块GPU的系统性能测算，结果也分毫不差。核心原因就是这款超级计算机由英伟达设计，并交付给了微软Azure云。

这款系统基于InfiniBand技术和安培架构的A100芯片打造，而A100也成为了OpenAI使用的首个计算集群核心芯片。所以我们对全栈、全系统的技术路线极具信心，不坚持这种路线，就无法始终站在技术前沿。

实际上，想要跟上英伟达的步伐很难，因为我们并非每年只研发一款芯片，而是每年打造一整套基础设施——我们自主研发CPU，革新了CPU的设计方式，未来大家会看到更多相关成果；我们也彻底革新了GPU设计，通过NVLink技术实现GPU间的高速连接，重塑了计算机的整体构建方式；再结合Spectrum-X这款新型人工智能以太网，我们实现了所有硬件的高效互联。如今的英伟达，掌控着整个技术栈，熟知所有核心芯片的底层逻辑。

掌控整个技术栈和所有核心芯片，才能实现每年的持续革新；如果做不到这一点，年度创新就会变得极其困难。因为这相当于要整合大量不同类型的组件，若无法全局掌控，就很难将每年的各类创新成果融合落地，这本质上是全栈层面的核心问题。这就是英伟达能走到今天的核心原因。
问题2：企业级人工智能市场的规模、变化、落地节奏，以及未来的发展趋势是怎样的？
黄仁勋：这是个非常好的问题。过去两年，人工智能领域经历了三个关键拐点。第一个拐点的技术基础，其实已经摆在明面上数月之久——GPT-3问世后沉寂了数月，直到有人为它开发了封装程序，将其转化为ChatGPT，做成API接口，让所有人都能便捷使用。

正如你所说，第一个拐点是生成式人工智能，核心能力是将信息从一种形式转换为另一种形式，并通过自回归方式生成令牌（token）。

但生成式人工智能有一个核心问题：容易产生“幻觉”（生成虚假信息）。这并非技术本身有根本性缺陷，也不是模型没有学到正确的知识，而是因为它没有以上下文信息、相关真实信息为基础。

这就引出了第二个拐点：推理型人工智能的诞生。推理型人工智能的核心，是基于研究、基于事实，将生成式能力与语义分析结合，也就是我们所说的“检索增强生成”，本质上是“条件生成”——生成的内容，会基于上下文、真实依据或相关研究资料。

第二代人工智能因此具备了推理、自我反思和自我纠正的能力，就像人有时候会后悔说出的话并想要修正一样，人工智能能实时做到这一点。所以第二代人工智能的输出内容更有依据，也更可靠。

这一技术突破，在科技行业引发了极大的好奇和热情，所有人都开始投身其中，因为大家看到了它的潜力。而ChatGPT的实用性也因此暴涨，它生成的令牌数量比第一代生成式模型多了约100倍，模型规模也扩大了约10倍，对应的计算需求提升了约1000倍。同时，因为实用性大幅提升，它的使用量更是增长了约100万倍。使用量、实用性和可靠性的结合，让我们看到了人工智能行业的下一轮增长。

归根结底，第二代推理型人工智能的核心是提供真实、有价值的信息，本质上是一个更具事实性的聊天机器人，大家也常将其用于研究工作——我们的需求不再是“搜索信息”，而是“直接获取答案”，ChatGPT满足了这一需求，这就是人工智能的第二个拐点。

我们现在正经历第三个拐点，这项技术其实也已经摆在明面上很久了：人工智能能够使用文件、访问文件并调用各类工具。如今的人工智能，能推理、能思考、能使用工具、能解决问题，还能进行搜索和规划。
当前人工智能领域最重大的现象，就是OpenClaw的发布——它可能是有史以来最重要的单一软件发布。看看它的普及速度：Linux用了约30年才达到如今的普及度，而OpenClaw仅用了3周，就超越了Linux，成为历史上下载量最高的开源软件。
哪怕用半对数坐标看它的增长曲线，也是近乎垂直的直线上升，我从未见过这样的增长速度。
这一技术的核心变化，体现在人工智能的提示词（Prompt）上：过去的提示词都是“什么是”“何时”“谁是”这类查询式问题，而现在的提示词变成了“创建”“做”“构建”“写”这类操作式指令。简单来说，过去的提示词是“查询需求”，现在的是“任务需求”——向人工智能下达具体任务，用富有表现力的语言描述意图，人工智能就能自主推断、深入思考，完成任务。
它会自主开展研究、阅读资料、查看工具手册；如果需要使用从未接触过的工具，它会先学习工具手册，再从网络上搜集相关知识，最终应用工具完成任务。
我们从第一代生成式模型的单一响应，发展到第二代推理模型1000倍规模的令牌生成，而如今的智能代理（我们公司内部称之为“claws”），消耗的令牌数量又比第二代多了约100万倍。这些智能代理会在后台持续运行，英伟达内部就部署了大量这类智能代理，它们全天候工作，为我们开发工具、编写软件。
这一变化的核心影响是：企业的计算需求呈爆炸式增长，不只是英伟达，每家公司的计算需求都在急剧攀升。
问题3：支撑海量计算需求的融资方式、资本支出规划，以及人工智能工厂的经济模型未来会如何发展？
黄仁勋：有几个核心观点非常重要。首先很感谢你用到“工厂”这个词，几年前我就说过，如今大家所说的“数据中心”，早已不是传统意义上存储数据的中心，而是生产令牌的设施——以生产令牌为核心目的的设施，就是“人工智能工厂”。
当时有人说，这个说法听起来很“粗糙”，但实际上人工智能工厂是高度精细化的，核心就是生产令牌。没人愿意建传统数据中心，因为没人能确定其投资回报；但所有人都愿意建工厂，因为工厂能创造明确的利润。
现在我们可以确定：人工智能工厂直接生产令牌，而令牌具备明确的商业变现价值。计算能力越强，生产的令牌就越多；令牌越多，企业的营收就越高。企业营收与计算能力呈直接正相关，这是铁一般的事实。
比如Anthropic，如果其计算能力提升3倍，营收必然也提升3倍——它目前的发展，受限于计算资源和工厂产能，这和梅赛德斯受限于工厂产能、任何企业受限于核心产能的逻辑完全一致。OpenAI也是如此，更多的计算资源，必然带来更高的营收。所以第一个核心结论：计算能力=营收。
而更宏观的结论是：计算能力=GDP，一个国家的计算能力，直接决定其GDP水平，这一点我们同样确信。
第二个核心观点，英伟达之所以能取得如今的成功，核心是我们从端到端实现了系统的全栈工程化设计，从底层架构开始，就围绕“高效生成令牌”打造，英伟达的“每瓦特令牌产出”，比竞争对手高出整整一个数量级。
这一指标的重要性不言而喻：假设一家人工智能工厂的供电功率是1吉瓦，若英伟达的每瓦特令牌产出是其他方案的10倍，那么这家工厂的营收就是其他方案的10倍。这也是历史上第一次，企业工厂选择的计算机架构，必须经过CEO亲自审核——因为企业的供电容量是固定的，比如明年只有1吉瓦或2.3吉瓦的供电能力，若选错了系统，直接会影响下一年的营收，这一点我们已经在市场中看到了实际案例。
专业机构SemiAnalysis做过最详尽的基准测试，最终认定英伟达是“推理之王”。而“推理之王”的核心评判指标，就是每秒令牌数、每瓦特令牌数，本质是令牌的生产效率和每美元的令牌产出。英伟达在每瓦特、每美元的性能表现上，都远超竞争对手，这意味着我们能以最低的成本生产令牌，差距之大，达到一个数量级。
所以人工智能的第二个核心认知是：人工智能就是工厂，而工厂始终受限于电力资源。无论有多少厂房，单座厂房的供电容量都是固定的（100兆瓦或1吉瓦），因此每瓦特令牌产出，是决定企业营收的核心指标，企业在这一决策上必须极其谨慎，再也不是靠PPT就能拿到投资的时代，没人会拿500亿美元，去押注一份PPT。
补充提问：如何解决人工智能工厂的融资问题？
黄仁勋：我来直接说说融资的核心逻辑。首先，大家必须相信一个前提：软件至关重要，软件掌控着世界，我想在座的各位都认可这一点。
第二个前提：未来，所有软件都会具备“代理性”（agentic），不存在“愚笨”的软件。这意味着，每一家软件公司，最终都会成为具备代理能力的公司。这些公司会同时使用开放模型和封闭模型——开放模型是指自己下载、自行微调的模型，封闭模型则是外部提供的成熟模型。
这种模式，和企业的人力架构完全一致：企业有正式员工、有培养中的储备人才、有外包人员、也会聘请行业专家完成专项工作。企业的核心目标，不是亲自完成所有工作，而是确保工作能高效完成，人工智能模型的使用逻辑，也是如此。
因此每家企业都会意识到：人工智能模型，一部分可以租用，一部分可以自己构建。这就像企业对待人力的方式，对待“数字劳动力”，同样适用这一逻辑。未来的软件公司，不再只是租用工具，还会租用“能使用工具的数字专家”——因为人工智能代理，在使用专业工具方面，具备极强的能力。
如今的IT行业规模已达数万亿美元，行业内的企业都是“工具租赁者”；而未来，这些企业会成为“智能代理租赁者”，这意味着未来的软件行业规模，会比现在大得多。
大家可以想想自己看好的软件公司，比如楷登电子（Cadence）、新思科技（Synopsys）、西门子（Siemens），它们的未来规模会大幅扩张，但其业务模式会发生根本变化：如今它们本质是软件授权公司，而未来，它们还会出租令牌、专用令牌。这意味着，如今这个价值2万亿美元、几乎不消耗令牌的行业，未来会成为令牌的海量消耗者——这就是人工智能工厂融资的核心资金来源。
如今的IT行业，单是行业本身，就会在云端消耗海量令牌，无论是开放模型还是其他模型，都会带来持续的计算需求，进而支撑人工智能工厂的资本支出。
问题4：令牌经济面临内存、电力许可、专业人才（如电工）等多重约束，这些约束会如何发展？若人工智能工厂的建设周期拉长，是否会带来负面影响？
黄仁勋：我恰恰看好“约束”，因为在资源受限的环境下，企业别无选择，只能选择最优的技术和方案，不会随意试错。如果数据中心的土地、电力、基础设施都受限于，企业绝不会随便部署一套系统，只会选择能明确实现“高每瓦特令牌产出”的方案。
而英伟达，是全球唯一一家能为企业提供“全流程人工智能工厂搭建服务”的公司——从企业确定产能需求的那一刻起，我们就能为其搭建起完整的人工智能工厂。在座的各位，只要有搭建人工智能工厂的需求，我都愿意提供帮助，只需要联系英伟达的一位对接人，就能快速切入人工智能工厂业务。我们有成熟的专业能力，有经过市场验证的架构，也清楚工厂建成后会有海量的需求，能帮助企业快速实现商业化。
所以资源受限的核心影响，是企业必须做出最优选择，因为这直接决定下一年的营收——对于云服务提供商、软件提供商的CEO来说，选错计算架构，就像英伟达选错代工厂、选错内存芯片一样，会对企业发展造成致命影响，因此他们绝不会做出错误选择。
其次，英伟达的规模优势，让我们能牢牢掌控供应链。我们会将大量资金用于保障供应链安全，从内存、晶圆、CoWoS封装技术，到整机、连接器、线缆，甚至是铜材、多层陶瓷电容这类基础元器件，英伟达都实现了供应链的全面保障。这也是英伟达强劲的资产负债表，具备战略意义的核心原因——如今的资产负债表，不仅是财务实力的体现，更是供应链掌控力的核心支撑。
当萨提亚（微软）要求我们帮忙搭建数吉瓦算力的人工智能工厂时，我们能立刻给出“没问题”的答复，核心就是供应链的全面保障。我们会提前与供应链企业达成合作，比如告诉DRAM工厂“放心建厂，英伟达会全面采购”，这种明确的需求承诺，能为供应链企业提供稳定的信心，这也是英伟达的核心优势。
所以我认为，资源稀缺的现状，对英伟达来说是极大的利好——它会让企业更坚定地选择最优的、经过市场验证的技术和方案，而英伟达就是这一选择的核心答案。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.