网易首页 > 网易号 > 正文 申请入驻

黄仁勋:芯片公司的时代已经结束了,现在是 AI 工厂的时代

0
分享至

最擅长做深度访谈的 Lex Fridman 采访黄仁勋,肯定是值得看的。

对谈中,老黄聊了聊他对于现在整个 AI 行业逻辑的理解:AI 已经不是一种软件功能了,更像是工业产品。同样,OpenClaw 这类 Agent 不再是聊天工具,是一种持续运行的算力消耗。

NVIDIA 不只是单纯的 GPU 芯片公司,更像在建造一种新型基础设施:AI 工厂。原料是电力和数据,产出是 Token。

每一代 GPU 就是工厂里的新产线,算力即产能。

以下是对谈的精华内容,为了方便阅读,Founder Park 进行了微调。

TLDR:

  • 每一代产品都必须同时推进所有维度,从芯片到机架,从软件到散热,极限协同设计意味着不能有任何短板;

  • 公司架构应该反映你想要生产的产品,而不是照搬其他公司;

  • 我的直属汇报超过 60 人,没有组织架构图,没有一对一会议,我们提出问题,所有人一起攻克。公司一直在做极限协同设计。

  • 计算正在从检索转向生成,从仓库转向工厂。旧世界需要存储,新世界需要算力,token 开始像 iPhone 一样细分市场。

  • AI 训练的瓶颈已经不是数据,是算力。推理的本质是思考,但思考是困难的。

  • OpenClaw 对智能体系统的意义,就像 ChatGPT 对生成式系统的意义一样。这是一件非常重大的事情。

  • 市场规模决定了研发能力,研发能力决定了在计算领域可能产生的影响力。专业化与通用化之间存在根本张力,NVIDIA 必须找到那条极窄的路;

  • 计算平台完全取决于开发者,开发者不会仅仅因为它可以执行一些有趣的功能就来到一个计算平台。安装基数定义了架构,其他一切都是次要的,NVIDIA 最重要的护城河是 CUDA 的安装基数;

  • 光速是我对物理能做什么的极限是什么的简写,我们做的每一件事都要与光速进行比较,内存速度、数学速度、功率、成本、时间、努力、人数、制造周期时间。

⬆️关注 Founder Park,最及时最干货的创业分享

超 22000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群:

进群后,你有机会得到:

  • 最新、最值得关注的 AI 新品资讯;

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的 AI 产品曝光渠道

01智能的扩展只取决于一件事:算力

Lex:你概括了四个扩展定律:Pre-training Scaling Law、Post-training、Test-time Scaling、Agentic Scaling Law。继续扩展下去,你最担心的障碍是什么?

Jensen:我们可以回顾一下人们曾经认为的障碍是什么。一开始,我们是第一批遇到 Pre-training Scaling Law 的。人们理所当然地认为,我们拥有的高质量数据将限制我们能达到的智能水平。这个扩展定律非常重要:模型越大,对应更多的数据,就能产生更智能的 AI。这就是预训练。

然后 Ilya Sutskever 说了一句"我们的数据用完了",或者类似的话。"预训练结束了",类似这样。整个行业陷入恐慌,认为这是 AI 的终结。当然,这显然不是真的。我们会继续扩展用于训练的数据量。很多数据可能会是合成的,这也让大家困惑。

人们没有意识到的是,我们用来相互教学、相互告知的大部分数据本来就是合成的。它是合成的,因为它不来自自然。你创造了它。我消费它。我修改它、增强它、重新生成它,别人再来消费它。

Lex:所以合成数据本身并不是什么新事物?

Jensen:我们现在达到了 AI 能够获取基本事实、增强它、强化它、合成生成大量数据的水平。Post-training 的这一部分继续扩展。人类生成的数据在训练中占比会越来越小,我们用于训练模型的数据总量将继续增长,直到我们不再受限于数据,训练的瓶颈变成了算力,原因正是大部分数据是合成的。

然后是下一阶段:Test-time Scaling。我还记得人们告诉我:"推理?哦,那很容易。预训练,那才难。"他们认为推理芯片会是小小的芯片,不像 NVIDIA 的芯片。将来推理会是最大的市场,而且会很容易,我们会将其商品化,人人都能造自己的芯片。

这对我来说从来就是不合逻辑的,因为推理就是思考,而我认为思考是困难的。

Lex:为什么你认为思考比预训练难?

Jensen:思考比阅读难得多。预训练只是记忆和泛化,在关系中寻找模式,你在不停地读、读、读。而思考、推理、解决问题,是在处理未经探索的体验、新体验,把它们分解成可解决的部分,然后通过第一性原理推理,或者通过先前的例子、过往经验,或者干脆探索、搜索、尝试不同的事情。

Test-time Scaling 的整个过程,说白了就是关于思考,关于推理、规划、搜索。这怎么可能是轻量级的计算呢?我们对此的判断是完全正确的,Test-time Scaling 是极其计算密集型的。

Lex:那超越 Test-time Scaling 之后是什么?

Jensen:显然,我们现在创建了一个智能体,这个智能体有我们开发的大型语言模型。但在测试时,这个智能体系统会去做研究,敲打数据库,使用工具,而它做的最重要的事情之一是衍生出一大堆子智能体。

这意味着我们现在正在创建大型团队。通过雇用更多员工来扩展 NVIDIA,比扩展我自己容易得多。所以下一个扩展定律是 Agentic Scaling Law,这就像 AI 的「乘法」。我们可以随心所欲地快速衍生智能体。所以我有四个 Scaling Law。

当我们使用智能体系统时,它们会创造更多数据、更多体验。其中一些我们会说:"哇,这真的很好,我们应该记住这个。"那个数据集会一路回到预训练。我们记忆并泛化它,然后将其精炼、微调回到后训练,再通过测试时计算和智能体系统进一步增强,推向行业。这个循环会不断持续。归根结底,智能的扩展取决于一件事,那就是算力。

Lex:但硬件架构无法快速转向,你必须提前预测 AI 会往哪里走,比如混合专家模型,这件事实在太难了。

Jensen:这些 AI 模型架构大约每六个月就会出现新的发明,而系统架构和硬件架构大约每三年一次。所以你需要预测两三年后可能发生什么。

有几种方法可以做到。首先,我们可以在内部做研究,这也是我们有基础研究和应用研究的原因之一。我们自己创建模型,所以我们有第一手的实践经验。这就是我所说的协同设计的一部分。另外,我们也是世界上唯一一家与全球几乎所有 AI 公司都合作的 AI 公司。在可能的范围内,我们会了解人们正在遭遇什么挑战。

Lex:所以你在倾听整个行业、各大 AI 实验室的窃窃私语。

Jensen:没错。你必须倾听并向所有人学习。然后最后一点是要有一个灵活的架构,能够适应并随风而动。CUDA 的好处之一就是,它一方面是一个令人难以置信的加速器,另一方面又真的非常灵活。这种专业化与通用化之间的极致平衡,必须足够专业,否则我们无法加速 CPU;又必须足够通用,才能适应不断变化的算法,这非常关键。这就是为什么 CUDA 一方面如此有韧性,而我们又在不断增强它。我们现在已经到了 CUDA 13.2,以如此快的速度演进架构,才能跟上现代算法的步伐。

举个例子,当混合专家模型出现时,这就是为什么我们有了 NVLink 72 而不是 NVLink 8 的原因。我们现在可以把一个完整的四万亿、十万亿参数的模型放在一个计算域中,就好像它运行在一个 GPU 上一样。

如果你看 Grace Blackwell 机架的架构,它完全专注于做一件事,处理大语言模型。然后一年后,你看到的是 Vera Rubin 机架:它有存储加速器,有全新的 CPU Vera,有 Vera Rubin 和 NVLink 72 来运行大语言模型,还有一个新的附加机架 Rock。这整个机架系统与之前的完全不同,多了所有这些新组件。原因是上一代是为运行混合专家大语言模型推理而设计的,而这一代是为运行智能体而设计的,智能体需要调用工具。

Lex:这些系统的设计,显然必须在 OpenClaw 出现之前就完成了。你是怎么预判到这一切的?

Jensen:不,比那简单。你只需要推理。不管发生什么,在某个时刻,为了让大语言模型成为一个数字工作者。假设我们希望大语言模型成为一个数字工作者。它必须做什么?它必须访问真实数据,那就是我们的文件系统。它必须能够做研究,它不可能知道所有事情。我也不想等到这个 AI 对过去、现在和未来的一切都变得普遍聪明之后才让它有用,所以不妨让它去做研究。显然,如果它要帮助我,它必须使用我的工具。

有人会说:"AI 将完全摧毁软件,我们不再需要软件了,甚至不再需要工具了。"这太荒谬了。做个思想实验就能看清楚:如果我要创造未来十年能想象到的最惊人的智能体,假设是一个人形机器人。这个人形机器人,是更可能走进我的房子、使用我现有的工具完成工作?还是这只手一瞬间变成 10 磅重的锤子,下一瞬间变成手术刀,为了烧水从手指射出微波?还是它更可能就是使用微波炉?

第一次走到微波炉前,它可能不知道怎么用。但没关系,它连上了网,读微波炉的说明书,读完立刻成为专家,然后就用它。

Lex:你刚才描述的其实就是 OpenClaw 的几乎所有属性。

Jensen:是的。它会使用工具,访问文件,能够做研究,有 I/O 子系统。当你用这种方式推理完之后,你会说:"天哪,对计算未来的影响是极其深远的。"原因是,我认为我们刚刚重新发明了计算机。

如果你看我在 GTC 上使用的 OpenClaw 示意图,你会发现它是两年前的。就在两年前的 GTC 上,我就在谈论智能体系统,它与今天的 OpenClaw 完全一致。当然,许多事情的汇合必须先发生,我们需要 Claude、GPT 以及所有这些模型达到一定的能力水平,他们的创新和持续进步至关重要。然后,必须有人创建一个足够强大、足够完整的开源项目,让我们所有人都能投入使用。我认为 OpenClaw 对智能体系统的意义,就像ChatGPT对生成式系统的意义一样。这是一件非常重大的事情。

Lex:是的,这是一个非常特殊的时刻。我不太确定为什么它吸引了如此多的世界关注,但确实如此。

Jensen:因为消费者可以接触到它了。

Lex:这么强大的技术,安全边界在哪里,我们还在摸索怎么找到那个平衡点。

Jensen:是的,我们立刻就参与进去了,派了一批安全专家。我们做了一个叫 OpenShell 的东西,已经被集成到 OpenClaw 中了。NVIDIA 还推出了 NemoClaw。

我们给你三项权限中的两项。智能体系统可以访问敏感信息、可以执行代码、可以进行外部通信。如果我们在任何时候给你这三项能力中的两项而不是全部三项,我们就能保持安全。在这两项能力中,我们还根据企业给你的权限提供访问控制。然后我们将其连接到所有这些企业已有的策略引擎。所以我们将尽力帮助 OpenClaw 更好。

02计算机从存储仓库变成了收入工厂,每一个 Token 都有价值

Lex:如果 NVIDIA 有一天真的价值 10 万亿美元,那个世界是什么样子的?

Jensen:我认为 NVIDIA 的增长极有可能,在我看来,是不可避免的。让我解释为什么。我们是历史上最大的计算机公司。仅这一点就应该引出问题,为什么?

原因当然是两个基础技术原因。第一个原因是计算从基于检索的文件检索系统转变了。几乎所有东西都是文件,我们预先写一些东西,我们预先记录一些东西。你知道,我们画一些东西,我们把它放在网上,我们把它放在文件中。我们使用推荐系统,一些智能过滤器,来找出为你检索什么。

Lex:所以从检索到生成?

Jensen:我们从基于检索的计算系统转向了基于生成的计算系统。我们在这个新世界中需要比旧世界多得多的处理。我们在旧世界需要大量存储。我们在这个新世界需要大量计算。

所以这是第一部分。我们从根本上改变了计算和计算的完成方式。唯一会导致它倒退的是,如果这种计算方式,这种生成上下文相关、情境感知、在生成信息之前基于新见解的信息的计算密集型计算方式,只有在它无效时才会倒退。

第二个想法是,计算机,因为它是一个存储系统,它主要是一个仓库。我们现在正在建造工厂。仓库赚不了多少钱。工厂直接与公司的收入相关。

所以,计算机做了两件事。它不仅改变了它的做法,它在世界上的目的也改变了。它不再是计算机,它是工厂。它是工厂,用于产生收入。

Lex:Token 作为产品?

Jensen:我们现在看到这个工厂不仅在生产产品、人们想要消费的商品,我们看到这些商品如此有趣、如此有价值,对如此多不同的受众来说,Token 开始像 iPhone 一样细分。

你有免费 Token,你有高级 Token,中间还有几种 Token。所以事实证明,智能是一个可扩展的产品。有极高智能的产品,用于专门事物的 Token,人们愿意付费。有人愿意为每百万个 Token 支付 1000 美元的想法就在眼前。这不是是否的问题,只是何时的问题。

Lex:用一个可能荒谬的定义来问:能创办并运营一家价值超 10 亿美元科技公司的 AI,算 AGI 吗?我们离这个还有多远?

Jensen:我认为就是现在。我认为我们已经实现了 AGI。

Lex:你认为一家公司真的可以由这样的 AI 系统运营吗?

Jensen:可能的,原因是这样的。你说了 10 亿,但你没说要永远持续。比如说,一个 Claude 完全有可能创建一个网络服务,某个有趣的小应用,突然之间几十亿人用了,每人付 50 美分,然后不久后它又倒闭了。我们在互联网时代看到过很多这样的公司,大多数那些网站并不比今天 OpenClaw 能生成的更复杂。

Lex:实现病毒式传播并将其货币化。

Jensen:是的,这正在发生。当你去中国时,你会看到很多人在教他们的 OpenClaw 去找工作、做事、赚钱。我不会惊讶如果有人创造了一个数字网红,超级可爱,或者某个社交应用,比如喂你的小电子宠物之类的,然后突然爆红。很多人用几个月然后就消失了。但是,10 万个这样的 Agent 建造 NVIDIA 的概率是零。

Lex:但这让很多人兴奋,想着"我可以启动一个 Agent 然后赚很多钱"。

Jensen:我想确保大家都明白的一点是,人们真的很担心他们的工作。我想提醒他们,你工作的目的和你用来做工作的任务和工具是相关的,但不是一回事。我做我的工作已经 33 年了,我是世界上任期最长的科技 CEO,34 年。在过去 34 年里,我用来做工作的工具一直在不断变化,有时在几年内变化相当剧烈。

Lex:你能举个例子吗?

Jensen:计算机科学家和 AI 研究人员说的第一个要消失的工作是放射科医生。因为计算机视觉将达到超人水平,而且确实做到了。计算机视觉在 2019、2020 年左右就已经是超人水平了。所以预测是放射科医生会消失,因为研究放射扫描将成为过去,AI 会做这个。

Lex:但结果呢?

Jensen:他们绝对是对的。计算机视觉完全是超人水平的。今天每个放射学平台和软件包都由 AI 驱动,然而放射科医生的数量却增长了。问题是为什么?我们现在世界上放射科医生短缺。警告过头了,吓跑了人们从事这个对社会如此重要的职业。

Lex:为什么预测错了?

Jensen:因为放射科医生的目的是诊断疾病,帮助患者和医生诊断疾病。因为我们现在能够如此快速地研究扫描,你可以研究更多扫描,诊断得更好,可以更快地服务患者,可以看更多人。医院赚更多钱,医院有更多患者,需要更多放射科医生。这是如此明显会发生的事情。

Lex:你认为编程人员的数量可能会增加而不是减少吗?

Jensen:是的。原因是这样的。编码的定义是什么?我认为今天编码的定义就是规范说明,也许如果你想更直接一点,你甚至可以给它一个你想要编写的软件的架构。所以问题是,有多少人能做到这一点?描述一个规范让计算机去构建。多少人?我认为我们刚从 3000 万增加到可能 10 亿。

Lex:所以每个职业都会被提升?

Jensen:未来每个木匠都将是一个编码员,只不过有 AI 的木匠也是一个建筑师。他们刚刚大大提高了可以为客户提供的价值。他们的艺术性刚刚得到了巨大的提升。我相信每个会计师也是你的财务分析师,也是你的财务顾问。所有这些职业都刚刚被提升了。如果我是木匠,我看到 AI,我会完全疯狂的。如果我是水管工,也会完全疯狂。

Lex:对于目前的程序员和软件工程师呢?

Jensen:我认为他们处于理解如何使用自然语言与 Agent 沟通以设计最佳软件的前沿。随着时间的推移,他们会融合,但我仍然认为学习编程有价值,学习什么是编程语言,什么是编程语言的良好实践,什么是大型软件系统的编程语言设计原则。

Lex:为什么学编程仍然重要?

Jensen:编写规范就是编码。所以你可能会决定相当规范,因为你在寻找一个非常具体的结果。你可能会决定这是一个你想要更具探索性的领域,所以你可能会规定不足,让你能够与 AI 来回交流,甚至推动你自己的创造力边界。这种在光谱中的位置的艺术性,这就是编码的未来。

Lex:回到 AGI 的问题,你说"我认为就是现在,我认为我们已经实现了 AGI"。这是一个相当大胆的声明。你能详细解释一下吗?

Jensen:让我们从根本上分解什么是智能。智能这个词,我们一直在使用,它不是一个神秘的词。智能有含义,它是一个包括感知、理解、推理和计划能力的系统,这个循环就是智能。智能不是一个完全等同于人性的词。

Lex:所以你在区分智能和人性?

Jensen:我认为这真的很重要。我们有两个词。我不会过度幻想,也不会过度浪漫化智能。实际上我认为智能是一种商品。我被聪明人包围着。我被比我更聪明的人包围着,在他们各自的领域。然而,我在那个圈子里有一个角色。这实际上很有趣。

Lex:你是说尽管被更聪明的人包围,你仍然能协调他们?

Jensen:他们比我受过更好的教育。他们上了比我更好的学校。他们在各自的领域都比我更深入。我有 60 个这样的人。他们对我来说都是超人。不知何故,我坐在中间协调所有 60 个人。所以你得问自己,一个洗碗工怎么能坐在超人中间?这说得通吗?

Lex:所以智能不是一切?

Jensen:我的观点是智能是一个功能性的东西。人性不是功能性地定义的。它是一个更大得多的词。我们的生活经历、我们对痛苦的忍耐、我们的决心,这些都是与智能不同的词。

Lex:那么什么才是真正重要的?

Jensen:我们真正应该提升的词是人性。品格、人性、同情心、慷慨。所有你刚才说的这些东西,我相信这些是超人的力量。现在智能将被商品化。不幸的是,我们的社会把一切都放进了一个词里,而生活不止一个词。

Lex:所以当智能被民主化和商品化时,不要让它引起你的焦虑?

Jensen:我的生活表明,在智能曲线上比我周围的每个人都低,并不会改变我是最成功的这个事实。我试图希望激励其他所有人,不要让智能的民主化、商品化引起你的焦虑。你应该受到它的启发。

03极限协同设计,
每一代产品都必须同时推进所有维度

Lex:NVIDIA 已经从做最好的GPU,扩展到了整个系统的极限协同设计——GPU、CPU、内存、网络、散热、机架,甚至整个数据中心。协同设计这么复杂的系统,最难的部分是什么?

Jensen:首先,极限协同设计之所以必要,是因为问题已经无法装进一台计算机里由一个GPU来加速了。你想要解决的问题是,你添加了比如说 10,000 台计算机,但你希望速度提升一百万倍。

突然之间,你必须分解算法,你必须重构它,你必须分片管道(shard the pipeline),必须分片数据,必须分片模型。当你以这种方式分布问题时,不仅仅是扩展问题规模,而是在分布问题本身,那么一切都会成为障碍。

Lex:这就是阿姆达尔定律(Amdahl's Law)的问题吧?

Jensen:没错。阿姆达尔定律告诉我们,你能获得的加速取决于这部分占总工作量的比例。如果计算只占问题的 50%,即使我把计算加速无限倍,比如一百万倍,我也只能把总工作量加速两倍。

现在突然之间,你不仅要分布计算,还要以某种方式分片管道。你还必须解决网络问题,因为所有这些计算机都连接在一起。所以在我们这种规模的分布式计算中,CPU 是问题,GPU是问题,网络是问题,交换是问题。在所有这些计算机之间分配工作负载也是问题。这就是一个极其复杂的计算机科学问题。所以我们必须调动每一项技术。

Lex:你在每个领域都有世界级专家,内存、网络、光学、散热……这些学科差异极大,你怎么让他们坐在一起协同解决问题?

Jensen:这就是为什么我的直属团队如此庞大。

Lex:当你知道要把这一切塞进一个机架时,专家和通才具体是怎么协作的?

Jensen:有三个问题。第一个问题是:什么是极限协同设计?我们在整个软件栈上进行优化,从架构到芯片,到系统,到系统软件,到算法,到应用程序。这是一层。

第二件事超越了 CPU 和 GPU、网络芯片、扩展交换机和横向扩展交换机。当然,你还必须包括电源和散热,因为所有这些计算机都极其耗电。它们做大量工作,能源效率很高,但总体上仍然消耗大量电力。

第三个问题是,你如何做到这一点?这有点像这家公司的奇迹。当你设计计算机时,你需要有计算机的操作系统。当你设计公司时,你应该首先考虑你希望公司生产什么。

Lex:详细说说吗?

Jensen:我看到很多公司的组织架构图,它们看起来都一样。汉堡公司的组织架构图、软件公司的组织架构图、汽车公司的组织架构图,它们看起来都一样。这对我来说毫无意义。

公司的目标应该是成为生产产品的机器、机制和系统。那个产出就是我们想要创造的产品。公司的架构设计应该反映它所处的环境,这几乎间接告诉你应该如何组织。

我的直属团队有 60 个人。我不和他们做一对一会议,因为那是不可能的。如果你的团队有 60 个人,还要做一对一,你就无法完成工作。

Lex:所以你有 60 个直接汇报?而且大多数至少在工程方面有涉足?

Jensen:几乎所有人都是。有内存专家,有 CPU 专家,有光学专家。GPU、架构、算法、设计……

Lex:太不可思议了。所以你一直在关注整个技术栈,并且在进行关于整个栈设计的深入讨论?

Jensen:没有任何对话是一个人的事。这就是为什么我不做一对一会议。我们提出一个问题,然后所有人一起攻克它。因为我们在做极限协同设计。从字面上讲,公司一直在做极限协同设计

Lex:所以即使你在讨论特定组件,比如散热、网络,每个人都在听?

Jensen:没错。

Lex:他们可以贡献意见,"这对电源分配不起作用,这对内存不起作用"?

Jensen:正是如此。谁想退出就退出。团队里的人知道什么时候该注意。如果有他们本可以贡献但没有贡献的东西,我会叫他们出来。"嘿,来吧,参与进来。"

Lex:NVIDIA 是一家适应环境的公司。NVIDIA 从游戏GPU一路适应到深度学习,再到现在的 AI 工厂。这个转变是从什么时候开始的?

Jensen:我可以系统地推理这个过程。我们最初是一家加速器公司。但加速器的问题是应用领域太狭窄。它的好处是对特定工作进行了难以置信的优化。任何专家都有这个好处。

但高度专业化的问题是,当然,你的市场覆盖面更窄,但这甚至都还好。问题是,市场规模也决定了你的研发能力。而你的研发能力最终决定了你在计算领域可能产生的影响力。

所以,当我们最初作为加速器,非常特定的加速器时,我们始终知道那将是我们的第一步。我们必须找到一种方法成为加速计算公司。但问题是,当你成为一家计算公司时,它太通用了,会削弱你的专业化。

我连接了两个实际上存在根本张力的词。我们越成为更好的计算公司,作为专家就越糟糕。越专业化,我们做整体计算的能力就越少。我故意把这两个词连在一起,公司必须找到那条非常狭窄的道路,一步一步地扩大我们的计算孔径,但不放弃我们拥有的最重要的专业化。

Lex:这种组织结构如何帮助极限协同设计?

Jensen:我们把需要不同专业知识的人聚在一起。比如内存专家、CPU 专家、光学专家、GPU 专家、架构师、算法专家、设计师,所有人都在同一个房间里。

当我们讨论一个问题时,所有相关的人都在场。这不是串行的决策过程,而是并行的。散热专家可能会对网络设计提出意见,网络专家可能会对内存架构有想法。这种交叉授粉是极限协同设计的核心。

Lex:这与传统的层级组织结构完全不同。

Jensen:完全不同。我们没有组织架构图。我们的组织反映了我们想要构建的产品,一个高度集成、相互依赖的系统。就像我们的产品需要所有组件协同工作一样,我们的团队也需要这样工作。

这也是为什么我花大量时间在团队面前推理。每次会议都是推理会议。我在公司内外的每一刻都在尽快向人们传递知识。我学到的任何东西都不会在我桌上停留超过几分之一秒。"天哪,这太酷了。"在我自己还没完全学完之前,我已经在指给别人看了。"快看这个。这太酷了。你会想要学习这个的。"

04安装基数定义架构其他都是次要的

Lex:能说说把 CUDA 放在 GeForce 上的决定吗?明明负担不起,为什么还是选择这么做?

Jensen:那是第一个接近生存威胁的战略决定。我们发明了 CUDA,它扩大了我们可以用加速器加速的应用范围。问题是,我们如何吸引开发者使用 CUDA?因为计算平台完全取决于开发者。

开发者不会仅仅因为它可以执行一些有趣的功能就来到一个计算平台,他们来到计算平台是因为安装基数很大。因为开发者像其他人一样,希望开发能触及很多人的软件。所以安装基数实际上是架构最重要的部分。

Lex:安装基数就是一切。

Jensen:安装基数定义了架构,其他一切都是次要的。到那个时候,GeForce 已经很成功了。我们每年销售数百万个 GeForce GPU,我们说,"我们应该把 CUDA 放在 GeForce 上,把它放进每台 PC 里,不管客户是否使用它,并以此作为培养安装基数的起点。"

问题是 CUDA 大大增加了那个 GPU 的成本,这是一个消费产品,它完全消耗了公司所有的毛利润。当时公司大概价值 80 亿美元左右。在我们推出 CUDA 后,我意识到它会增加这么多成本,但这是我们相信的东西。我们的市值降到了大约 15 亿美元。我们在那里待了一段时间,然后慢慢爬回来,但我们在 GeForce 上保留了 CUDA。

我总是说,NVIDIA 是 GeForce 建造的房子,因为是 GeForce 把 CUDA 带给了每个人。

Lex:那个生存时刻,你还记得吗?内部的讨论是什么样的?

Jensen:我必须向董事会说明我们在尝试做什么,管理团队知道我们的毛利率会被压垮。你可以想象一个世界,GeForce 承担 CUDA 的负担,而游戏玩家都不会欣赏它,也不会为此付费。

我们的成本增加了 50%,而我们是一家 35% 毛利率的公司,所以这是一个相当困难的决定。但你可以想象有一天这会进入工作站和超级计算机,在那些细分市场,也许我们可以获得更多利润。但这仍然花了十年时间。

Lex:NVIDIA 现在是世界上最有价值的公司。我必须问,NVIDIA 最大的护城河是什么?

Jensen:我们作为一家公司最重要的财产是我们计算平台的安装基数。我们今天最重要的东西是 CUDA 的安装基数。

20 年前,当然没有安装基数。但如果现在有人想出一个 GUDA 或 TUDA,根本不会有任何区别。原因是这从来不只是关于技术。技术当然是令人难以置信的有远见的。但事实是公司致力于此,坚持下去,扩大了它的覆盖范围。

不是三个人让 CUDA 成功,是 43,000 人让 CUDA 成功。还有几百万相信我们的开发者,相信我们会继续开发 CUDA 1、2、3、13,他们决定在上面移植和专注他们的软件,他们在上面的大量软件。

所以安装基数是第一重要的优势。当你用我们执行的速度放大这个安装基数,在我们谈论的规模上,历史上没有任何公司建造过这种复杂性的系统。每年建造一次是不可能的。

Lex:这种速度和安装基数的结合产生了什么效果?

Jensen:从开发者的角度来看,如果我支持 CUDA,明天它会好 10 倍。我只需要平均等待六个月。不仅如此,如果我在 CUDA 上开发,我能触及几亿人、计算机。我在每个云中,我在每个计算机公司,我在每个行业,我在每个国家。

所以如果我创建一个开源包并首先把它放在 CUDA 上,我同时获得这两个属性。不仅如此,我 100% 相信 NVIDIA 会保留 CUDA 并维护它、改进它,只要他们还活着就会继续优化库。你可以把这个存入银行,最后一部分,信任。

Lex:这种信任是如何建立的?

Jensen:把所有这些放在一起,如果我今天是一个开发者,我会首先瞄准 CUDA。我会最多地瞄准 CUDA。这就是我认为最终分析中我们的第一个核心优势。

我们的第二个是我们的生态系统。我们垂直集成了这个极其复杂的系统,但我们将它水平集成到每一家公司的计算机中。

Lex:具体来说呢?

Jensen:我们在 Google Cloud,我们在 Amazon,我们在 Azure。我们现在正在疯狂地扩大 AWS。我们在像 CoreWeave 和 Nscale 这样的新公司。我们在 Lilly 的超级计算机中。我们在企业计算机中。我们在边缘的无线基站中。这太疯狂了,一个架构在所有这些不同的系统中。

我们在汽车中,我们在机器人中,我们在卫星中,我们在太空中。所以你有这一个架构,生态系统如此广泛,它基本上涵盖了世界上的每一个行业。

Lex:CUDA 安装基数如何演变成未来的 AI 工厂作为护城河?你认为未来的 NVIDIA 可能完全是关于 AI 工厂吗?

Jensen:计算单元对我们来说曾经是GPU,然后它变成了一台计算机,然后变成了一个集群。现在是整个 AI 工厂。

当我看到一台计算机,当我看到 NVIDIA 构建的东西时,在过去,我会可视化芯片。然后当我宣布新产品、新一代时,比如"女士们先生们,我们今天宣布 Ampere",我会拿起芯片。那是我的心智模型。

Lex:但现在不同了?

Jensen:今天,拿起芯片仍然很可爱。但它很可爱。这不是我在做什么的心智模型。我的心智模型是这个巨大的吉瓦级的东西,它有连接到电网的发电装置。它有难以置信的巨大的冷却系统和网络。

10,000 人在那里试图安装它,数百名网络工程师在那里,数千名工程师在后面试图给它供电。你知道,启动这些工厂之一,如你所知,不是某人说"现在开了"。需要数千人来启动它。

05当你设计一家公司时,首先要考虑你希望公司生产什么

Lex:你高度赞扬了 Elon 和 xAI 在孟菲斯的成就,Elon 四个月在孟菲斯建成了 Colossus,现在已经有 20 万个GPU。他的工程方法里,是什么让这件事成为可能?

Jensen:首先,Elon 在许多不同的主题上都很深入。但他也是一个真正优秀的系统思考者。所以他能够跨多个学科思考,而且他显然会推动事情,质疑一切。

第一,这是必要的吗?第二,必须这样做吗?然后,必须花这么长时间吗?他有能力质疑一切,直到一切都减少到必要的最小量,你不能再拿走任何东西。然而产品的必要能力仍然存在。他是你能想象到的最极简主义者,而且他在系统规模上做到这一点。

Lex:他具体是怎么做的?

Jensen:我也喜欢他出现在行动点的事实。如果有问题,他会直接去那里。"给我看看问题。"当你把所有这些结合起来时,你就克服了很多以前的"这就是我们的做法"、"我在等他们"之类的借口。每个人都有很多借口。

然后最后一点是,当你个人表现出如此紧迫感时,它会让其他人也产生紧迫感。每个供应商都有很多客户,每个供应商都有很多项目在进行,而他让自己成为其他人所有项目的最高优先级。他通过展示这一点来做到这一点。

Lex:是的,我参加过很多那样的会议。看起来很有趣,因为真的,没有足够的人问这样的问题:"好吧,这能做得快很多吗?怎么做?为什么必须花这么长时间?"

Jensen:对。而且这往往变成一个工程问题。我记得有一次和他在一起时,他真的在经历将电缆插入机架的整个过程。他正在与一位在地面上执行该任务的工程师合作,他只是试图了解这个过程是什么样的,以便减少错误。

从组装数据中心涉及的每项任务中建立直觉,你立即开始在详细尺度和广泛系统尺度上感知到效率低下的地方,因此你可以使其越来越高效。另外,你还有能够说"让我们完全不同地做"的大锤。

Lex:在 NVIDIA 极限系统协同设计方法中,你是否看到了 Elon 处理系统工程的方式的相似之处?

Jensen:首先,协同设计是终极的系统工程问题。我们从这个角度来处理我们的工作。

我做的另一件事,这是一种哲学、思想、心态,我想是一种方法,我 30 年前就开始了,它叫做光速(speed of light)。

Lex:能详细解释一下"光速"哲学吗?

Jensen:光速不仅仅是关于速度。光速是我对"物理能做什么的极限是什么"的简写。我们做的每一件事都要与光速进行比较,内存速度、数学速度、功率、成本、时间、努力、人数、制造周期时间。

当你考虑延迟与吞吐量、成本与吞吐量、成本与容量时,所有这些东西,你都要针对光速进行测试,以分别实现所有这些不同的约束。然后当你把它们放在一起考虑时,你知道必须做出妥协,因为实现极低延迟的系统与实现非常高吞吐量的系统在架构上是根本不同的。

但你想知道实现高吞吐量的系统的光速是什么,实现低延迟的系统的光速是什么。然后当你考虑整个系统时,你可以做出权衡。

Lex:这与持续改进的方法有什么不同?

Jensen:我不喜欢其他方法,就是持续改进。持续改进的问题是,首先,你应该从第一性原理设计一些东西,用光速思维。

只受物理极限的限制。在那之后,当然你会随着时间的推移改进它。但我不喜欢进入一个问题时有人说,"嘿,今天做这件事需要 74 天,我们可以为你在 72 天内完成。"

我宁愿把一切都剥离回零,然后说,"首先,向我解释为什么是 74 天。让我们想想今天什么是可能的。如果我要从头开始完全构建它,需要多长时间?" 通常,你会惊讶地发现可能只需要 6 天。

现在,从 6 天到 74 天的其余部分,可能都有很好的理由和妥协,成本降低,以及各种不同的事情。但至少你知道它们是什么。现在你知道 6 天是可能的,那么从 74 天到 6 天的对话就会有效得多。

Lex:Vera Rubin pod 有 7 种芯片类型、40 个机架、近 2 万个 NVIDIA 芯片……复杂到这种程度,简单性还是你在设计时追求的目标吗?

Jensen:那只是一个 pod。我们可能每周要生产大约 200 个这样的 pod,只是让你有个概念。

Lex:有这么多不同的组件,我想简单性是不可能的,但这是你在设计时努力达到的指标吗?

Jensen:我最常用的短语是,我们需要事物尽可能复杂,但尽可能简单。所以问题是,所有那些复杂性都是必要的吗?我们应该测试这一点。我们必须挑战这一点。然后在那之后,其他一切都是多余的。

Lex:这仍然几乎令人难以置信。半导体行业广泛来说,但 NVIDIA 正在做的,是历史上最伟大的工程之一。这些系统真的是工程奇迹。

Jensen:这是世界上制造过的最复杂的计算机。当你设计一家公司时,你应该首先考虑你希望公司生产什么。公司的目标是成为生产输出的机械、机制和系统。那个输出就是我们喜欢创造的产品。

06开源就是最快的创新放大器,中国比任何人都懂这一点

Lex:中国在过去十年建立了这么多世界级的科技公司和工程团队。你怎么理解这件事是怎么发生的?

Jensen:有很多原因。首先,让我们从一些事实开始。全世界 50% 的 AI 研究者是中国人,大概是这个比例,而且他们大多数仍在中国。我们这里有很多中国研究者,但中国仍有非常优秀的研究者。

他们的技术产业恰好在正确的时间出现。在移动云时代,他们的贡献方式是软件,所以这是一个在科学和数学方面非常出色的国家。孩子们受过良好教育。他们的技术产业是在软件时代创建的。他们对现代软件非常熟悉。

他们还有一种社会文化,家庭第一,朋友第二,公司第三。因此,他们之间的交流量非常大。他们本质上一直都是开源的。所以他们更多地贡献给开源是非常合理的,因为他们会想,"我们在保护什么?"你知道,我的工程师,他们的兄弟在那家公司,他们的朋友在那家公司,他们都是校友。

Lex:所以知识共享是文化的一部分?

Jensen:校友的概念。有一个校友,你就是终身兄弟。所以他们分享知识非常、非常快。因此没有必要隐藏技术。你还不如把它放在开源上。所以开源社区就会放大、加速创新过程。

你得到的是快速的、令人难以置信的优秀人才,由于开源和朋友的本质而产生的快速创新,以及公司之间的疯狂竞争。出现的是令人难以置信的东西。所以这是当今世界上创新速度最快的国家。

Lex:而且从文化上来说,在中国做工程师是很酷的事情。聊聊开源,你提到了 DeepSeek 和 MiniMax 这些公司真的在推动开源 AI。NVIDIA 也在发布接近最先进水平的开源LLM。你对开源的愿景是什么?

Jensen:首先,如果我们要成为一家伟大的 AI 计算公司,我们必须了解 AI 模型是如何演进的。我喜欢 Nemotron 3 的一点是,它不只是一个纯 transformer 模型,它是 transformer 和 SSM 的结合。我们很早就开发了条件 GAN,这些渐进式 GAN 一步步导向了扩散模型。

所以,我们在模型架构和不同领域进行基础研究这一事实,让我们能够看到什么样的计算系统会适合未来的模型。这是我们极限协同设计策略的一部分。

其次,我认为我们正确地认识到,一方面,我们想要世界级的模型作为产品,它们应该是专有的。另一方面,我们也希望 AI 扩散到每个行业、每个国家、每个研究者、每个学生。如果一切都是专有的,就很难进行研究,很难在上面、围绕它、与它一起创新。

所以开源对于许多行业加入 AI 革命是根本必要的。NVIDIA 有规模,我们有动机不仅有技能、规模和动力来建立并继续建立这些 AI 模型,只要我们还活着。

第三个原因是认识到AI 不仅仅是语言。这些 AI 可能会使用在其他信息模态上训练的工具、模型和子 Agent。也许是生物学或化学,或者物理定律,或者流体和热力学,并非所有这些都是语言结构。

所以必须有人去确保天气预测、生物学 AI、物理 AI,所有这些东西都能被推到极限和前沿。

Lex:这对不同行业意味着什么?

Jensen:我们不制造汽车,但我们想确保每家汽车公司都能获得优秀的模型。我们不发现药物,但我想确保礼来公司拥有世界上最好的生物学 AI 系统,这样他们就可以用它来发现药物。

所以这三个基本原因,既认识到 AI 不仅仅是语言,AI 真的很广泛,我们想让每个人都参与到 AI 世界中,然后还有 AI 的协同设计。

Lex:我必须说,再次感谢你们开源,真正开源 Nemotron 3。

Jensen:是的,我很感激你这么说。我们开源了模型,我们开源了权重,我们开源了数据,我们开源了我们如何创建它。是的,这非常了不起。


转载原创文章请添加微信:founderparker

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
成都宝妈近一年狂扫5套“老破小”!地铁口+软装实现以租养贷

成都宝妈近一年狂扫5套“老破小”!地铁口+软装实现以租养贷

封面新闻
2026-03-25 21:28:05
核圈失守!以色列防空神话被击穿,伊朗打击圈冲出中东近4000公里,美以伊三方棋局彻底乱了!

核圈失守!以色列防空神话被击穿,伊朗打击圈冲出中东近4000公里,美以伊三方棋局彻底乱了!

国是直通车
2026-03-22 16:00:02
纳斯达克综合指数向上触及22000点,最新报22011.97点,日内上涨1.15%

纳斯达克综合指数向上触及22000点,最新报22011.97点,日内上涨1.15%

每日经济新闻
2026-03-25 22:26:16
80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

抽象派大师
2026-03-25 12:04:28
扎心!俄爱国军事博主摊牌:再征40万大军也白搭,战场早已变天!

扎心!俄爱国军事博主摊牌:再征40万大军也白搭,战场早已变天!

老马拉车莫少装
2026-03-25 07:41:30
1982年血色使馆:中国外交官唐健生为了生存杀光了所有同事

1982年血色使馆:中国外交官唐健生为了生存杀光了所有同事

阿校谈史
2026-03-20 11:03:27
张雪峰“被去世”乌龙:全网慌了!谁来替寒门说真话

张雪峰“被去世”乌龙:全网慌了!谁来替寒门说真话

舟望停云
2026-03-26 00:55:54
库珀摊牌:伊朗海军趴窝、战机停飞、导弹哑火!

库珀摊牌:伊朗海军趴窝、战机停飞、导弹哑火!

老马拉车莫少装
2026-03-21 20:55:08
默森:被击溃时枪手几乎没人愿拿球;不敢想巴萨能对其做什么

默森:被击溃时枪手几乎没人愿拿球;不敢想巴萨能对其做什么

懂球帝
2026-03-25 03:45:04
真要走了?5首轮豪赌!火箭再梭哈,杜兰特+字母哥?

真要走了?5首轮豪赌!火箭再梭哈,杜兰特+字母哥?

篮球盛世
2026-03-25 22:25:51
末代港督彭定康夫妇,带3个漂亮女儿回英国,29年过去今过得咋样

末代港督彭定康夫妇,带3个漂亮女儿回英国,29年过去今过得咋样

揽星河的笔记
2026-03-26 00:26:09
欧美进一步“离心”?德总统:对美信任已然丧失;法国防参谋长:美已“不可预测”

欧美进一步“离心”?德总统:对美信任已然丧失;法国防参谋长:美已“不可预测”

红星新闻
2026-03-25 13:54:18
泡泡玛特闪崩,市值蒸发600亿!发生了什么?

泡泡玛特闪崩,市值蒸发600亿!发生了什么?

说财猫
2026-03-25 16:45:41
U23国足2-2战平泰国,赛后球员评分:5人优秀,2人拉胯,MVP出炉

U23国足2-2战平泰国,赛后球员评分:5人优秀,2人拉胯,MVP出炉

小火箭爱体育
2026-03-25 22:09:04
张雪峰现任妻子遭扒,曝其去年再婚有儿子,年轻漂亮还很清纯

张雪峰现任妻子遭扒,曝其去年再婚有儿子,年轻漂亮还很清纯

古希腊掌管松饼的神
2026-03-25 14:28:44
河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

奇思妙想草叶君
2026-03-25 13:12:39
夫妻性生活:别再傻傻用力了!让妻子上瘾的三个技巧,男人必看!

夫妻性生活:别再傻傻用力了!让妻子上瘾的三个技巧,男人必看!

精彩分享快乐
2025-11-20 00:05:03
国际油价短线跳水并抹去此前涨幅 WTI原油期货向下跌破90美元/桶

国际油价短线跳水并抹去此前涨幅 WTI原油期货向下跌破90美元/桶

财联社
2026-03-25 04:28:04
燃气调价通知

燃气调价通知

孝感汇
2026-03-25 16:38:10
伊朗做出“重大让步”,送给美国一份大礼,特朗普要得偿所愿了?

伊朗做出“重大让步”,送给美国一份大礼,特朗普要得偿所愿了?

悄悄史话
2026-03-25 22:22:25
2026-03-26 02:43:00
FounderPark incentive-icons
FounderPark
关注AI创业,专注和创业者聊真问题
1182文章数 160关注度
往期回顾 全部

科技要闻

红极一时却草草收场,Sora宣布正式关停

头条要闻

伊朗:正在搜捕逃亡美军

头条要闻

伊朗:正在搜捕逃亡美军

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

管涛:中东局势如何影响人民币汇率走势?

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

健康
教育
艺术
游戏
家居

转头就晕的耳石症,能开车上班吗?

教育要闻

那些躺平的孩子,其实是看透了父母的伪装

艺术要闻

张雪峰走了,他公司所在的这栋楼高177.8米,耗资超10亿!

PS6升级动力遭质疑!玩家或当“PS5钉子户”

家居要闻

轻奢堇天府 小资情调

无障碍浏览 进入关怀版