|未经许可不得转载星标本号获取最新顶级认知|
![]()
整理: Web3天空之城
城主说| 今天发布的两位科技大V (Dwarkesh Patel和Dylan Patel) 与微软CEO纳德拉的最新深入访谈, 探讨了微软在人工智能时代的战略定位。萨蒂亚·纳德拉详细阐述了微软如何从一家软件公司转型为资本与知识密集型的工业企业,其核心战略是构建一个开放、可互换的超大规模基础设施,以支持包括OpenAI、开源模型及自研模型在内的多元化AI生态。访谈覆盖了商业模式演变、激烈的市场竞争、自研芯片的进展、与OpenAI的合作关系、全球数据中心布局的战略考量以及主权AI的地缘政治影响等关键议题。纳德拉强调,微软的目标是成为支持AI代理工作的基础设施平台,并通过建立全球信任来赢得未来。
城主认为, 微软在今天这个时间点上, 自研顶级大模型的缺失和与OpenAI说不清道不明的利益纠缠, 可能一步一步的给自己造了个坑, 虽然Azure依然强劲, 世界最大AI托管商依然没问题, 但以上两朵乌云,可能预示着未来的暴风骤雨
所以纳德拉必须出来继续交流.
对话放在了微软的最新数据中心, 号称“世界上最强大”的数据中心。这里,光纤连接的数量超过了两年前整个Azure网络的-总和。纳德拉以前所未有的坦率,揭示了微软如何主动进行自我颠覆:从一家知识密集型的软件公司,进化为一家同时具备资本与知识双重密集属性的“新工业巨头”。
他描绘的蓝图并非是成为某家明星AI公司的独家“托管商”——他将此称为“不是一项事业”——而是要构建一个能够容纳OpenAI、开源模型及未来未知突破的、开放且具备高度“可互换性”的超大规模基础设施平台。面对AI革命引发的巨额资本支出、激烈的市场竞争以及日益复杂的地缘政治格局,纳德拉详细阐述了微软的生存法则:以软件定义资本效率,用AI代理重塑商业模式,并最终通过建立全球信任来赢得这场漫长的战争。这不仅是关于微软的战略,更是对整个AI产业未来形态的一次深刻预判。
完整视频:
时间戳章节:
0:00:00 人工智能的演进与未来展望
0:09:21 微软的转型之路:从软件许可到AI服务
0:13:41 AI编码助手市场的竞争格局与GitHub的机遇
0:20:55 AI模型与支架:价值分配的探讨
0:25:39 构建AI大脑:Excel代理的案例分析
0:31:19 从终端用户工具到AI代理基础设施
0:33:48 AI模型训练与迁移:微软的适应策略
0:35:12 混合世界中的智能体协同与基础设施需求
0:37:11 微软的AI模型战略与OpenAI合作
0:40:39 构建支持多种模型的基础设施
0:41:38 微软AI团队的建设与突破
0:43:36 持续学习的模型与市场格局
0:47:36 AI时代的资本支出与数据中心战略
0:52:33 AI工作负载的需求与Azure的平台构建
0:56:39 微软对未来50年的思考与超大规模业务的本质
1:03:38 自研芯片与英伟达合作:微软的AI加速器策略
1:07:26 OpenAI合作与无状态API的独家权利
1:09:56 工业企业转型与知识密集型资本效率
1:12:50 超大规模企业与AGI/ASI的长期投资
1:15:56 全球化与主权AI的博弈:微软的应对之道
核心观点摘要
• “我们不想仅仅成为一家公司的主机托管商,并仅与一个客户拥有大量的业务。那不是一项事业。”
• “你不能构建一个针对一个模型优化的基础设施……你的整个网络拓扑结构就会失效,那将是一件可怕的事情。”
• “我们现在是一家资本密集型企业和一家知识密集型企业,事实上,我们必须利用我们的知识来提高资本支出的投资回报率。”
• “我们的业务,今天是一个终端用户工具业务,将基本上变成一个支持智能体(AI代理)工作的的基础设施业务。”
• “如果你是一家模型公司,你可能会遭遇赢者的诅咒……它就像只需一次复制就可以被商品化一样。”
• “我认为对美国科技的信任可能是最重要的特征。甚至可能不是模型能力……也许这是赢得世界的关键。”
当外界的目光聚焦于OpenAI等模型公司的飞速发展时,纳德拉却冷静地指出了单纯依赖单一客户与技术路线的巨大风险。“我们不想仅仅成为一家公司的主机托管商,并仅与一个客户拥有大量的业务。那不是一项事业。” 他认为,如果微软沦为单一模型公司的基础设施附庸,将面临被技术路线“锁定”的风险,这在模型架构迭代极快的AI领域是致命的。
这种深思熟虑体现在微软数据中心的核心设计理念上——可互换性(Fungibility)。纳德拉解释道,AI模型架构的迭代速度极快,任何针对特定模型(如Transformer)或特定硬件(如特定网络拓扑)优化的基础设施都可能在一夜之间过时。“你不能构建一个针对一个模型优化的基础设施。如果你那样做了,你就离一次调整、一些类似专业知识模块(M-O-E)的突破只有一步之遥,而一旦发生这种情况,你的整个网络拓扑结构就会失效,那将是一件可怕的事情。” 因此,微软选择构建一个灵活、可扩展、能够适应未来从GB200到Vera Rubin Ultra等不同芯片架构和网络拓扑的基础设施网络。这种对“不可知论”的信仰,确保了其巨额资本投入在长达五十年的时间维度上保持战略韧性,从而规避了AI领域的“赢者诅咒”——即便是最前沿的模型,也可能被一次技术范式转移而商品化。
战略支点二:软件定义的资本效率——后SaaS时代的护城河
AI革命带来了前所未有的资本支出竞赛,超大规模企业明年的资本支出预计将高达5000亿美元。这从根本上挑战了SaaS业务“边际成本极低”的传统商业模式。面对这一挑战,纳德拉认为微软的核心优势在于其深厚的软件基因,他将微软重新定义为一家资本密集型企业和一家知识密集型企业,事实上,我们必须利用我们的知识来提高资本支出的投资回报率。
他指出,微软与传统托管商的根本区别在于“软件”。通过系统级的软件优化,微软能够大幅提升硬件的效率和吞吐量。“对于给定的GPT系列,在每美元每瓦特能获得的token吞吐量方面的软件改进,一季度比一季度,一年比一年,都是巨大的,所以是5倍、10倍,在某些情况下可能是40倍。” 这种通过调度算法、系统优化和工作负载管理等软件能力来放大资本效率的策略,是微软在这场昂贵的工业竞赛中维持其利润结构和竞争力的核心护城河。这标志着微软的商业逻辑正从单纯的软件销售,演变为利用软件能力来管理和优化大规模资本投入的新模式。
战略支点三:AI代理经济——商业模式的终极演变
纳德拉对微软未来商业模式的演变,提出了一个颠覆性的判断。他认为,微软将从一个主要提供终端用户工具(如Office 365)的公司,转型为一个服务于AI代理(Agent的基础设施提供商。
“我们的业务,今天是一个终端用户工具业务,将基本上变成一个支持智能体(AI代理)工作的的基础设施业务。” 在这个未来图景中,成千上万的AI代理将自主地执行知识工作,它们同样需要计算、存储、安全、身份管理和可观测性。微软现有的M365、Azure等产品生态,将成为这些非人类“员工”赖以生存和协作的底层“轨道”。这意味着微软的业务增长将不再仅仅与人类用户数量挂钩,而是与AI代理的数量和活动强度挂钩,从而打开一个数量级更为庞大的市场空间。这不仅是对Office业务的重新想象,更是对整个企业IT基础设施的重新定义。
战略支点四:生态系统之战——开放而非封闭的竞争姿态
面对来自Claude Code、Cursor等新兴AI编码工具的激烈竞争,纳德拉表现出开放而非防守的姿态。他认为,新竞争者的涌现恰恰证明了市场正在以前所未有的速度扩张。微软的策略并非是在每个应用上都取得垄断地位,而是通过其强大的平台生态来巩固领导力。
GitHub是这一战略的核心。无论开发者使用哪种AI编码代理,他们的代码仓库最终都流向GitHub。纳德拉透露,微软正计划将GitHub升级为Agent HQ(代理总部),一个所有AI代理都能汇聚、协作和被管理的“控制平面”。“我基本上会将Codex、Claude、认知人员、任何人的代理、GROC,所有这些都打包到一个订阅中。然后我就可以真正地发布任务,引导他们。” 通过提供任务控制、可观测性和统一的管理界面,微软旨在成为AI代理时代的“操作系统”供应商,而非仅仅是另一个应用开发者。这种通过建立“控制平面”而非单一产品来取胜的思路,是典型的平台战略,旨在将竞争对手转化为生态系统的一部分。
战略支点五:全球信任——地缘政治时代最重要的无形资产
在访谈的最后,纳德拉将视野提升到了地缘政治的高度。面对“主权AI”的兴起和全球化的新挑战,他提出了一个深刻的观点:在未来,比模型能力本身更重要的,是在全球范围内建立对美国技术堆栈的信任。
“我认为对美国科技的信任可能是最重要的特征。甚至可能不是模型能力。而是,我能信任你这家公司吗?我能信任你、你的国家及其机构成为一个长期的供应商吗?也许这是赢得世界的关键。”
为此,微软正在全球范围内积极投资建设数据中心,并推出“主权云”等服务,以尊重各国在数据主留、隐私和安全方面的合理关切。纳德拉强调,通过技术(如保密计算)和政策承诺,在全球范围内建立起这种信任,将是微软乃至整个美国科技行业在未来两极化的世界中保持领导地位的基石。这表明,微软的全球化战略已经超越了纯粹的商业考量,进入了构建地缘政治信任的深水区。
结语:着眼五十年的长远布局
从拒绝成为单一客户的托管商,到着眼于AI代理驱动的基础设施业务,再到将全球信任置于战略核心,萨蒂亚·纳德拉的AI棋局,每一步都透露出一种着眼于未来的长远思考。正如他在访谈中所言:“你必须认真思考的不是未来五年要做什么,而是未来五十年要做什么?” 在这个瞬息万变的AI时代,微软选择了一条更复杂、更开放但也可能更具韧性的道路。这盘棋的最终胜负尚不可知,但其背后的战略逻辑,无疑为所有身处这场变革中的企业,提供了深刻的启示。
天空之城全文整理版 导言与数据中心探访
纳德拉: 也许继工业革命之后,这是最重要的事情。但与此同时,我也清醒地认识到这仍然是早期阶段。如果你是一家模型公司,你可能会遭遇赢者的诅咒。你可能已经完成了所有的努力,进行了令人难以置信的创新,但它就像只需一次复制就可以被商品化一样。我们不想仅仅成为一家公司的主机托管商,并仅与一个客户拥有大量的业务。那不是一项事业。你不能构建一个针对一个模型优化的基础设施。如果你那样做了,你就离一次调整、一些类似专业知识模块(M-O-E)的突破只有一步之遥,而一旦发生这种情况,你的整个网络拓扑结构就会失效,那将是一件可怕的事情。
我们的业务,今天是一个终端用户工具业务,将基本上变成一个支持智能体工作的的基础设施业务。你必须认真思考的不是未来五年要做什么,而是未来五十年要做什么?
Dwarkesh: 今天,我们采访萨蒂亚·纳德拉。我们指的是我和Dylan Patel,他是semi-analysis的创始人。萨蒂亚,欢迎。
纳德拉: 谢谢。很好。
Dwarkesh: 感谢您来到亚特兰大。是的,谢谢您带我们参观新设施。看到这些真是太棒了。萨蒂亚和微软云和人工智能执行副总裁斯科特·格思里,带我们参观了他们全新的Fairwater 2数据中心,目前世界上最强大的数据中心。
斯科特: 我们试图每18到24个月将训练能力提高10倍。因此,这实际上是10倍的增长。比之前的便宜货提高了10倍。受过训练。因此,为了说明一下,这个建筑中的光器件数量,网络光器件的数量几乎相当于两年半前整个Azure所有数据中心的光器件数量。大约是500万个网络连接。
Dwarkesh: 你在区域内的不同站点之间以及两个区域之间拥有所有这些带宽。那么这是否像一个关于未来扩展的巨大赌注,你预计未来会出现这种情况?将会出现一些需要两个完全不同的区域来训练的巨大模型。
纳德拉: 目标是能够为大型训练作业聚合这些浮点运算,然后将这些东西跨站点组合在一起。对。 现实情况是,你将使用它进行训练,然后你将使用它进行数据生成。你会以各种方式使用它进行推理。这不像它将永远只用于一种工作负载。
斯科特: 费尔沃特4号,你们会看到它在附近施工,是的,我们也会在同一个pet of bits网络上,这样我们就可以以非常高的速度将两者连接起来,然后基本上我们通过AIWAN连接到密尔沃基。在那里我们正在建造多个其他的费尔沃特?
纳德拉: 确切地说,你可以看到模型并行和数据并行。它本质上是为训练任务、集群、超级集群而构建的,遍布整个园区,然后通过广域网,你可以去威斯consin数据中心,然后你可以真正地运行一个训练任务,并将所有这些任务聚合起来。
斯科特: 我们现在看到的这个是一个单元,里面还没有服务器,没有机架。
迪伦·帕特尔: 一个单元里有多少个机架?
斯科特: 我们考虑过这个问题,但我们不一定非要分享这个数据
迪伦·帕特尔: 这有点我经营一家软件公司。
纳德拉: 欢迎来到软件公司。
迪伦·帕特尔: 一旦我们决定使用GB200和VLink,设计空间有多大?还有多少其他决策需要制定?
纳德拉: 从模型架构到优化的物理方案之间存在耦合。而且从这个意义上来说,它也很可怕,也就是说,将会出现一种新的芯片,很明显,你看看维拉·鲁宾Ultra,它将具有非常不同的功率密度,但冷却要求也会非常不同,所以你有点不想只按照一种规格来构建所有东西。这又回到了我认为我们将进行的对话,那就是你希望随着时间的推移进行扩展,而不是一次性扩展然后被困住。
AI革命的本质与微软的定位
迪伦·帕特尔: 当你回顾过去所有的技术变革,无论是铁路、互联网,还是服装利用中的可替换部件、云,所有这些东西,每一次革命从技术发现到在经济中的推广和普及,所需的时间都变得越来越快。许多参加过Dark Escher播客的人认为,这是最后的科技革命或转型,这一次非常非常不同。至少到目前为止,在市场上,情况是,三年内,我们已经飞速发展到,超大规模企业明年将投入5000亿美元的资本支出,就速度而言,这是以前的革命无法比拟的规模。最终状态似乎也截然不同。你对此的理解似乎与那些人工智能兄弟们截然不同,他们认为通用人工智能(AGI)即将到来,我想更多地了解这一点。
纳德拉: 你看,我首先感到兴奋,这种兴奋感也许在工业革命之后也是最强烈的。因此,我从这个前提开始。但与此同时,我也脚踏实地地认识到,这仍然是早期阶段。我们已经构建了一些非常有用的东西。我们看到了一些很棒的特性。这些比例定律似乎正在发挥作用。我很乐观,它们会继续发挥作用,其中一些,确实需要真正的科学突破,但也有大量的工程和其他工作。
尽管如此,我也有这样的看法,即使是过去70年里计算机领域发生的事情也是一种进步。这种进步帮助我们前进,正如我所说的,我喜欢Raj Reddy用作人工智能隐喻的一件事,他是,他是卡内基梅隆大学的图灵奖得主。而且他一直,即使在通用人工智能之前,他就有了这种比喻,即人工智能应该要么是守护天使,要么是认知放大器。我喜欢这个说法。这是一种思考这件事的简单方式。最终,它对人类的效用是什么?它将成为一个认知放大器和一个守护天使。如果我这样看待它,我就把它看作是一种工具。但你也可以用一种非常神秘的方式来看待它,说,哇,这不仅仅是一种工具。它做了所有这些到目前为止只有人类才能做的事情。但过去很多技术都是如此。只有人类做了很多事情。然后我们添加了能够完成这些任务的工具。
Dwarkesh: 我想我们不必纠结于这里的定义。但也许可以这样理解:可能需要五年、十年、二十年。在某个时候,最终机器会产生萨蒂亚Token,而且微软董事会认为萨蒂亚Token很有价值。采访萨贾会浪费多少这种经济价值?你可能负担不起萨蒂亚Token的API成本。但是,无论你想怎么称呼它,萨蒂亚Token是工具还是代理,都没关系?现在,如果模型的成本大约是每百万Token几美元或几美分,那么经验就有巨大的增长空间。扩展,那里的利润空间很大,一百万个沙特Token价值很高。那么这部分利润会流向哪里?微软参与了其中多大比例的利润?这是我的问题。
纳德拉: 所以我认为在某种意义上,这又回到了经济增长前景究竟会如何的问题。公司会是什么样子?生产力会是什么样子?对我来说,这又回到了,如果说工业革命在经历了大约70年的扩散后才开始出现经济增长,需要记住的另一件事是,即使这次技术的传播速度很快,但要出现真正的经济增长,它必须扩散到工作、工作成果和工作流程都必须改变的程度。所以,我认为企业真正变革所需的变革管理,在某种程度上是被低估的。
所以我认为,展望未来,无论是未来的DorcaschToken还是DillonToken,人类及其产生的Token是否会获得更高的杠杆效应?想想技术的数量。如果没有技术,你还能进行半分析或者制作这个播客吗?肯定不行,你能够达到的规模,没有技术是不可能的。所以问题是,那个规模有多大?它会因为某些新技术的出现而扩大10倍吗?绝对会。因此,无论你正在提升到某个收入数字,还是提升到某个受众数量,或者其他什么。所以我认为这就是将会发生的事情。重点是,不管怎样,工业革命花了70年,可能150年才完成的事情,也许会在20年、25年内发生。这是一个更好的方式,我非常乐意将工业革命200年内发生的事情压缩到20年内,如果你足够幸运的话。
商业模式的演变:从SaaS到AI代理
迪伦·帕特尔: 所以微软在历史上也许一直是,你知道的,最伟大的软件公司,最大的软件即服务公司。你过去经历过一次转型,那时候你出售Windows许可证和Windows或Microsoft的光盘。而现在你出售的是365的订阅,或者正如我们从某种程度上说,从那种转型走向你今天的业务。在那之后还有一次转型,软件即服务,增量成本极低。每个用户,都有大量的研发投入,也有大量的客户获取成本。这就是为什么,不是微软,而是SaaS公司在市场上表现严重不佳,因为人工智能的销售成本(COGS)实在太高了,这完全打破了这些商业模式的运作方式。作为也许是最伟大的软件公司,软件即服务公司,你如何将微软转型到这个销售成本至关重要,每个用户的增量成本不同的新时代,因为现在你在收费,比如,一个Copilot(Copilot)20美元。
纳德拉: 是的,我认为这是一个很好的问题,因为在某种意义上,商业模式本身,我认为杠杆作用将保持相似,也就是说,如果我看看,如果你看看从消费端一直到末端的所有模式菜单,会有一些广告单元。会有一些交易。对于制造人工智能设备的人来说,会存在一些设备毛利率。会有订阅,消费者和企业,然后会有消费,所以我仍然认为这有点这些都是衡量标准。就像你说的,什么是订阅?到目前为止,人们喜欢订阅,因为他们可以为其制定预算,它们本质上是某些消费权利的授权,这些权利封装在订阅中。所以我认为在某种意义上,这变成了一个定价决策。所以你在授权中可以消费多少,如果你看看所有的编码订阅,大概就是这样,它们通常有专业层级、标准层级等等。因此我认为这就是定价的方式,利润结构也会分级。
有趣的是在微软,对我们来说的好消息是,我们实际上已经在所有这些计量方面开展了业务。事实上,作为一个投资组合层面,我们几乎拥有消费、订阅以及所有其他的消费者杠杆。然后我认为时间会证明哪些模型在哪些类别中有意义。
你提到了SaaS,我一直在思考一件事,以Office 365或Microsoft 365为例,拥有低ARPU(每用户平均收入)是件好事,因为这里有一件有趣的事情,在从服务器到云的过渡期间,我们过去常常问自己一个问题,天哪,如果我们所做的只是基本上转移那些使用,我们称之为,我们的Office许可证和我们当时的服务器的用户,Office服务器,对吧,到云端,并且我们有销货成本。这不仅会缩小我们的利润率,而且从根本上说,我们会成为一家无利可图或利润较低的公司。除非发生的事情是,迁移到云端扩大了市场,就像。疯了一样。我们在印度卖了一些服务器,但卖得不多,但在云端,突然印度每个人也能负担得起零星地购买服务器。IT成本,事实上,我没有意识到的最重要的事情,例如,是人们在购买SharePoint下的存储空间上花费了多少钱。事实上,EMC最大的业务可能就是SharePoint的存储服务器。所有这些都下降了。在云端,因为没有人需要去购买。事实上,那是运营资本。基本上,它是现金流出,因此,它极大地扩展了市场。
那么这个人工智能也会是这样,所以,如果你以编码为例,我们在过去几十年里用GitHub和Vs code构建的东西,突然之间,编码助手在一年内就变得如此庞大。所以我认为这就是将要发生的事情,即市场将会大规模扩张。
竞争格局:模型、平台与生态系统
Dwarkesh: 我想存在市场是否会扩张的问题。涉及微软的收入部分会扩大吗?所以,就拿Co-pilot来说,如果你看今年早些时候,我想,根据Dylan的数字,GitHub Copilot的收入大约是5亿美元左右,而且当时几乎没有竞争对手。然而现在,你有ClaudeCode、Cursor和Co-Pilot,它们的收入都差不多在10亿美元左右,然后Codex也在追赶,大约在7亿到8亿美元。所以问题是,在微软能够访问的所有界面上,微软的Co-pilot等同产品有什么优势?
纳德拉: 顺便说一句,我喜欢这张图表。我喜欢这张图表有很多原因。一是,我们仍然名列前茅。第二是,这里列出的所有公司都是在过去四五年里诞生的。对我来说,这是最好的迹象,也就是说,如果你有新的竞争对手,新的生存问题,当你问,天啊,是谁呢?现在,Claude会杀了你。Cursor会杀了你。这不是Borland,所以感谢上帝,这意味着我们方向对了。
但这就是它,我们从一无所有发展到如此规模的事实,就是市场扩张。所以这就像云计算之类的东西。从根本上说,编码人工智能这一类别可能会成为最大的类别之一。这是一个软件工厂类别。事实上,它可能比知识工作更大。所以我想对自己保持开放的态度,我们将会面临激烈的竞争。我认为这就是你的观点,我认为这是一个很棒的观点。但是,伙计,我很高兴我们拥有,我们将我们所拥有的转化成了现在的样子。现在我们必须竞争。
所以在竞争方面,即使在上个季度,我们刚刚结束,我们发布了季度公告,我认为我们的订阅用户从2000万增长到了2600万。所以我对我们的订阅用户增长以及未来的发展方向感到满意。但更有趣的事情是,猜猜所有这些生成大量代码的家伙的仓库都去了哪里,他们都去了GitHub。因此,在仓库创建、PR等方面,GitHub都处于历史最高水平。所以,从某种意义上说,我们希望保持这种开放性,顺便说一句。这意味着我们希望拥有它,对吧,因为我们不想将其与我们自身的增长混为一谈,非常有趣的是,我们每秒钟或类似的时间就有一位开发者加入GitHub。这就是数据,我想。然后是他们中的80%。只是陷入某种GitHub Copilot工作流程,仅仅是因为它们存在。顺便说一下,其中许多东西甚至会使用我们的一些代码审查代理,这些代理默认是开启的,因为你可以使用它。
所以我们将有很多很多结构性的机会。我们还将要做的事情是,就像我们对GitHub的基元所做的那样,从Git到问题,再到行动。这些都是强大而可爱的东西,因为它们都围绕着你的仓库构建。所以我们想要扩展它。上周在GitHub Universe,我们就是这么做的,所以我们说Agent HQ是我们所说的概念性的东西。我们要向外扩展。举例来说,这里会有一个叫做任务控制的东西,你去到任务控制,现在我就可以启动。有时我把它描述为所有这些人工智能代理的闭路电视,因为我基本上会将Codex、Claude,你知道的,认知人员、任何人的代理、GROC,所有这些都打包到一个订阅中。所以我得到一个套餐。然后我就可以真正地发布任务,引导他们。所以他们都将在他们独立的branch中工作。我可以监控他们。所以我真的拥有,因为我认为这将是最大的创新领域之一,因为现在,我希望能够使用多个代理。我希望能够消化多个代理的输出。我希望能够掌控我的代码仓库。所以它能发出一些信息。就像一个抬头显示器,需要构建出来,然后让我能够快速引导和筛选编码代理生成的内容。对我来说,在VS Code、GitHub以及所有我们将作为任务控制中心构建的新原语之间,我认为通过控制平面、可观测性,我是说,想想每一个将要部署这一切的人,都需要对什么代理在什么时间对什么代码库做了什么进行全面的可观测性分析。所以我觉得这是一个机会。
那么最终,你的观点很有道理,那就是我们最好保持竞争力并进行创新。如果我们不这样做,是的,我们会被推翻。但我喜欢这张图表,至少只要我们保持在顶端,即使有竞争。
迪伦·帕特尔: 这里的关键是,无论哪个编码代理胜出,GitHub都会持续增长。但这个市场只会以大约10%、15%、20%的速度增长,远高于GDP。这是一个很好的复合增长器。但是这些AI编码代理已经从,你知道的,比如说去年年底的5亿美元的运行率增长而来,这基本上只是GitHub Copilot,而现在,目前的运行率,你知道的,包括GitHub Copilot、Clodcode、Cursor、Cognition、Winsurf、Replit、Codex,今年第四季度的运行率达到了50亿到60亿美元。这是10倍的增长,当你看到,嘿,软件代理的潜在市场有多大?是你支付给人们的2万亿美元的工资,还是超过了这个数字?因为世界上每家公司现在都能更多地开发软件。毫无疑问,微软会分一杯羹,但是你已经从接近100%或者肯定远高于50%的市场份额,在短短一年内降到了低于25%。人们能有多大的信心认为微软会成为?
纳德拉: 再次强调,这有点回到了“这里没有任何与生俱来的权利,我们应该有任何信心,除了说,嘿,我们应该去创新”。而且在某种意义上,我们知道我们幸运的突破是,这个类别将会比我们拥有高份额的任何东西都要大得多。让我这样说,在某种意义上,你可以说,我们过去在Visc代码中占有很高的份额。我们在GitHub的仓库中占有很高的份额。这是一个不错的市场,但关键在于,即使在一个更加广阔的市场中占有相当可观的份额也是好的,你可以说我们在客户端服务器、服务器计算领域占有很高的份额。但我们在超大规模领域所占的份额要低得多。但这个业务的规模比Mac大了几个数量级,不是吗?所以至少存在一个证据,证明微软一直都还可以,即使我们的市场份额不像以前那么强大,只要我们参与竞争的市场能够创造更多的价值。而且有多个赢家。所以我认为这就是重点。
但我明白你的意思,最终这一切都意味着你必须变得有竞争力。所以我每个季度都会关注这一点。因此,我非常乐观地认为,我们将通过GitHub HQ或Agent HQ把GitHub变成一个所有这些代理都能汇聚的地方。正如我所说,我们会在那里有多次射门得分的机会,不一定非要是这样,嘿,这些人中的一些可以和我们一起成功。因此,不必只有一个赢家和一个订阅。
Dwarkesh: 我想关注这个问题的原因是,它不仅仅是关于GitHub,而是从根本上关于Office以及微软提供的所有其他软件。关于我如何继续,你可以有一种看法,那就是,你看,这些模型会一直受阻,那么你将一直需要这种直接可见的可观测性。另一种看法是,随着时间的推移,这些模型现在正在执行在未来需要两分钟的任务。它们将执行需要10、30分钟的任务。未来,也许它们可以自主地完成几天的工作。然后,模型公司可能会收取数千美元的费用,以获得真正同事的访问权限,这些同事可以使用任何用户界面与他们的人类进行交流,等等,并在平台之间迁移。因此,如果我们越来越接近这一点,为什么模型公司会变得越来越有利可图,而这些模型公司才是获得所有利润的公司呢?为什么支架搭建的地方——随着ZEI变得越来越有能力,这个支架变得越来越不重要——会变得那么重要呢?这也适用于现在存在的办公室,与仅仅是自主进行知识工作的同事们。
纳德拉: 我是说,我认为这很棒。我是说,例如,我是说,这就是,所有价值是否都迁移到模型,或者你知道的更多,价值是否在支架和模型之间分配等等,我认为时间会证明一切,但我的基本观点是激励结构变得清晰,对吧,也就是说,如果你以信息工作为例,甚至以现在的编码为例,事实上,我在GitHub Co-pilot中最喜欢的设置之一叫做自动编写,它可以进行优化。事实上,我购买了一个订阅,自动编写功能将开始挑选并优化我要求它做的事情。它甚至可以是完全自主的,并且可以对多个模型中可用的Token进行套利,以完成任务。因此,如果那是,这意味着,如果你接受这个论点,那么商品将是模型。特别是对于开源模型,你可以选择一个检查点,你可以获取大量数据并进行观察,我认为我们所有人都会开始,无论是从Cursor还是从微软,你都会开始看到一些内部模型,这些模型会将你的大部分任务转交给它。
因此我认为一个论点是,如果你赢得了脚手架,也就是今天处理所有阻碍问题或这种智能问题的参差不齐的问题,你必须这样做,如果你赢得了脚手架,那么你将垂直整合到模型中,仅仅因为你将拥有数据的流动性以及其他的东西,并且将会有足够多的检查点可用,这是另一件事,所以我从结构上认为,世界上将永远存在一个相当有能力的开源模型,只要你有可以使用的东西,也就是数据和脚手架,你就可以使用它,所以我可以争辩说,天啊,如果你是一家模型公司,你可能会遇到赢家的诅咒,你可能已经完成了所有的艰苦工作,完成了令人难以置信的创新,但它就像一个副本,很快就会被商品化,然后是那些拥有数据用于接地和上下文工程以及数据流动性的人,他们可以获取该检查点并对其进行训练,所以我认为可以从两个方面来论证,解开你所说的,对世界有两种看法,一是模型,那里有太多的不同模型。
迪伦·帕特尔: 开源存在,模型之间将存在差异,这将驱动谁胜谁负,但脚手架才是让你获胜的关键。另一种观点是,实际上模型才是关键的知识产权,而且是的,每个人都在激烈的竞争中,而且有一些,你知道的,嘿,我可以使用Anthropic或Open AI,你可以在收入图表中看到这一点,比如Open AI的收入在他们最终拥有了与Anthropic类似的代码模型能力之后开始飞速增长,尽管方式不同。有一种观点认为,模型公司实际上才是获得所有利润的人,因为,如果你看看今年,至少在Anthropic上,他们在推理方面的毛利率从远低于40%上升到超过60%,到今年年底,尽管有比以往任何时候都多的中国开源模型,但利润率仍在扩大。嘿,Open AI是有竞争力的。嘿,谷歌是有竞争力的。嘿,X. GROC现在是有竞争力的。所有这些公司现在都具有竞争力。然而,尽管如此,模型层的利润率已经显著扩大。是的。您如何看待……
纳德拉: 这是一个很好的问题。我认为有一件事是,也许几年前,人们会说,我可以简单地包装一个模型,然后建立一家成功的公司。我认为,这可能已经被揭穿了,因为模型的能力以及特别是工具的使用。但有趣的是,没有,就像我看到Office 364一样,我们甚至以这个为例。我们构建的一个叫做Excel代理的小东西。这很有趣,Excel代理不是UI层面的包装器。它实际上是一个位于中间层的模型。在这种情况下,由于我们拥有GPT系列的所有知识产权,我们正在利用这些知识产权,并将其放入Office系统的核心中间层中,以教导它如何原生理解Excel及其中的一切。所以不仅仅是我对像素级别的理解。我对Excel的所有原生机制都有充分的理解,无论何时我看到它,因为如果你考虑一下,如果我要给它一些推理任务,对吧,我需要纠正我犯的推理错误。所以这意味着我不仅要看到像素。我需要能够看到,我把那个公式弄错了。我需要理解这一点。所以在某种程度上,这一切都不是在UI封装层用一些提示来完成的,而是在中间层完成的。通过教它Excel的所有工具,所以我甚至本质上是在给它一个标记语言,来教它成为一个精通Excel用户的技能。
所以这是一件很奇怪的事情,它有点回到了AI大脑,也就是你不仅仅是在构建Excel。你现在正在构建传统意义上的业务逻辑。你正在获取传统意义上的Excel业务逻辑,并使用这个知道如何使用该工具的模型,本质上为它封装一个认知层。所以在某种意义上,Excel将会捆绑一个分析师,以及所有使用的工具。那是每个人都会构建的那种东西。所以即使对于模型公司,他们也被允许竞争。所以如果他们的定价很高,你猜怎么着?如果我是这种工具的构建者,我会取代你。我可能会用你一段时间。所以只要有竞争,就总会有一个赢者通吃的东西,如果没有一个模型能以巨大的优势胜过其他所有模型,是的,那就是赢者通吃。只要存在多个模型之间的竞争,就像超大规模竞争一样,并且有一个开源检查,这里就有足够的空间在模型之上构建价值。
但在微软,我看到并说的是,我们将进入超大规模业务,这将支持多个模型。我们将在未来七年内获得OpenAI模型的访问权,我们将在其之上进行创新。所以,本质上,对于版税,我认为我们拥有一个前沿级别的模型,可以充分灵活地利用和创新,并且我们将使用MAI构建我们自己的模型,因此我们将始终拥有一个模型级别,然后我们将构建这些,无论是在安全、知识工作、编码还是科学领域,我们将构建我们自己的应用程序支架,这将是模型优先的,对吧,它不会是模型的包装器,而是模型将被包装到应用程序中。对于你提到的其他事情,我有很多疑问。
Dwarkesh: 但在我们讨论这些话题之前,我仍然想知道这是否不是对人工智能能力的前瞻性看法,你想象的模型就像今天存在的模型一样,是的,你必须像这样,它会截取你屏幕的截图,但它不能像查看每个单元格内部以及公式是什么。我认为这里更好的心智模型是,想象一下这些模型实际上也能像人类一样使用计算机。一个使用Excel的人类知识工作者可以查看公式,可以使用替代软件,如果需要迁移,可以在Office 365和另一款软件之间迁移数据,等等。那么,如果是那样的话,与Excel的集成就不那么重要了。
纳德拉: 不,不,不。不用担心与Excel的集成。毕竟,Excel最初是作为分析师的工具而构建的。很好。所以,无论哪个作为分析师的AI,都应该有他们可以使用的工具。他们可以使用电脑,
Dwarkesh: 就像人类可以使用电脑一样。那是他们的工具。
纳德拉: 工具就是电脑。对。好的。所以我所说的只是,我正在构建一个分析师,本质上是一个AI代理,它恰好具备使用所有这些分析工具的先验知识。
Dwarkesh: 但它是否是某种东西,也许是为了确保我们讨论的是同一件事?它是否像我这样的人使用Excel一样,我作为一个播客主,并不精通Excel?完全自主。
纳德拉: 所以想象一下我工作,就像我们现在应该稍微阐述一下,我为什么认为这就是公司的未来,公司的未来将是工具业务,我有一台电脑,我使用Excel,事实上,在未来,我甚至会有一个Copilot,而那个Copilot也会有代理,我仍然是这样,仍然是我在掌控一切,一切都会回到我这里。这算是一种世界。那么第二种世界是公司仅仅为AI代理提供计算资源。并且它是完全自主工作的。那个完全自主的代理将拥有本质上与它可用的相同的工具集。对。因此,这款AI工具的到来,不仅仅拥有一台原始计算机,因为它使用工具来完成任务会更加节省Token。
事实上,我有点这样看待它,我们的业务,今天是一个终端用户工具业务,本质上将变成一个支持代理执行工作的基础设施业务。这是另一种思考方式,因此,你们将会看到我们做的事情之一,事实上,我们在M365下构建的所有东西仍然会非常重要,你需要一个地方来存储它,一个地方来进行归档,一个地方来进行发现,一个地方来管理所有这些活动,即使你是一个AI代理。所以这是,所以这算是一种新的基础设施。
Dwarkesh: 所以为了确保我理解正确,您是说,比如,看,理论上,未来拥有实际计算机使用能力的人工智能(所有这些公司都在致力于此,模型公司现在也在努力),可以使用微软的软件,即使它没有与微软合作或者不在我们的保护伞下。但您是说,如果与我们的基础设施合作,我们将给您更低级别的访问权限,这能让您更有效地完成您无论如何都能做到的事情。
纳德拉: 百分之百正确。实际上,整个事情,就像发生的那样,我们有服务器,然后是虚拟化,而且他们拥有更多的服务器。所以这是另一种思考方式,即,嘿,不要把工具看作是最终的东西。在人类使用的工具之下,整个底层结构是什么?整个底层结构也是人工智能代理的引导程序,因为人工智能代理需要一台计算机,这算是一个方面。比如,所以事实上,我们看到大量增长的一个有趣的事情是,所有这些将办公文档和其他东西作为自主代理的人,等等,都希望配置Windows 365,他们真的希望能够为这些代理配置一台计算机。当然是这样。
这就是为什么我认为我们将会拥有一个本质上的终端用户计算基础设施业务,而且我认为它会持续增长,因为你们猜怎么着?它的增长速度会超过用户数量。事实上,这也是人们问我的另一个问题,嘿,每个用户的业务会怎么样?至少早期的迹象表明,考虑每个用户业务的方式不仅仅是每个用户,而是每个代理。如果你认为它是每个用户和每个代理,关键在于为每个代理配置什么东西?一台计算机、围绕它的一系列安全措施、一个身份,以及所有这些东西,可观察性等等,都是管理层。而且我认为所有这些都会被融入其中。
迪伦·帕特尔: 至少我目前是这样看待它的,我也想听听你的看法,这些模型公司都在构建环境,以便训练他们的模型来使用 Excel 或亚马逊购物或其他任何东西,预订航班。但与此同时,他们也在训练这些模型进行迁移,因为这可能是最直接最有价值的事情,将基于大型主机的系统转换为标准云系统,将Excel数据库转换为带有SQL的真实数据库,或者转换,用什么做的?将Word和Excel中的内容转换为在经典意义上更具程序化和效率的内容,并且实际上可以由人类完成。只是对于软件开发者来说,这样做不划算。至少在未来几年,这似乎是每个人都会利用人工智能来大规模创造价值的方式。
如果模型可以利用工具本身迁移到某种东西,那么微软如何适应这种情况?是的,微软在数据库、存储以及所有其他类别中都处于领先地位。但是,例如,office生态系统的使用将会显著减少,就像大型机生态系统的使用可能会减少一样。现在,大型机在过去二十年中实际上一直在增长,即使没有人再谈论它们,它们仍在增长。是的,100%。我同意。这会如何向前发展?
纳德拉: 是的。归根结底,这并不是说,嘿,会有一段相当长的时间存在一个混合世界,因为人们将要使用工具,将要与必须使用工具的代理协同工作。顺便说一句,他们必须彼此沟通。我生成的、然后需要人查看的成果是什么?所以,所有这些事情在任何地方都将是需要认真考虑的。所以是输出、输入,我不认为这仅仅是关于,我迁移出去了,但最重要的是我必须生活在这个混合世界中。
但这并没有完全回答你的问题,因为可能存在一个真正新的效率前沿,那就是代理与代理协同工作并完全优化。即使智能体与智能体协同工作,需要哪些基本要素?你需要一个存储系统吗?这个存储系统需要有电子取证功能吗?电子取证功能需要可观测性吗?你需要一个身份系统,该系统将使用多个模型,并且所有模型都使用一个身份系统吗?这些是我们今天为办公系统等提供的所有核心底层轨道。我认为未来也会如此。你提到了数据库,伙计。我希望所有Excel都有数据库备份,事实上,我希望所有这些立即发生。并且那个数据库是一个好的数据库。事实上,数据库将会是一件将会增长的大事。事实上,如果我想到所有办公室的文档都被更好地结构化,由于代理世界,更好地在结构化和非结构化之间进行连接的能力。那将会增长潜在的,什么是基础设施业务。
发生的事情是,它的消耗全部由代理驱动。你可以说所有那些都只是模型公司及时生成的软件。那也可能是真的。如果我们,我们也会是这样一家模型公司。因此我们将会构建进去。因此竞争可能是我们将构建一个模型加上所有基础设施并进行配置。然后,能够做到这一点的人之间就会出现竞争。
微软的自研模型与OpenAI合作关系
Dwarkesh: 我想说到模型公司,你说,好的,我们也将成为其中之一,不仅拥有基础设施,还拥有模型本身。目前,微软人工智能两个月前发布的最新模型在Chabot Arena中排名第36位。而且,你显然拥有OpenAI的知识产权。因此,首先存在一个问题,在某种程度上你同意它似乎落后了,为什么会这样?特别是考虑到你可以在理论上有权直接像fork opening eyes mono repo一样,或者提炼他们的模型。是的,特别是如果这是你战略的重要组成部分,我们需要拥有一家领先的模型公司。
纳德拉: 是的,首先,我们绝对会最大限度地使用OpenAI模型。遍及我们所有的产品,我认为,这是我们将在未来七年一直做下去的核心事情,不仅要使用它,还要为其增加价值。这就是分析师和这个Excel代理,这些都是我们将要做的,我们将进行微调,我们将基于GPT系列进行一些中间训练运行,在那里我们拥有独特的数据资产并建立能力。
MAI模型,我认为我们考虑它的方式是,事实上,好消息是,有了新协议,即使我们可以非常清楚地表明,我们将建立一个世界级的超级智能团队,并以崇高的目标去追求它。但与此同时,我们也将利用这段时间来聪明地思考如何同时使用这两种东西。所以这意味着我们一方面将非常注重产品。另一方面,非常注重研究。换句话说,因为我们可以访问GPT系列。我最不想做的事情是以某种方式使用我的浮点运算能力,而这种方式只是重复的,没有增加多少价值。所以我希望能够利用我们用来生成GPT系列的浮点运算能力,并使其价值最大化。
当我的MAI浮点运算能力被用于,比如我们推出的图像模型,我认为这次发布在图像领域排名第九。我们正在使用它,既用于成本优化。它在Copilot上,在Bing中,我们将使用它。我们在Copilot系统中拥有音频模型,它确实具有个性以及其他特性。我们针对我们的产品对其进行了优化。所以我们会做这些。即使在Elm Arena上,我们也是从文本模型开始的,我记得它首次亮相是在1913。顺便说一句,它仅使用了15,000个H-100完成。所以它是一个非常小的模型。因此,再次说明,这是为了验证核心能力、指令遵循以及其他一切,我们希望确保我们能达到最先进的水平。这向我们展示了,鉴于扩展定律,如果我们有更多的流程,我们能够做什么。向上调整,因此,接下来我们将做一个Omni模型,在该模型中,我们将采用我们在音频、图像和文本方面所做的工作。这将是MAI方面的下一个中途停留点。
所以当我想象MAI的路线图时,我们将建立一个一流的超级智能团队。我们将继续公开地发布和执行其中的一些模型。它们要么在我们的产品中使用,因为它们具有延迟友好性、齿轮友好性或其他特性,要么它们具有一些特殊的功能。我们将进行真正的研究,以便为通往超级智能的征程中所需的未来五、六、七、八项突破做好准备。所以我认为这就是,并且在利用我们拥有的GPT系列的优势,我们也可以在此基础上进行工作。
迪伦·帕特尔: 假设我们向前推进七年,您不再能够访问OpenAI模型。那么,人们如何获得信心?或者微软如何确保他们处于领先地位,拥有一个领先的AI实验室?今天,所有OpenAI都开发了许多突破,无论是扩展还是推理,或者谷歌开发了像 former这样的所有突破,但这也是一场巨大的人才争夺战,你已经看到Meta在人才方面花费了超过200亿美元,你已经看到Anthropic去年从谷歌挖走了整个Blue Shift推理团队。你已经看到Meta最近从谷歌挖走了一个大型的推理和后训练团队。这种人才争夺战非常耗费资金。可以说,如果你在基础设施上花费1000亿美元,你也应该在使用基础设施的人身上花费X数量的资金,以便他们更有效地取得这些新的突破。人们能有什么信心认为,微软会拥有一支世界一流的团队,能够取得这些突破。一旦你决定打开资金的水龙头,你现在就有点资本效率了,这是明智的,似乎是为了不浪费钱做重复的工作。但是一旦你决定需要这样做,一个人怎么才能说,是的,现在你可以提升到前五名的模型水平。
纳德拉: 听着,归根结底,我们将建立一个世界一流的团队,而且我们已经有了一个世界一流的团队,它已经开始组建起来了,随着穆斯塔法的加入,我们有凯伦,我们有阿马尔·苏布拉曼尼扬,他在Gemini做了大量的后训练工作,25岁,他在微软,南多,他在DeepMind做了大量的多媒体工作。所以我们将建立一个世界一流的团队。事实上,我认为本周晚些时候,甚至穆斯塔法也发布了一些信息,让你对我们的实验室将要做什么有更多的了解。
我想让世界知道的是,或许,我们将要构建支持多种模型的基础设施。因为从超大规模的角度来看,我们希望构建最具规模的基础设施集群,能够支持世界所需的所有模型,无论它们是来自开源的,还是显然来自Open AI和其他公司。所以这算是一个工作。第二个是关于我们自己的模型能力,我们绝对会在我们的产品中使用Open AI模型。我们也将开始构建我们自己的模型。而且我们可能会像在GitHub Copilot中那样,使用Anthropic。因此,我们甚至会将其他前沿模型也融入到我们的产品中。所以我认为,至少在每一次,最终,产品在满足特定任务或工作时的评估才是最重要的。我们将从那里倒推到所需的垂直整合,知道只要你的服务,你的产品能很好地服务于市场,你总是可以进行成本优化。
持续学习与赢者通吃的悖论
Dwarkesh: 接下来会有一个问题。所以现在我们拥有的模型在训练和推理之间存在这种区别,有人可能会说,不同模型之间的差异越来越小。展望未来,如果你真的期望达到类似人类水平的智能,那么人类会在工作中学习。如果你想想过去的30年,是什么让萨蒂亚Token如此有价值?这是你在微软获得的过去30年的智慧和经验。如果我们最终拥有达到人类水平的模型,它们将具备在工作中持续学习的能力。在我看来,这将为领先的模型公司带来巨大的价值,因为你拥有一个模型的副本,它被广泛地部署在整个经济领域,学习如何完成每一项工作。与人类不同,它们可以将它们的学习成果整合到该模型中。因此,存在着一种持续学习的、类似指数级的反馈循环,这几乎看起来像是某种智能爆炸。如果这种情况发生,而届时微软还不是领先的模型公司,那么,你说,好吧,我们用一个模型代替另一个模型等等,这就不那么重要了,因为就像是,这个模型知道如何完成经济中的每一项工作,而其他长尾模型则不然。
纳德拉: 是的,不,我认为你的观点是,如果有一个模型是世界上部署最广泛的唯一模型,并且它看到了所有的数据,并且它具有持续学习的能力,那么就胜券在握了。并且,非常敏锐,至少我看到的现实是,即使在今天,对于任何一种模式的统治,世界也不是这样的。以编程为例。有多种模型。事实上,每天,越来越少出现只部署一种模型的情况。事实上,正在部署多种模型。这有点像数据库,总是这样,比如,嘿,有没有一种数据库可以被用于任何地方,但事实并非如此。有多种类型的数据库被部署用于不同的用例。
所以我认为,持续学习或数据会产生一些网络效应,我会称之为任何一种模型所拥有的流动性。它会在所有领域发生吗?我不这么认为。它会在所有GO(通用目标)中发生吗?我不这么认为。它会在所有细分市场中发生吗?我不这么认为。它会同时在所有类别中发生。我不这么认为。因此,我认为设计空间非常大,机会很多。
但你的根本观点是拥有一种能力,这种能力存在于基础设施层、模型层和支架层,然后能够组合这些东西,不仅仅是作为一个垂直堆栈,而且能够根据每个东西的用途来组合它们。你不能构建一个针对单一模型优化的基础设施。如果你那样做,如果你落后了怎么办?事实上,你构建的所有基础设施都将是一种浪费,你需要构建一种能够支持多种模型家族和谱系的基础设施。否则,你投入的资本针对一种模型架构进行了优化,这意味着你离其他人发生的类似MOE(混合专家模型)的 breakthrough 只有一步之遥,而你的整个网络拓扑结构都会被淘汰,那是件可怕的事情,因此,你希望基础设施能够支持任何可能发生的事情,实际上,包括你自己的模型家族和其他模型家族。而且你必须保持开放。如果你是认真地想做超大规模业务,你就必须认真对待这一点,如果你是认真地想成为一家模型公司,你基本上必须说,嘿,人们有哪些方法可以在模型之上做事,这样我才能拥有一个独立软件供应商(ISV)生态系统,除非我打算拥有每个类别?那是不可能的。那么你就不会有API业务。根据定义,这将意味着你永远不会成为一家能够在各地成功部署的平台公司。
因此,行业结构就是这样,它实际上会迫使人们进行专业化。在这种专业化中,像微软这样的公司应该凭借自身的优势在每一层竞争,而不是认为这完全是通往比赛胜利的道路,我只是垂直地组合所有这些层。那是不可能发生的。
超大规模基础设施的战略抉择
Dwarkesh: 因此,根据迪伦的数字,明年仅人工智能的资本支出就将达到5000亿美元。各个实验室已经在花费数十亿美元来争夺顶尖的研究人才。但是,如果没有足够的高质量数据来进行训练,这一切都无关紧要。如果没有正确的数据,即使是最先进的基础设施和世界一流的人才也无法转化为用户的最终价值。这就是Libelbox的用武之地。Labelbox以大规模生产高质量数据,为你的模型提供你想要的任何能力。无论是需要对多小时轨迹进行详细反馈的编码代理,还是需要数千个日常任务样本的机器人模型,亦或是可以为用户执行现实世界操作(如预订航班)的语音代理,都无关紧要。需要明确的是,这不仅仅是现成的数据。Labelbox可以在48小时内设计并启动定制的生产规模数据管道,并且可以在几周内为你提供数万个有针对性的示例。请访问laywobox.com斜杠Duar Keshe。好了,回到萨蒂亚。
迪伦·帕特尔: 去年,微软原本有望成为迄今为止最大的基础设施提供商。你们在23年是最早的。所以你们走出去,获得了所有资源,包括租赁数据中心、开始建设、确保电力供应等等。你们原本有望在26或27年击败亚马逊。但肯定到28年,你们将会击败他们。自那以后,在去年的下半年,微软做了一个大的暂停,他们放弃了很多他们原本打算租赁的场地。准备拿下的,然后谷歌、Meta、亚马逊(在某些情况下)、甲骨文拿下了这些场地。我们现在就坐在世界上最大的数据中心之一。显然,这并不意味着你们的所有业务,你们还在疯狂扩张。但是有些场地你们只是停止了工作。你们为什么这么做,
纳德拉: 是的,根本的事情是,这可以追溯到超大规模业务的本质,我们做出的一个关键决定是,如果你要构建Azure,为了使其在AI的各种阶段(从训练到中期训练到数据生成到推理)都表现出色,我们需要机群的互换性。因此,整个事情导致我们基本上没有用特定的一代产品来构建大量容量。因为你必须意识到另一件事是,实际上现在每18个月需要为各种开放AI模型提供高达10倍的训练能力。我们意识到关键是保持在那条道路上,但更重要的是实际保持平衡,不仅要训练,还要能够在世界各地为这些模型提供服务。因为归根结底,货币化率将决定我们是否能够继续获得资金。然后,正如我所说,基础设施将需要我们支持多个模型。等等。
因此,一旦我们确定了这种情况,从那时起,我们就调整到了我们正在走的道路上,如果我看看我们正在走的道路,我们现在正在做更多的事情。我们也在尽可能多地购买货币容量,无论是建造、租赁,甚至是GPU即服务,但我们正在根据我们看到的市场需求、服务需求和训练需求来构建它。而且我们不想仅仅成为一家公司的主机,并且只与一个客户有大量的业务往来。那不是生意,这有点你应该与该公司进行垂直整合。是的。鉴于OpenAI将会成为一家成功的独立公司,这太棒了,我认为这是有道理的,即使Meta可能会使用第三方容量,但最终他们都将成为第一方。对于任何拥有大规模业务的人来说,他们都将成为自己的超大规模企业。因此,对我来说,目标是建立一个超大规模的机群和我们自己的研究计算能力。这就是调整的原因。
所以我感觉非常好。另外一件事是,我不想被困在某一世代的大规模应用中。我们刚刚看到了GB200。200s。我是说,G.B. 300年代即将到来。等我到了维拉·鲁宾研究所,那里有鲁宾Ultra,猜猜会怎么样?数据中心的面貌将大不相同,因为每个机架、每排的功率将非常不同,冷却要求也将非常不同。这意味着我不想仅仅为了一个世代、一个家族就去建造大量的吉瓦电力。所以我认为节奏很重要,可替代性和位置很重要,工作负载多样性很重要,客户多样性很重要,而这正是我们努力的方向。
我们学到的另一件事是,每个AI工作负载不仅需要人工智能加速器,还需要很多其他东西,事实上,我们的大部分利润结构将来自那些其他东西。因此,我们希望将Azure打造为非常适合长尾工作负载的平台,因为那是超大规模业务,同时我们也要知道,我们必须极具竞争力,从最高端训练的裸机开始。但这不能挤占其他业务,因为我们不是只做五个合同的生意。与五个客户签订裸机服务合同。这不是微软的业务。这可能是其他人的生意,而且这很好。我们所说的是,我们从事的是超大规模业务,归根结底,这是人工智能工作负载的长尾业务。为了做到这一点,我们将为一系列模型(包括我们自己的模型)提供一些领先的裸机即服务能力。我认为,这就是你看到的平衡。
迪伦·帕特尔: 围绕整个可替代性话题出现的另一个问题是,好吧,它不在你想要的地方,你更希望它位于像亚特兰大这样的良好人口中心,就像我们现在这里一样。还有一个问题,如果人工智能任务的范围不断扩大,这有多重要?实际上,推理提示用30秒,或者,深度研究用30分钟,或者,在某些时候,软件代理需要几个小时,几天等等,与人互动的时间。如果这是一个好问题,为什么这很重要?
纳德拉: 位置A、B或C。完全正确。所以事实上,这也是我们想要思考的另一个原因,比如,一个Azure区域是什么样的?事实上,Azure区域之间的网络是什么样的?因此,我认为随着模型能力的演进,以及这些Token的使用,无论是同步还是异步的,也会随之演进。事实上,你不想失去优势,此外,顺便说一句,数据驻留法是什么,我在哪里?比如,整个欧盟的事情对我们来说,实际上意味着我们必须创建一个欧盟数据边界,基本上意味着你不能简单地往返调用到任何地方,即使它是异步的,所以因此你可能需要一些高密度的区域性东西,然后是电力成本等等,但你百分之百正确地提出了,随着我们的构建,拓扑结构将不得不演变,一是每美元的Token数量,二是经济状况。将其与使用模式叠加起来,使用模式包括同步异步,以及计算存储,因为延迟可能对某些事情很重要。存储最好在那里。如果我有一个靠近它的 Cosmos DB 用于会话数据,甚至用于自主事物,那么它也必须在某个地方靠近它,等等。所以我认为所有这些考虑因素将塑造超大规模业务。
迪伦·帕特尔: 在暂停之前,你是,你是,与我们预测的相比,你原本是28,你将会是12、13吉瓦。现在我们在,9.5左右,对吧。但是,有些事情更相关,并且,我只是想让你更具体地说明,这是你不想涉足的业务。但是,例如,甲骨文公司将从你规模的五分之一增长到2027年底比你更大。虽然它不是微软级别的投资资本回报率,他们仍然保持着35%的总利润率,某种程度上问题在于,是不是,是不是,是不是,嘿,也许这不是微软的业务范围,但是通过拒绝这项业务,通过放弃优先购买权等等,你已经创造了一个超大规模企业。
纳德拉: 首先,我不想否定甲骨文在构建其业务方面所取得的任何成功,我祝他们一切顺利。因此,我认为我已经回答了你的问题,那就是对于我们来说,成为一家具有有限时间范围RPO的单一模型公司的托管商是没有意义的。就这么说吧,你必须认真思考的不是未来五年要做什么,而是未来50年要做什么?因为这大概就是我,我们做出这一系列决定的原因。
我对我们的Open AI合作伙伴关系以及我们正在做的事情感觉非常好。我们有一笔不错的业务。我们祝他们取得巨大成功。事实上,我们是甲骨文容量的买家,我们祝他们成功。但在这一点上,我认为我们正在尝试做的事情的产业逻辑非常清晰,即这不是关于追逐。首先,顺便说一句,我跟踪你的东西,无论是AWS、谷歌还是我们的,我认为这非常有用。但这并不意味着我必须追逐那些。我追逐它们不仅仅是因为它们在一段时间内可能代表的毛利率。微软独一无二地可以清理的这项业务是什么,清理它对我们来说是有意义的?这就是我们将要做的。
Dwarkesh: 我想我甚至有一个退一步的问题,好吧,我接受你的观点,即从事All-ElSQL业务,拥有大量可以获得更高利润的客户,而不是为少数实验室提供裸机服务,这是一个更好的业务。但问题是,好吧,这个行业的发展方向是什么?因此,如果我们相信我们正走在通往越来越智能的AI的道路上,那么为什么行业的形态不是开放AI、Anthropic和DeepMind成为平台,而大量企业实际上是在这些平台上开展业务,在需要裸机时,他们就像平台一样?什么是直接使用Azure的长尾?因为你知道你想要使用Azure上可用的通用认知核心,所以任何说“嘿,我想使用一些开源模型和一个开放AI模型”的工作负载,如果你今天去Azure Foundry,你可以通过PTO来配置所有这些模型,获得Cosmos DB,获得SQL DB,获得一些存储,获得一些计算。
纳德拉: 这才是一个真实的工作负载的样子。一个真实的工作负载不仅仅是,我对一个模型进行了一次API调用。一个真实的工作负载需要所有这些东西来构建一个应用程序或实例化一个应用程序。事实上,模型公司也需要这些,构建任何东西不仅仅是像我有一个Token工厂。我必须拥有所有这些东西。这才是超大规模的业务。而且不仅仅是一个模型,而是所有这些模型。因此,如果你想要GROC plus,比如,OpenAI plus一个开源模型,来Azure Foundry,配置它们,构建你的应用程序。这是一个数据库。这有点像是业务的本质。
存在一个独立的业务,专门向模型公司销售原始的裸金属服务。这就是关于你想要参与多少这类业务以及不参与多少这类业务的争论。那是什么?这是业务中一个非常不同的部分,我们正在参与其中,但我们也对其规模有限制,以避免挤压其他业务。但这至少是我看待它的方式。
迪伦·帕特尔: 所以这里大概有两个问题,比如,为什么你不能两者都做是其中一个问题?另一个问题是,鉴于我们对你们在2028年的产能估计降低了3.5吉瓦,当然,你可以将其专门用于OpenAI的训练和推理能力。但是你也可以将其用于,嘿,这3.5吉瓦实际上只是在运行Azure,运行Microsoft 365,运行GitHub Copilot。实际上并非如此,我可以构建它而不提供给Open AI。
纳德拉: 或者我可能想在不同的地点建造它。我想在阿联酋建造它。我可能想在印度建造它。我可能想在欧洲建造它,所以另一件事是,正如我所说,考虑到监管需求和数据主权需求,我们现在面临真正的容量限制。我们必须在世界各地建设。首先,美国国内的容量非常重要。我们将建设一切。但其中一件事是,当我展望2030年时,我对微软的第一方和第三方业务形态有一个全球性的看法。第三方由前沿实验室划分,以及他们想要多少,与我们想要为多个模型和我们自己的研究计算需求构建的推理能力相比,所以,所有这些都进入了我的计算,而不是说,嘿,我认为你正确地指出了暂停。但暂停不是因为我们说,我的天,我们不想构建那个。我们意识到,我们想通过工作负载类型以及地理类型和时间来稍微不同地构建我们想要构建的东西。
比如,我们将继续增加我们的千兆瓦。问题是以什么速度,在什么地点,以及以什么样的,我该如何写下甚至摩尔定律呢?也就是,我真的想在27年过度建造3.5个,还是想在27、28年分散开来,即使知道我们与英伟达的最大经验之一是他们在模型方面的速度,他们的迁移。所以这是一个很大的因素。我不想被困在一个世代的四年、五年的折旧上。我只想基本上购买,实际上,黄仁勋给我的建议是两件事。一是,嘿,要达到光速般的执行速度。这就是为什么我认为即使是亚特兰大数据中心的执行,就像90天一样。从我们拿到到移交给实际工作负载之间的时间。这在他们那边算是真正的光速执行了。所以我想擅长这一点。然后那样的话,我就可以构建每一代并进行扩展。然后每五年,你就会有一个更加平衡的状态,因此它实际上就像一个大型工业运营的流程一样,你突然不会出现失衡的情况,即你在一段时间内积累了很多,然后你陷入了漫长的停顿,因为你被所有这些困在一个地方,这可能非常适合训练,但可能不适合婴儿,因为我即使是异步的也无法提供服务,但欧洲不会让我往返德克萨斯州。这就是所有的事情。
迪伦·帕特尔: 我该如何将这个声明与您在过去几周所做的事情联系起来呢?您已经宣布了与Iris Energy、Nebius和Lambda Labs的交易,并且还有一些即将达成。你要去那里确保你能从新云那里租用到算力,而不是自己建造,那是什么呢?
纳德拉: 我认为这对我们来说很好,因为我们现在拥有,当你有线性场地来满足需求时,可以在人们建造的地方提供服务,这很棒。事实上,我们甚至会,我想说,我们会接受租赁,我们会接受已建成的套件,我们甚至会接受GPU即服务,在我们没有算力的地方,但我们需要算力并且其他人拥有它。顺便说一句,我甚至会欢迎每个新云成为我们市场的一部分。因为再说一遍,猜猜,猜猜怎么着?如果他们将他们的算力带入我们的市场,那么通过Azure访问的客户将使用新云,这对他们来说是一个巨大的胜利,我们将使用Azure的计算、存储数据库以及所有其他的东西。所以我根本不认为这仅仅是,嘿,我应该自己吞噬所有这些。
微软的自研芯片与资本效率
Dwarkesh: 所以你提到了,你如何折旧这个五、六年的资产,而这占据了数据中心总拥有成本(TCO)的绝大部分,75%。而黄仁勋(Jensen)从中获得了75%的利润。所以所有的超大规模厂商都在尝试开发自己的加速器,这样他们就可以降低设备带来的巨大成本,从而提高利润率。
迪伦·帕特尔: 是的,然后当你看看他们所处的位置时,对吧,谷歌遥遥领先于其他人,他们做这件事的时间最长。他们大概会生产五百万到七百万个芯片,看看亚马逊,他们正尝试生产三百万到五百万个他们自己的TPU。但是当我们看微软订购的他们自己的芯片数量时,远低于这个数字。你们的计划也进行了这么久,你们的内部芯片进展如何?是的,这是个好问题。
纳德拉: 有几件事。首先,任何新型加速器的最大竞争对手,甚至是英伟达的上一代产品,在一个舰队中,我会关注的是总体拥有成本(TCO)。所以,即使是我们自己的产品,我也设定了很高的标准。顺便说一下,我刚刚查看了Maya 200的数据,看起来很棒,但即便在计算方面,我也学到了一点,我们一开始有很多英特尔的芯片,然后我们引入了AMD,接着又引入了Cobalt,这就是我们扩展的方式。所以,我们有很好的存在证明,至少在核心计算方面,证明了如何构建自己的芯片,然后管理一个舰队,其中这三种芯片以某种平衡的方式发挥作用。因为顺便说一下,即使是谷歌也在购买英伟达的芯片,亚马逊也是如此,这是有道理的,因为英伟达在创新,而且它是一个通用的东西,所有模型都可以在上面运行,而且客户就在那里。因为如果你构建自己的垂直产品,你最好有自己的模型,要么用它进行训练,要么进行推理,而且你必须为它创造自己的需求,或者补贴需求,所以你要确保适当地扩展它,所以我们将要做的是在我们自己的MAI模型和我们的芯片之间建立一个闭环,因为我觉得这才是真正赋予你权利去做自己的芯片的根本原因,在这里,你实际上已经根据你要做的事情设计了微架构,然后你跟上自己模型的步伐。
在我们的例子中,这里的好消息是Open AI有一个项目,我们可以访问它。
迪伦·帕特尔: 因此,认为微软不会拥有某些东西——你对此拥有什么程度的访问权限?全部。你可以获得所有这些的知识产权。所以你唯一没有的知识产权是作为消费硬件。就是这样。
纳德拉: 好的。是的。有意思。顺便说一句,我们也给了他们一堆知识产权来引导他们,所以这是他们拥有巨大优势的原因之一,因为我们一起建造了所有这些超级计算机,或者为他们重建了这些超级计算机,他们从中受益,这是理所当然的。现在,当他们在系统层面进行创新时,我们也可以访问所有这些。我们首先要实例化他们为自己构建的东西,然后我们会对其进行扩展。
因此,考虑到我们没有,如果一定要说,我对你问题的看法是,微软想成为英伟达一个出色的,我称之为光速执行的合作伙伴。因为坦率地说,那个舰队就是生命本身。我并不担心,显然黄仁勋的利润做得非常好,但总拥有成本有很多维度,我想在那方面做得出色。最重要的是,我希望能够真正与OpenAI合作。血统关系,MAI的血统关系以及系统设计,因为我们知道我们在两端都拥有知识产权。
Dwarkesh: 谈到权利,有一件事,几天前你接受了一个采访,你在采访中说,我们对你与OpenAI达成的新的协议拥有权利,你拥有权利,对OpenAI进行的无状态API调用的独家权利。我们有点困惑,如果存在任何状态的话。你刚才提到,所有这些即将到来的复杂工作负载都将需要内存、数据库和存储等等。那么现在非状态GPT是否正在会话中存储东西?
纳德拉: 但这就是原因。因此,我们所做的这件事、这项业务、这项战略决策,也为了适应OpenAI所需的灵活性,以便能够采购计算资源,可以这样认为,OpenAI既有通道业务,也有软件即服务(SaaS)业务。SaaS业务是ChatGPT,他们过去的业务是他们的API。那个API是Azure独有的。SaaS业务,他们可以在任何地方运行它。他们可以和任何他们想合作的人合作来构建SaaS产品吗?所以如果他们想要一个合作伙伴,因此合作伙伴想要使用一个无状态的API,那么Azure是他们可以获得无状态API的地方。看起来他们有一种方式让你,一起构建产品,而且它是某种状态。
纳德拉: 不,即使那样,他们也得来Azure。好的。所以如果是任何合作伙伴,并且从根本上说,这又是本着我们重视什么作为我们合作关系一部分的精神来完成的。我们确保在给予Open AI他们需要的所有灵活性的同时,我们也是优秀的合作伙伴。
迪伦·帕特尔: 所以例如,Salesforce想要整合Open AI。这不是通过API。他们实际上一起工作,一起训练一个模型,比如说,现在把它部署在亚马逊上。这是允许的吗,还是他们必须使用它?
纳德拉: 对于任何此类定制协议,他们都必须来运行它。我们对美国政府等做了一些例外处理。
全球化与主权AI的未来
Dwarkesh: 除此之外,他们必须来Azure。正如我想他们解释的那样,随着人工智能代理变得越来越强大,你将需要越来越多的关于它们正在做什么的可观察性。你需要在它们犯错时抓住它们。你需要它们正在做什么的高级摘要,并且你需要一张关于它们正在做的一切如何组合在一起的图片。这正是CodeRavit所提供的。你只需发起一个普通的拉取请求,CodeRabbit就会自动审查该请求。它会生成更改摘要,以便你可以准确理解拉取请求的作者的意图,并且它会使用来自完整代码库的上下文来提供关于如何改进代码的逐行反馈。无论你是审查来自同事还是代理的拉取请求,这都很有帮助。在任何一种情况下,CodeRabbit都会写下它的想法并标记任何问题,以便你的队友或你的代理可以去修复它们。我注意到,当我与代理一起编写代码时,CodeRabbit会捕获模型默认情况下会犯的很多错误。例如,这些模型有个坏习惯,就是使用旧版本的库。所以在一个会话中,我观察 CodeRabbit,缓存对旧模型的调用,弄清楚新版本是什么,然后提出改进建议。请访问 coderavit.aI slash Thorekash 以了解更多信息。
退一步说,我有个问题,当我们来回走动时,在工厂里,我们谈论的一件事是,微软,你可以把它看作是一家软件公司,但现在它真的变成了一家工业企业。有所有的资本支出,有所有的建设。如果你只看过去两年,你的资本支出就增加了两倍。也许你可以向前推断。它实际上变成了巨大的工业爆炸。
迪伦·帕特尔: 其他超大规模企业都在贷款,Meta 在路易斯安那州完成了一笔 200 亿美元的贷款。他们已经做了一笔公司贷款。看起来很明显,每个人的自由现金流都将归零,我确信即使你尝试这样做,艾米也会狠狠地揍你一顿。
纳德拉: 但正在发生什么?我认为这种结构性变化,就是你所指的,我认为这是巨大的,我将其描述为,我们现在是一家资本密集型企业和一家知识密集型企业,事实上,我们必须利用我们的知识来提高资本支出的投资回报率,因为看看硬件公司在营销摩尔定律方面做得非常出色,我认为这令人难以置信,而且很棒,但如果你看看我甚至在我的财报电话会议上提到的一些数据,即对于给定的GPT系列,对吧,在每美元每瓦特能获得的token吞吐量方面的软件改进,一季度比一季度,一年比一年,都是巨大的,所以是5倍、10倍,在某些情况下可能是40倍,这仅仅是因为你如何优化。这是一种知识密集型的强度,旨在提高资本效率,所以在某种程度上,这就是我们必须掌握的东西。例如,有人问我,传统的旧式托管商和超大规模企业之间有什么区别?答案是软件。所以,是的,它是资本密集型的,但只要你有系统诀窍和软件能力,能够按工作负载和集群进行优化,这就是为什么我认为当我们说可互换性时,其中包含大量的软件,不仅仅是关于集群。它有点像驱逐工作负载的能力,然后调度另一个工作负载。我可以管理那种调度算法吗?这就是我们必须做到世界一流的事情。所以,是的,我认为我们仍然会是一家软件公司,但是的,这是一个不同的业务,我们将进行管理。归根结底,微软的现金流允许我们同时拥有这两个创造财富的部门。
Dwarkesh: 似乎在短期内,你更倾向于事情需要一段时间才能完成,而且会更加坎坷,但在长期来看,你认为那些谈论通用人工智能(AGI)和人工超智能(ASI)的人是对的,比如萨姆是对的,最终会实现。我有一个更广泛的问题,即考虑到你必须对这种会在五年内贬值的东西进行大规模投资,那么超大规模企业做什么才有意义。所以,如果你对类似于萨姆在三年内预测的那种事情有到2040年的时间线,那么在这种情况下,你做什么是合理的?
纳德拉: 需要分配一些资源到,我称之为研究计算。这需要像你做研发一样进行,所以坦率地说,这是最好的核算方式,你应该把它看作是研发费用,你应该说,嘿,什么是研究计算机,以及你打算如何扩展它?甚至假设在某个时期内它会按数量级增长,选择你的时间段,是两年,是16个月,随便你,所以这是一部分,这有点像是入场券,这是研发费用。其余的都是需求驱动的,最终,你必须提前于需求进行建设,但你最好有一个不会完全失衡的需求计划。
Dwarkesh: 你相信吗,这些实验室现在预测27、28年的收入将达到1000亿美元,并且他们预测收入将以每年3倍、2倍的速度持续增长。
纳德拉: 在市场上,现在有各种各样的激励措施,这是理所当然的,你期望一个试图筹集资金的独立实验室做什么,他们必须拿出一些数字,以便他们能够真正筹集资金,从而支付他们的计算费用等等。这是件好事。总会有人承担一些风险并投入其中,而且他们已经展示了吸引力。这不像全是风险,而没有看到他们一直在表现的事实,无论是OpenAI,还是Anthropic。所以我对他们所做的事情感觉很棒。而且我们有大量关于这些工作的业务。所以,一切都很好。
但总的来说,最终只有两件简单的事情。一是你必须为研发进行分配。你甚至提到了人才。你得明白,人工智能方面的人才非常抢手。你必须在这方面投入。你必须在计算方面投入。所以在某种意义上,研究人员与GPU的比率必须很高。这就是在这个世界上成为领先的研发公司所需要的条件。这是需要扩展的东西。而且你必须有一个资产负债表,它能让你在成为普遍认知之前很久就扩大规模等等。这算是一件事。但另一件事是关于如何预测。
迪伦·帕特尔: 当我们纵观世界,美国在许多技术堆栈中占据主导地位,美国通过微软拥有Windows,对吧,甚至在中国也部署了,这是主要的操作系统。当然,还有Linux,它是开源的,但Windows在中国个人电脑上随处可见。你看看,你看看Word,它随处可见。你看看所有这些不同的技术,它随处可见。非常独特的一点是,微软和其他公司在其他地方也在发展,他们正在欧洲、印度以及所有其他地方,比如东南亚、拉丁美洲和非洲,建立数据中心,所有这些不同的地方,你们都在建设能力。但这似乎非常不同,今天,技术、计算的政治层面,美国。本届政府并不关心互联网泡沫,看起来美国政府,以及世界各地的其他政府,都非常关心人工智能。问题是,我们正处于一种两极分化的世界,至少美国和中国是这样,但欧洲、印度以及所有其他国家都在说,不,实际上,我们也将拥有主权人工智能。微软如何应对与90年代的不同,那时似乎世界上只有一个国家重要,那就是美国,我们的公司在各地销售,因此,在一个两极分化的世界里,微软受益巨大,在这种世界里,微软不一定有权赢得整个欧洲、印度或新加坡。实际上存在着主权人工智能的努力。你对此的想法是什么?你是怎么考虑这个问题的?
纳德拉: 我认为这是一个非常关键的部分,我认为美国科技行业和美国的首要任务是政府的职责是确保我们不仅开展领先的创新工作,而且在全球范围内围绕我们的技术堆栈建立集体信任,因为我总是说美国是一个令人难以置信的地方。这在历史上是独一无二的,它仅占世界人口的4%,却占GDP的25%和市值的50%,我认为你应该思考这些比例,并真正反思市值50%的占比,坦率地说,这是因为世界对美国的信任,无论是其资本市场,还是其技术,以及在任何特定时间对领先行业的管理,如果这种信任被打破,这对美国来说就不是好日子。所以如果我们从这一点出发,我认为特朗普总统、白宫、大卫·萨克斯,实际上每个人都明白这一点。
因此,我赞赏美国政府和科技行业共同采取的任何措施,坦率地说,例如,作为一个行业,在世界各地共同将我们自己的资本置于风险之中。对。所以实际上,我希望美国政府能够为美国公司在世界各地的外国直接投资邀功,这有点像最少被谈论的事情。但美国应该做的最好的营销不仅仅是所有进入美国的外国直接投资,而是最领先的部门,即这些人工智能工厂,它们正在世界各地被谁创造?被美国和美国公司创造。因此,你从这里开始,然后围绕它建立其他协议,这些协议围绕它们的连续性,它们对数据驻留的合法主权担忧,甚至是它们拥有真正的自主权和隐私保障所发生的事情等等。事实上,我认为我们的欧洲承诺值得一读,因此,我们对欧洲做了一系列承诺,承诺我们将如何真正管理我们在那里的超大规模投资,以便欧盟和欧洲国家真正拥有主权。我们还在法国和德国建设主权云。我们在Azure上有一种叫做主权服务的东西,它实际上为人们提供密钥管理服务以及保密计算,包括GPU中的保密计算,我们在NVIDIA方面做了非常出色的创新工作。因此,我认为我对能够通过技术和政策建立对美国技术堆栈的信任感到非常满意。
Dwarkesh: 你认为这将如何发展,你在模型层面上有这种与条件学习相关的网络效应。也许你在超大规模层面也有类似的东西。你是否期望各国会说,看,显然有一个或几个模型是最好的,所以我们将使用它们,但我们会制定一些法律,比如,权重必须托管在我们国家,或者你是否期望会有这种推动,即必须在我们国家训练模型?也许这里的一个类比是,人们会,半导体对经济非常重要,人们希望拥有自己的主权半导体,但是,像台积电就更胜一筹。因此,半导体对经济如此重要,以至于你只能去台湾购买半导体。你不得不这么做。人工智能也会这样吗,还是会有其他的可能?
纳德拉: 最终,我认为重要的是人工智能在其经济中的应用,以创造经济价值,这就是扩散理论,最终,它不是主导部门,而是利用领先技术创造自身比较优势的能力。所以我认为这将从根本上成为核心驱动力。但即便如此,他们仍然希望这种状态能够持续,所以在某种意义上,这是我相信总会存在某种制约的原因之一。稍微回应一下你的一些观点,关于“是否一个模型会导致失控部署”,这就是为什么开源始终存在的原因。根据定义,将会有多个模型,这是一种方式,你可以以此来要求连续性,避免集中风险,这是另一种说法。所以你说,我需要多个模型,然后我需要一个开源模型,只要这样,每个国家都会觉得,好吧,我不用担心部署最好的模型并广泛传播,因为我总是可以将我的数据和流动性转移到另一个模型,无论是开源的,还是来自其他国家的,或者其他什么。集中风险和主权,对吧,也就是能动性。这就是两件事。我认为这将驱动市场结构。
迪伦·帕特尔: 关键在于,半导体行业并非如此,所有冰箱和汽车都装有台湾制造的芯片。直到现在才出现这种情况。直到现在,每个人才意识到这一点。即使如此,美国,如果台湾被切断,那么将不会再有汽车或冰箱。...
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.