![]()
作者 | 小小
出品 | 网易科技
1月6日,2026年CES展会期间,英伟达创始人兼CEO黄仁勋面对全球200多名记者和分析师,进行了一场超过90分钟的深度对话。
刚刚亮相的Vera Rubi架构是业界关注的焦点。Vera Rubi架构号称性能飙升10倍,成本却砍到1/10,被称为“打了类固醇的摩尔定律”。
黄仁勋断言,到2026年底,英伟达数据中心芯片销售额将突破5000亿美元。与AI提供商Anthropic等公司的交易,以及在中国前景的改善,“应该会提高我们对那个数字的预期”。这大大高于华尔街分析师的平均预期,他们预计英伟达2026年总营收将达到3212亿美元,增幅57%。2027年,他们估计英伟达销售额将超过4000亿美元。
对于英伟达能否重返中国AI芯片市场,黄仁勋透露,该公司可以开始向中国客户销售其H200芯片,而且“中国客户的需求很高,相当高,非常高”。
“我期待你们的竞争,你们得努力工作了。”在回答中国竞争对手的提问时,黄仁勋笑着对来自中国的媒体说,在这个飞速发展的行业里,“没有任何领先是理所当然的”。
以下为黄仁勋在1月6日CES媒体和分析师见面会上的精华内容,经AI听译,编辑整理,从现场38个问题中,精选其中20余个问题。
01 大杀器“Vera Rubin”:10倍性能、1/10成本
问题1:对已经采用Blackwell系统的客户来说,Vera Rubin平台有什么不可替代的价值?升级路径是怎样的?
黄仁勋认为, 模型规模每年以十倍的速度增长,推理生成的Token数量每年增加五倍,这种指数级的计算需求已经“超出了预期”。
从Hopper到Blackwell,从Blackwell到Vera Rubin,推理吞吐量都提升了十倍,而Token成本则降低十倍。英伟达每年都在交付新一代“完整的AI工厂”——从CPU、GPU、网络芯片到扩展交换机,全部协同设计。
黄仁勋表示,关键在于其数据中心架构是完全兼容的。客户不需要每隔几年就彻底重建基础设施,而是可以通过英伟达的软件更新,让已经部署的AI工厂舰队性能持续提升。
“我们优化的不是17个不同的技术栈,而是一个通用架构。这个架构每年的改进,会直接转化为客户的AI工厂吞吐量提升、成本下降和能效提高,我称它为“强化版的摩尔定律,是超级驱动的摩尔定律”。
问题2:CPU在AI工厂中扮演什么角色?英伟达的基础模型(如NIM, Cosmos)如何融入未来?
黄仁勋认为,半导体物理已接近极限,但AI计算需求正以每年模型规模增长10倍、Token数量增长5倍的疯狂速度扩张。仅靠芯片工艺的微小进步无法满足。因此,英伟达给出的答案是“极端协同设计”——从CPU、GPU、内存到网络交换芯片,乃至存储处理器,对整个计算路径进行系统性优化,以追求极限性能。这不仅涉及硬件,还包括软件栈和模型层的创新。
他以英伟达的模型为例:Cosmos是前沿的物理AI模型,在自动驾驶等领域保持领先;Nemo 3则是首创的混合架构模型,在长上下文推理方面高效出众。目标是在所专注的每一个领域都保持前沿。这一切最终汇聚成Vera Rubin系统。从Grace Blackwell到Vera Rubin,晶体管数量一年内仅增长约1.7倍。这个增幅如果放在单纯的芯片性能提升上,根本不值得客户为它建造一座新的数据中心。
我们必须通过系统级创新,实现以一代际就提供10倍吞吐量、1/10的Token成本这样的跨越,才能让行业负担得起向前探索的成本。为此,英伟达投入了巨大的工程资源——仅Vera Rubin的研发就累计投入了约15000个工程年。
问题3:在实现Vera Rubin的过程中,你们遇到的最大挑战是什么?是制造、带宽还是延迟?
黄仁勋说, 答案是“所有方面”。Vera Rubin的突破不仅是芯片级的,更是对整个AI基础设施的重新定义。
Vera Rubin解决了几个核心痛点:
系统可用性: 以前更换一个故障的NVLink交换机,需要将整个价值数百万美元的机架停机数小时。现在Vera Rubin支持热插拔,可以在系统运行时直接更换,甚至在线更新软件,这能确保超大规模数据中心保持99.9%以上的运行效率。
能源效率: AI训练时所有GPU同步工作,导致电流剧烈波动,迫使数据中心过度配置25%的电力或安装昂贵缓冲设备。Vera Rubin通过功率平滑技术,消除了这种波动,让电力供应能100%被利用。
工程效率: 过去组装一个高性能节点需要像组装一辆汽车一样花费两小时。现在,我们将其缩短到五分钟。同时,我们消除了大量线缆,实现了100%的液冷。这些系统级创新与芯片和软件突破同样重要。
02 Vera Rubin交付难题:只有一家公司做得到
问题4:如何确保Vera Rubin的六颗新芯片能稳定量产?
黄仁勋回应说, 答案是“非常仔细地规划”。英伟达与台积电合作近30年,双方的规划团队保持着极为紧密的协作,几乎是每日同步。
在规划Vera Rubin六颗全新芯片量产的同时,英伟达还需管理Grace Blackwell、Hopper、游戏GPU以及汽车芯片Thor等多条产品线的庞大产能。这极具挑战,尤其是Vera Rubin采用了CPO(共封装光学)等全新技术。黄仁勋表示有信心,在台积电的大力支持下,将会迎来产量巨大的一年。
问题5:你宣布Vera Rubin已进入“全面生产阶段”,但又说按计划在2026年下半年才发货。这矛盾吗?
黄仁勋回应说,我们正在做的事情非常非常困难,世界上从未有过如此规模的计算机系统同时集成这么多全新的芯片:六颗用于CPU的新芯片、全新的Vera GPU、Rubin CX9 NVLink交换机、六颗Spectrum-X(带共封装光学器件)以及BlueField-4。
所有这些芯片都是全新的。我们已经拿到芯片一段时间了,正在严谨地进行验证和测试。芯片已经完全可以投入制造,但软件优化和系统验证是持续的过程。世界上只有一家公司能以我们这样的规模和速度做到这一点。
03数据中心年销售额将超5000亿美元
问题6:英伟达与OpenAI合作建设的AI工厂何时动工?
黄仁勋表示,并没有计划与OpenAI直接合作建设专属的AI工厂。OpenAI等大型模型公司主要通过与微软、OCI、CoreWeave等云服务提供商合作来获取英伟达的计算能力。这种通过合作伙伴服务的模式运行得非常顺利,预计不会改变。
问题7:去年你预测未来几年数据中心销售额将达5000亿美元,这个数字现在是否已经过时?
黄仁勋表示,不希望定期更新这个数字,但可以说,自那个预测以来,许多新的进展应该会推高我们的预期。
新的驱动力主要来自几个方面:首先,我们与Anthropic等重要伙伴的合作进一步巩固了英伟达作为模型训练首选平台的地位。其次,开放模型的成功远超预期,今天全球生成的每四个Token中就有一个来自开放模型。这极大地推动了公共云和英伟达硬件的需求。同时,我们重返中国市场的进程也在展开,H200芯片将贡献新的增量。所有这些因素共同作用,解释了为什么市场需求持续超出预期。
04中国战场:订单即信号
问题8:距离特朗普政府宣布批准向中国出口H200芯片已经一个月了。你预计何时开始向中国客户发货?
“客户需求很高—相当高,非常高。”黄仁勋说,英伟达已经启动了供应链,H200正在生产线上流动。正在与美国政府完成许可证的最后细节。
提问9:你期望看到关于政府方什么信号?
黄仁勋表示只期待采购订单。当采购订单到来时,它将暗示其他一切,因为双方都必须遵守各自的法律和规则。当采购订单到达时,它们不言自明。特朗普总统已经说过H200被许可出口,现在需要完成所有流程步骤。一旦完成,预计采购订单就会到来。
提问10:面对华为等竞争对手,H200在中国市场还有竞争力吗?
黄仁勋说H200目前在市场上是有竞争力的,但它不会永远有竞争力。所以,希望以后能够发布其他有竞争力的产品。为了保持美国在市场上的竞争力,监管也必须不断演进。当它不再有竞争力时,希望会有新的产品。”这就是我所主张的,我们持续在市场上保持竞争力。“
05模型的尽头是电力,能源问题如何解决?
问题11:AI计算正面临巨大的电力制约,你们如何解决这个问题?
黄仁勋说,我们正处在一场新工业革命的开端,这个新产业需要能源来发展——任何形式的电力都会被使用,从天然气到可再生能源。但最重要的是能源效率。
每一代产品,当吞吐量提升10倍而功耗只提升2倍时,能效就提升了5倍。如果你的数据中心是1吉瓦,而我们的技术能让每瓦吞吐量提升5倍,那么客户在同样电力下生成的Token就能增加,收入也随之增长。
更高效的系统还能支持更大的模型,这提升了智能水平,也提高了Token的平均售价。因此,在有限的、受能源约束的数据中心内,提高每瓦Token数量、每美元Token数量的能力,在最终分析中是决定性的。
06自动驾驶:英伟达和特斯拉的区别
问题12:Alpamayo系统能够进行L4/L5级驾驶吗?
黄仁勋认为目前部署在梅赛德斯-奔驰中的英伟达自动驾驶系统,是世界上唯一一个拥有冗余自动驾驶能力的系统。其中一个系统是经典设计,带有大量人类先验知识,本质上是汽车的“护栏”。在其之上,运行Alpamayo,这是一个端到端的AI模型,进行推理和决策。如果经典安全系统非常出色,能确保乘客永远不会受到伤害,那么AI驾驶员就能尽快变得尽可能好。相信将很快达到L4级别。唯一的问题是:操作域是什么?它有多大的能力?在什么条件下它有信心驾驶?
问题13:那么英伟达的自动驾驶系统与特斯拉FSD的关键区别是什么?
黄仁勋毫不吝啬地夸奖特斯拉,认为特斯拉的FSD栈完全是世界级的。他们在各个方面都是100%最先进的。他也拥有特斯拉,”我在家里用它开车,它工作得非常棒“。
至于英伟达和特斯拉的区别,在于英伟达不制造自动驾驶汽车,而只为其他所有人制造完整的栈和技术来构建自动驾驶汽车。英伟达为整个汽车行业提供三台计算机:训练计算机、模拟计算机和自动驾驶计算机(也就是车载计算机),以及相应的软件栈。
黄仁勋表示,他相信英伟达的系统会普及,因为是技术平台提供商。今天路上的10亿辆汽车,在未来10年,其中数亿辆将拥有强大的自动驾驶能力。所以,这很可能成为未来十年增长最快的技术领域之一。此外,英伟达还将全部开源:客户既可以直接使用我们训练好的模型,也可以基于我们的技术自行训练,我们同样会提供支持。
07机器人未来:今年突破,垂直为王
问题14:我们什么时候才能获得真正具有人类水平能力的机器人?
黄仁勋肯定说是“今年(2026年)”。因为清楚技术迭代的速度。移动能力很难,但进展惊人,它会最先被解决;其次是大关节运动和抓取问题。真正困难的是精细运动,毕竟制造一只灵巧的手都不容易,电机、触觉感知都很复杂,不过这些方向正在持续突破。
与此同时,认知能力正在快速跃升。未来会有非常强的推理型AI模型直接运行在机器人内部。你会发现,AI本质上是“以人为中心”的:在车里,它就是驾驶系统;拿起网球拍,它就成了挥拍能力。AI的真正优势在于多重化身,我们把它训练成人形机器人,但它同样可以成为出色的操控系统,甚至是完美的自动驾驶大脑。
问题15:机器人会抢走人类的工作吗?
黄仁勋表示“恰恰相反”。他认为机器人将创造就业机会。原因在于,我们正面临全球性劳动力短缺,不是缺几千人,而是数千万人,而且由于人口下降,情况会越来越糟。如果没有新的劳动力补充,我们将无法维持当前的经济规模。因此,我们需要引入“AI移民”,让它们进入制造车间,接手那些我们已经决定不再从事或无人愿意做的工作。机器人革命首先将填补劳动力缺口,从而驱动经济增长。经济向好时,企业自然会雇用更多人。
更重要的是,很多工作在很长时间内都无法被AI替代。我们需要的是健康的经济环境:通胀可控,就业机会增多,生活成本降低。而AI的发展,恰恰能推动这一切的实现。
问题16:对机器人初创公司,你有什么建议?
黄仁勋认为要构建一个完整的机器人系统,实际上需要三类计算机:训练计算机、模拟计算机和机器人大脑计算机。
训练计算机很简单,对于模拟计算机,由于机器人必须在物理精确的虚拟世界中学习、练习和评估,这样在训练阶段就不需要在现实世界里反复“试错”。为此,英伟达构建了一个严格遵循物理定律的虚拟世界——Omniverse。
再看机器人大脑。英伟达目前使用的是Orin,下一代是Thor,它们拥有完整、独立的技术栈。Thor配备了极高速的推理栈,并运行在一个安全操作系统之上,类似汽车中的安全系统,确保机器人始终在安全边界内行动,只执行它有足够把握的任务。
真正的难点在于:不仅要同时理解并整合这三套计算栈,还要协调所有必需的电子系统和机械结构。这种复杂度,极其之高。
对于创业者来说,最终归结为:你想成为一家横向公司,还是垂直的、特定领域的公司?横向公司的好处是较少担心具体应用,更多关注技术,如果成功了规模可能很大。但横向布局极其困难,竞争来自四面八方。
我的偏好通常是建议寻找垂直领域。你必须非常深入地理解特定的应用——也许是EMS制造,也许是手术机器人。领域专长确实可能是一个优势。
08竞争:中国崛起,但自信无可替代
问题17:面对中国新兴AI公司的快速进展,英伟达的竞争优势是什么?
黄仁勋表示,在中国涌现的众多初创公司中,许多已经成功上市并取得了非常出色的成绩,这充分证明了中国科技行业的活力与实力。可以毫不夸张地说,中国的企业家、工程师、技术专家和AI研究人员,属于全球最优秀的群体之一。中国的科技生态系统正在以极快的速度发展,工程师勤奋投入,创业精神强烈,想法也极具创造力。因此,我完全相信中国科技市场将持续成长、不断进步。
对英伟达而言,如果要为中国市场提供价值,就必须参与竞争,并持续推动自身技术向前发展。
当然,英伟达在AI领域的创新规模和深度,确实是全球其他公司难以企及的。我们是目前唯一一家从CPU、加速计算、存储到完整软件栈、模型层和基础设施层全面布局的公司。我们与全球几乎所有重要的AI公司都有深度合作,并通过庞大的生态和渠道,将这些技术大规模推向终端市场。
无论是制造业(例如与西门子的合作)、医疗健康(如与礼来这样的全球最大制药公司合作)、汽车、金融服务,还是你能想到的任何行业,英伟达都深度参与其中。因此,理应继续在这个行业中保持领先。但没有任何成功是理所当然的,这正是我们必须持续高强度投入的原因。
这个行业的规模将极其庞大。过去10–15年,全球大约投入了10万亿美元的资本,这些系统正处在从“传统计算”向“AI现代化”全面转型的过程中。我们用数千亿美元的投入,去推动这10万亿美元的现代化升级。
更重要的是,这是历史上第一次,软件AI不再只是工具,而开始成为劳动力本身。人形机器人、自动驾驶汽车、软件编程智能体、芯片设计智能体,正在直接补充甚至重塑劳动力结构。而全球劳动力市场规模约为100万亿美元。也就是说,技术第一次真正服务于整个经济体系中的“劳动层”。从这个角度看,这个市场巨大是完全合理的。
最后我想说的是:我期待你们的竞争,但你们必须足够努力。
09收购:Groq技术互补,但Vera Rubin仍是核心
问题21:英伟达200亿美元收购Groq的技术和团队,会推出基于其技术的推理卡吗?
黄仁勋的回答是英伟达和Groq的技术路线“非常、非常不同”。不认为有任何东西能取代下一代Vera Rubin平台。或许能以某种方式整合他们的技术,实现一些独特的增量改进,但更多细节需要等到下一次GTC大会公布。总体而言,我们对Groq团队和技术加入英伟达感到兴奋。
问题22:英伟达拥有巨额现金储备,未来将如何分配?重点在收购还是招聘?
黄仁勋表示,英伟达的资本配置遵循一套清晰的“三层逻辑”,核心是围绕AI生态进行长期投资。
第一层,投资于“世界不能或不会做”的核心技术。 这是我们的首要任务。例如NVLink互联技术,以及我们自主研发的Grace CPU,这些都是为满足AI独特需求(如海量上下文内存)而生的独创架构。我们持续投资于构建那些若没有英伟达就不会存在的底层技术。
第二层,投资于“上下游生态”,确保整个供应链的繁荣与韧性。 我们向上游与内存、芯片制造等关键供应商深度绑定,进行巨额资本承诺以保障先进产能。同时,我们也向下游投资,覆盖从全球云服务商、计算机制造商到新兴的云服务与AI基础设施公司(如CoreWeave、Lambda),构建地球上最多元、最庞大的市场渠道网络。
第三层,是沿“AI五层蛋糕”进行全栈投资。我们从最底层的土地、电力和数据中心外壳,到芯片、系统和基础设施,再到上层的AI模型和最终应用,都会进行战略性投资与合作。我们可能投资、合作,甚至收购一些半导体公司。目标是培育和加速整个AI产业,通过投资建立更深厚的伙伴关系,与未来最具影响力的公司共同成长。
10以色列是英伟达的“芯片心脏”
问题23:你为何能成为科技界任期最长的CEO之一?
黄仁勋:秘诀很简单:第一,不被解雇;第二,不感到无聊。 至于还能做多久?只要我觉得自己仍能胜任。引领英伟达责任重大,我们是行业的关键推动者,全球合作伙伴都期待我们做好自己该做的事。公司成立34年来,我们越做越好。做一件事久了,你自然会逐渐掌握其中的门道——即便是我也不例外。
问题24:英伟达在以色列计划大幅扩张,有何战略考量?面对如此大规模招聘,如何保持人才优势?
黄仁勋夸奖“以色列团队不可思议”,是英伟达真正的“芯片心脏”。正在研发的Vera Rubin平台包含六颗新芯片,其中四颗(包括关键的交换机和网络芯片)都来自以色列团队。
虽然英伟达已是全球最具影响力的公司之一,但一直把自己看作“世界上最小的大公司”。我们只有约4万名员工。在以色列,计划将团队从5000人扩大到10000人。
英伟达在以色列的离职率极低,大约只有1%到2%。许多员工已任职20甚至25年。吸引和留住世界级人才的能力是顶级的。这不仅是因为提供好的工作,更在于CEO的职责之一是“为公司选择正确的工作”——我们聚焦于那些激动人心、有深远影响力的项目,这塑造了公司的文化和使命感,让顶尖人才愿意长期留下并创造奇迹。
