网易首页 > 网易号 > 正文 申请入驻

英伟达发布Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万token

0
分享至

美东时间9月9日周二,英伟达发布新一代Rubin CPX芯片系统,专门针对AI视频生成和软件开发等大规模上下文处理任务,强化AI编码和视频处理能力。

Rubin CPX定于2026年底上市,采用卡片形式,可集成到现有服务器设计中或作为独立计算设备在数据中心运行。

这款芯片系统在技术规格上实现重大突破。Rubin CPX GPU提供30千万亿次浮点(petaflops)运算能力(NVFP4精度),配备128GB GDDR7内存,支持视频解码和编码的硬件,相比英伟达GB300 NVL72系统,注意力加速3倍。

完整的Vera Rubin NVL144 CPX平台在单个机架中集成144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU,提供8 exaflops AI性能,性能为英伟达GB300 NVL72系统的7.5倍。

英伟达CEO黄仁勋表示,Rubin CPX是首款专为百万级token处理而构建的CUDA GPU。他说:

"正如RTX革命性地改变了图形和物理AI,Rubin CPX是首款专为大规模上下文AI而构建的CUDA GPU,模型可以同时进行数百万个知识token的推理。"

英伟达宣称,新芯片的投资回报率达到30至50倍,部署价值1亿美元的新芯片硬件将为客户带来高达50亿美元收入,即从1亿美元的资本支出中获得高达50亿美元的收入。该预测强调了英伟达对AI基础设施商业价值的量化努力。

技术创新:分离式推理架构提升效率

Rubin CPX采用分离式推理架构,将AI计算过程分为上下文阶段和生成阶段。上下文阶段需要高吞吐量计算来处理大量输入数据,而生成阶段则依赖快速内存传输和高速互连。

这种设计允许两个阶段独立处理,实现计算和内存资源的精准优化。Rubin CPX专门针对计算密集型的上下文阶段进行优化,与现有基础设施协同工作,提供3倍的注意力加速性能。

该平台配备100TB高速内存和每秒1.7千万亿字节的内存带宽,通过英伟达Quantum-X800 InfiniBand或Spectrum-X以太网连接,由Dynamo平台统一协调。

应用场景:重塑软件开发和视频生成

在软件开发领域,Rubin CPX使AI系统能够处理整个代码库,维护跨文件依赖关系,理解仓库级结构。这将编程助手从自动完成工具转变为智能协作伙伴,能够理解"大规模软件项目"。

视频生成方面,该系统可在单个芯片上完成解码、编码和处理,AI模型能够处理多达100万个token的一小时内容。这为长视频内容生成提供了前所未有的连贯性和记忆能力。

多家公司已表达合作意向。代码生成公司Cursor计划使用该技术进行代码生成,视频创作平台Runway将其应用于视频生成工作流程,AI研究公司Magic则计划利用该技术构建具有1亿token上下文窗口的基础模型。

市场影响:巩固英伟达AI基础设施优势

Rubin CPX的发布进一步巩固了英伟达在AI基础设施领域的领先地位。据分析师估计,英伟达的数据中心业务本财年收入有望达到1840亿美元,超过业内其他公司的总收入。

该产品体现了英伟达在硬件和软件创新方面的持续投入,这种速度是竞争对手尚未匹及的。通过专门针对特定AI工作负载优化硬件,英伟达继续保持行业对其产品的依赖。

新平台预计将为企业构建下一代生成式AI应用创造新的可能性,特别是在需要处理大规模上下文的高价值推理用例中。这标志着AI基础设施从通用计算向专用优化的重要转变。

⭐星标华尔街见闻,好内容不错过

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不可错过!3月26日晚间19:00比赛!中央5套CCTV5、CCTV5+直播表

不可错过!3月26日晚间19:00比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-03-26 15:33:07
为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

侃神评故事
2026-03-10 18:50:04
4.0 英寸 4050mAh 还有实体键盘!这绝对是今年最酷的新机了

4.0 英寸 4050mAh 还有实体键盘!这绝对是今年最酷的新机了

科技狐
2026-03-25 22:34:58
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
张凌赫和田曦薇,谢谢你俩让我看到了真人秀有多假

张凌赫和田曦薇,谢谢你俩让我看到了真人秀有多假

草莓解说体育
2026-03-26 14:17:01
加时被逆转!申京:一切发生太快!杜兰特:在胡打,我该果断出手

加时被逆转!申京:一切发生太快!杜兰特:在胡打,我该果断出手

篮球资讯达人
2026-03-26 15:28:40
新华社消息|覆盖全民!我国加快建立长期护理保险制度

新华社消息|覆盖全民!我国加快建立长期护理保险制度

新华社
2026-03-25 23:15:12
好辣眼睛!黄多多穿三点式泳装,20岁身材矮小,在国外思想开放

好辣眼睛!黄多多穿三点式泳装,20岁身材矮小,在国外思想开放

章眽八卦
2026-03-26 13:22:27
炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

澜归序
2026-03-26 06:08:07
面相这东西真藏不住,停播一个半月的李亚鹏,

面相这东西真藏不住,停播一个半月的李亚鹏,

小光侃娱乐
2026-03-26 16:05:08
押注中国!迪拜资本大转移,数千亿真金白银连夜搬家到东方

押注中国!迪拜资本大转移,数千亿真金白银连夜搬家到东方

小舟谈历史
2026-03-25 06:28:02
发生了什么?午后,沪指再度失守3900点

发生了什么?午后,沪指再度失守3900点

每经牛眼
2026-03-26 15:25:31
李鑫认亲第3天!姐弟闹掰再次失联,姐姐深夜哭诉,养家姐姐发声

李鑫认亲第3天!姐弟闹掰再次失联,姐姐深夜哭诉,养家姐姐发声

离离言几许
2026-03-26 12:11:37
俄警告绝非空言:暗杀伊朗领导人,正在打开中东战乱的潘多拉魔盒

俄警告绝非空言:暗杀伊朗领导人,正在打开中东战乱的潘多拉魔盒

华人星光
2026-03-24 11:45:23
鹅蛋营养价值惊人,发现:常吃鹅蛋的人,不用多久,或有4个改善

鹅蛋营养价值惊人,发现:常吃鹅蛋的人,不用多久,或有4个改善

垚垚分享健康
2026-03-23 17:30:11
000968,午后垂直涨停!油气概念股,集体异动!

000968,午后垂直涨停!油气概念股,集体异动!

证券时报e公司
2026-03-26 16:05:07
日媒:政府出手后,日本汽油价已降至7.71元/升

日媒:政府出手后,日本汽油价已降至7.71元/升

随波荡漾的漂流瓶
2026-03-25 15:39:49
剖腹自尽?日本陆自军官持刀冲入中国大使馆,想杀中国外交员!

剖腹自尽?日本陆自军官持刀冲入中国大使馆,想杀中国外交员!

军武次位面
2026-03-26 14:26:42
如果美国解体,犹太财阀的巨资何处安放下一个宿主,答案超乎想象

如果美国解体,犹太财阀的巨资何处安放下一个宿主,答案超乎想象

芳芳历史烩
2026-03-25 22:24:25
张雪峰传奇人生揭秘:父母下岗,大学考上郑大,第一份工作开饭店

张雪峰传奇人生揭秘:父母下岗,大学考上郑大,第一份工作开饭店

谈史论天地
2026-03-25 07:26:54
2026-03-26 17:56:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
143563文章数 2653026关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
数码
教育
公开课
军事航空

皮衣+裙,高级到炸

数码要闻

苹果MacBook Neo将重塑整个笔电行业!分析师纷纷强调:打不过

教育要闻

中小学家长必看数据,看与不看都会后悔

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版