网易首页 > 网易号 > 正文 申请入驻

刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿

0
分享至

新智元报道

编辑:元宇

【新智元导读】昨天,英伟达重磅发布了专为海量上下文AI打造的CUDA GPU——Rubin CPX,将大模型一次性推理带入「百万Token时代」。NVIDIA创始人兼CEO黄仁勋表示,Vera Rubin平台将再次推动AI计算的前沿,不仅带来下一代Rubin GPU,也将开创一个CPX的全新处理器类别。

「百万Token怪兽」出世!

昨天,NVIDIA突放大招,推出了Rubin CPX,这是一款专为大规模上下文推理而设计的全新GPU。

它的性能,是Vera Rubin NVL144平台的2倍多,是基于Blackwell Ultra的GB300 NVL72机架式系统的7.5倍!

它具有单机架8 EFLOPS的NVFP4计算力、100TB高速内存与1.7 PB/s的内存带宽、128GB的高性价比GDDR7显存。

相比较NVIDIA GB300 NVL72系统,Rubin CPX带来了3倍的注意力机制处理能力。

性能巨兽,在变现能力上更是不容小觑。

每投入1亿美元,最高可以带来50亿美元的Token收入!

Rubin CPX

开创CPX全新处理器类别

Rubin CPX基于Rubin架构构建,是首款专为海量上下文AI打造的CUDA GPU,能够在同一时间推理跨越数百万个知识标记的模型。

可以说,Rubin CPX是专为破解AI「长上下文」瓶颈而生的「特种兵」。

它的出现,为AI带来了百万Token级推理场景下的性能和效率的新突破。

依托于全新的NVIDIA Vera Rubin NVL144 CPX平台,Rubin CPX与NVIDIA Vera CPU和Rubin GPU紧密协同,可以支持多步推理、持久化记忆与长时程上下文,这让它在面对软件开发、视频生成、深度研究等领域的复杂任务时,更加游刃有余。

这也意味着在Rubin CPX的最新加持下,AI编码将从简单的代码生成工具,升级为能够理解并优化大规模软件项目的复杂系统。

同样,它还可以满足长视频与研究类应用领域,在数百万Token级别上保持持续一致性与记忆的需求。

这些需求,都在逼近当前基础设施的极限。

NVIDIA创始人兼CEO黄仁勋表示,Vera Rubin平台将再次推动AI计算的前沿,也将开创一个CPX的全新处理器类别。

「正如RTX颠覆了图形与物理AI一样,Rubin CPX是首个专为海量上下文AI打造的CUDA GPU,模型能够一次性跨越数百万个Token的知识进行推理。」

目前,Cursor、Runway和Magic等AI先锋企业,正在积极探索Rubin CPX在应用加速上的新可能。

30-50倍ROI

重写推理经济

Rubin CPX通过解耦式推理创新,可以企业带来30-50倍ROI,重写推理经济。

大模型的推理,主要分为上下文和生成两个阶段。

它们对于基础设施的要求,也存在着本质性的差异。

上下文阶段,以计算受限为主,需要高吞吐处理来摄取并分析海量输入数据,以产出第一个Token的输出结果。

而生成阶段,则以内存带宽受限为主,依赖快速的内存传输与高速互联(如NVLink)来维持逐Token的输出性能。

解耦式推理,可以让这两个阶段独立处理,从而更加针对性地优化算力与内存资源,提升吞吐,降低时延,增强整体资源的利用率。

但解耦式推理,也带来了新的复杂性层次,需要在低时延KV缓存传输、面向大模型感知的路由,以及高效内存管理之间进行精确协调。

这离不开NVIDIA Dynamo,它作为以上组件的编排层,发挥着关键作用。

Rubin CPX是专为大语言模型(尤其是百万Token上下文)推理设计的「专用加速器」。

Rubin CPX与NVIDIA Vera CPU ,以及用于生成阶段处理的Rubin GPU协同工作,共同形成了面对长上下文场景的完整的高性能解耦式服务方案。

CPX的推出,标志着解耦式推理基础设施的最新进化,也树立了推理经济的新标杆。

在规模化场景下,NVIDIA Vera Rubin NVL144 CPX平台,可带来30–50x的投资回报(ROI)。

这意味着1亿美元的资本性支出(CAPEX),最高可转化为50亿美元的收入。

百万Token怪兽

重新定义下一代AI应用

Vera Rubin NVL144 CPX平台,重新定义了企业构建下一代生成式AI应用的可能性。

NVIDIA Vera Rubin NVL144 CPX机架与托盘,配备Rubin上下文GPU(Rubin CPX)、Rubin GPU与 Vera CPU

Rubin CPX与NVIDIA Vera CPU、Rubin GPU,共同集成在全新的NVIDIA Vera Rubin NVL144 CPX平台内。

NVIDIA Vera Rubin NVL144 CPX平台,采用最新GPU架构,具备极高算力与能效比,可以基于MGX架构实现机架级部署。

1.算力跃升

NVIDIA MGX机架式系统,单机架集成了144块Rubin CPX GPU、144 块Rubin GPU与36颗Vera CPU,可以提供8 EFLOPS的NVFP4计算力,并在单机架内配备100TB高速内存与1.7 PB/s的内存带宽。

2.长序列的高效处理优化

Rubin CPX针对长序列的高效处理进行了优化,是软件应用开发与高清(HD)视频生成等高价值推理用例的关键。

3.显存升级

单个Rubin CPX GPU可以提供高达30 petaflops的NVFP4计算能力,它配备128GB的高性价比GDDR7显存,以加速最苛刻的上下文类工作负载。

4.注意力机制加速

相比NVIDIA GB300 NVL72系统,Rubin CPX带来了3倍的注意力机制处理能力,显著提高模型处理更长上下文序列的能力且不降速。

5.多种形态配置

Rubin CPX提供多种形态配置,包括 Vera Rubin NVL144 CPX,并可与NVIDIA Quantum-X800 InfiniBand横向扩展计算网络。

也可以搭配采用NVIDIA Spectrum-XGS以太网技术与NVIDIA ConnectX®-9 SuperNICs™的NVIDIA Spectrum-X™以太网网络平台结合使用,以实现大规模部署。

Rubin CPX

拥抱NVIDIA全栈AI生态

在生态上,Rubin CPX将得到完整的NVIDIA AI堆栈支持,包括:

  • 软件平台:NVIDIA AI Enterprise,包含NVIDIA NIM™微服务以及可在NVIDIA加速的云、数据中心和工作站上部署的AI框架、库与工具。

  • 编排与模型:NVIDIA Dynamo平台负责高效扩展AI推理,同时处理器将能够运行NVIDIA Nemotron™多模态模型家族中的最新模型。

  • 开发者生态:基于数十年的创新,Rubin平台扩展了NVIDIA庞大的开发者生态,包括NVIDIA CUDA-X™库、超过600万开发者的社区以及近6,000个CUDA应用。

NVIDIA Rubin CPX预计将于2026年底可用。

它的推出将为全球开发者与创作者解锁更强大的能力,重新定义企业构建下一代生成式AI应用的可能性。

参考资料:

https://developer.nvidia.com/blog/nvidia-rubin-cpx-accelerates-inference-performance-and-efficiency-for-1m-token-context-workloads/%20

https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference?ncid=so-twit-653111

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
斩草除根!美以联合空袭打击伊朗伊斯法罕关键光电及导弹研究设施

斩草除根!美以联合空袭打击伊朗伊斯法罕关键光电及导弹研究设施

军迷战情室
2026-03-25 07:42:05
张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

水晶的视界
2026-03-26 09:28:29
张雪峰去世,日媒用了这样一句话评价他...

张雪峰去世,日媒用了这样一句话评价他...

今日日本
2026-03-25 11:10:15
62年胡宗南病逝,死前高举左手惊叫数声,其子:他常恨自己没早死

62年胡宗南病逝,死前高举左手惊叫数声,其子:他常恨自己没早死

云霄纪史观
2026-03-26 11:47:26
伊朗做出“重大让步”,送给美国一份大礼,特朗普要得偿所愿了?

伊朗做出“重大让步”,送给美国一份大礼,特朗普要得偿所愿了?

流史岁月
2026-03-26 13:30:07
突然崩了!很多人以为手机坏了!官方紧急回应

突然崩了!很多人以为手机坏了!官方紧急回应

蓬勃新闻
2026-03-25 20:00:43
全红婵紧抱谷爱凌,张口就说:你好漂亮啊,整个人闪闪发光

全红婵紧抱谷爱凌,张口就说:你好漂亮啊,整个人闪闪发光

喜文多见01
2026-03-26 09:54:39
6岁男童被弃酒店半个月,妈妈终于现身!孩子紧紧抱住不愿松手,网友:这孩子懂事得让人心疼

6岁男童被弃酒店半个月,妈妈终于现身!孩子紧紧抱住不愿松手,网友:这孩子懂事得让人心疼

大风新闻
2026-03-25 15:43:11
实锤了!歼10C飞行员明确披露,我军预警机可直接制导空空弹

实锤了!歼10C飞行员明确披露,我军预警机可直接制导空空弹

策略述
2026-03-25 14:07:39
原来她是张雪峰妻子,高校副教授历史博士,相差7岁认识40天闪婚

原来她是张雪峰妻子,高校副教授历史博士,相差7岁认识40天闪婚

奇思妙想草叶君
2026-03-26 14:01:49
50岁何润东做梦也没想到,因张凌赫一个造型,让他的口碑一夜暴涨

50岁何润东做梦也没想到,因张凌赫一个造型,让他的口碑一夜暴涨

东方不败然多多
2026-03-26 14:08:20
弃40万镑周薪去赚大钱 下一站沙特超 2年合同 年薪1亿欧

弃40万镑周薪去赚大钱 下一站沙特超 2年合同 年薪1亿欧

智道足球
2026-03-25 15:36:30
中方谈判没有错

中方谈判没有错

新浪财经
2026-03-26 12:42:12
66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

比利
2026-03-21 13:00:22
连续三天,重庆市委书记袁家军围绕这件事调研

连续三天,重庆市委书记袁家军围绕这件事调研

中国乡村振兴
2026-03-26 10:02:48
布朗尼:上场就要充满信心打好比赛,在G联赛的付出得到了回报

布朗尼:上场就要充满信心打好比赛,在G联赛的付出得到了回报

懂球帝
2026-03-26 12:27:11
玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

洞读君
2026-03-04 14:30:12
河南一男大学生长期吃外卖、熬夜,突发急性心梗!医生:遇上心梗中的“寡妇制造者”,死亡率高

河南一男大学生长期吃外卖、熬夜,突发急性心梗!医生:遇上心梗中的“寡妇制造者”,死亡率高

大象新闻
2026-03-25 18:45:05
张雪峰遗产纷争的内幕!

张雪峰遗产纷争的内幕!

八卦疯叔
2026-03-26 11:05:04
“中国有史以来唯一对哲学做过深刻贡献的学者”

“中国有史以来唯一对哲学做过深刻贡献的学者”

尚曦读史
2026-02-20 20:54:03
2026-03-26 14:44:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14819文章数 66720关注度
往期回顾 全部

数码要闻

云英谷科技携VTDR6135 参评SID中国区显示行业奖(CDIA)

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

游戏
旅游
房产
公开课
军事航空

外媒锐评PS去年错得离谱!发行商排名21 被微软甩开

旅游要闻

淡季旺销!南明住宿业今年前两月营收斩获1.18亿元

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版