网易首页 > 网易号 > 正文 申请入驻

英伟达发布超长上下文推理芯片Rubin CPX 算力效率拉爆当前旗舰

0
分享至

财联社9月10日讯(编辑 史正丞)全球人工智能算力芯片龙头英伟达周二宣布,推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。

英伟达CEO黄仁勋表示,CPX是首款专为需要一次性处理大量知识(数百万级别tokens),并进行人工智能推理的模型而构建的芯片。

需要说明的是,Rubin就是英伟达将在明年发售的下一代顶级算力芯片,所以基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。


(NVIDIA Vera Rubin NVL144 CPX机架与托盘,来源:公司博客)

英伟达透露,搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能,能比当前旗舰机架GB300 NVL72高出最多6.5倍。


据悉,下一代旗舰机架将提供8 exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍。同时单个机架就能提供100 TB的高速内存和1.7 PB/s的内存带宽。

言归正传,英伟达之所以要在Rubin GPU边上再配一块Rubin CPX GPU,自然是为了显著提升数据中心的算力效率——用户购买英伟达的芯片将能赚到更多的钱。英伟达表示,部署价值1亿美元的新芯片,将能为客户带来50亿美元的收入。

为何需要两个GPU?

作为行业首创之举,英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。

英伟达介绍称,推理过程包括两个截然不同的阶段:上下文阶段与生成阶段,两者对基础设施的要求本质上完全不同。


上下文阶段属于计算受限(compute-bound),需要高吞吐量的处理能力来摄取并分析大量输入数据,从而生成首个输出token。相反,生成阶段则属于内存带宽受限(memory bandwidth-bound),依赖高速的内存传输和高带宽互联(如 NVLink),以维持逐个token的输出性能。

当前顶级的GPU都是为了内存和网络限制的生成阶段设计,配备昂贵的HBM内存,然而在解码阶段并不需要这些内存。因此,通过分离式处理这两个阶段,并针对性地优化计算与内存资源,将显著提升算力的利用率。

据悉,Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化,具备30 petaFLOPs的NVFP4算力、128GB GDDR7内存

英伟达估计,大约有20%的AI应用会“坐等”首个token出现。例如解码10万行代码可能需要5-10分钟。而多帧、多秒的视频,预处理和逐帧嵌入会迅速增加延迟,这也是为什么当前的视频大模型通常仅用于制作短片。

英伟达计划以两种形式提供Rubin CPX,一种是与Vera Rubin装在同一个托盘上。对于已经下单NVL144的用户,英伟达也会单独出售一整个机架的CPX芯片,数量正好匹配Rubin机架。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太不小心了,黄晓明被曝大量私照,这跟官宣有啥区别?

太不小心了,黄晓明被曝大量私照,这跟官宣有啥区别?

娱乐小丸子
2025-12-30 12:41:11
双神之战!你我皆是英雄!

双神之战!你我皆是英雄!

贵圈真乱
2025-12-30 11:51:06
陈伟俊,被免职

陈伟俊,被免职

新京报政事儿
2025-12-30 10:56:57
10位同学已相继逝去!70后网友发帖感慨,已订好车票,马上进站了

10位同学已相继逝去!70后网友发帖感慨,已订好车票,马上进站了

火山詩话
2025-12-30 14:47:51
活久见!网传广东一企业声称经营发展需要,不再为员工缴纳社保…

活久见!网传广东一企业声称经营发展需要,不再为员工缴纳社保…

火山詩话
2025-12-30 05:51:50
台湾,还需要几辈子?

台湾,还需要几辈子?

新民周刊
2025-12-30 09:07:20
“他说这800万是我们的后半生……”杭州55岁大姐遇“真爱”

“他说这800万是我们的后半生……”杭州55岁大姐遇“真爱”

都市快报橙柿互动
2025-12-30 08:21:38
一个国家正在崩塌:伊朗女孩扔掉头巾,如同大清朝开始剪辫子

一个国家正在崩塌:伊朗女孩扔掉头巾,如同大清朝开始剪辫子

老范谈史
2025-12-29 15:59:06
从辅助到自动,L3终于破冰

从辅助到自动,L3终于破冰

虎嗅APP
2025-12-27 18:04:01
网购羽绒服半个月后遭退货,口袋里还留着旅游的机票,商家怒斥:退回的衣服到处都是油渍,你是活不起了吗?

网购羽绒服半个月后遭退货,口袋里还留着旅游的机票,商家怒斥:退回的衣服到处都是油渍,你是活不起了吗?

观威海
2025-12-30 10:06:03
有37℃体温,超逼真机器人即将众筹,想成为你的“第四种关系”

有37℃体温,超逼真机器人即将众筹,想成为你的“第四种关系”

机器人大讲堂
2025-12-28 20:13:46
7名内耗干部,被“回炉锻造”

7名内耗干部,被“回炉锻造”

中国新闻周刊
2025-12-30 12:18:39
110万俄军消失!俄乌谁在说谎?

110万俄军消失!俄乌谁在说谎?

高博新视野
2025-12-27 18:16:14
伊利拍了个“养牛爽剧”,年轻人居然追疯了?

伊利拍了个“养牛爽剧”,年轻人居然追疯了?

一点财经
2025-12-30 12:18:25
杜兰特30+6+5火箭送步行者9连败 阿门20+8+7贾巴里21+10

杜兰特30+6+5火箭送步行者9连败 阿门20+8+7贾巴里21+10

醉卧浮生
2025-12-30 11:23:12
打虎!张世平被查

打虎!张世平被查

新京报政事儿
2025-12-30 14:43:01
要动真格了?156克拉河南钻石刷新记录,美国立刻动手:全面禁止

要动真格了?156克拉河南钻石刷新记录,美国立刻动手:全面禁止

火星方阵
2025-12-29 21:30:39
东部战区军演针对谁?美日媒体都认为是对方,国台办一句话定基调

东部战区军演针对谁?美日媒体都认为是对方,国台办一句话定基调

时时有聊
2025-12-30 07:48:36
说一说我国道德败坏的复方药

说一说我国道德败坏的复方药

科海识贝sci
2025-12-29 10:54:44
45岁家长参加学校护学岗时突然倒地,送医后身亡!多方回应

45岁家长参加学校护学岗时突然倒地,送医后身亡!多方回应

扬子晚报
2025-12-30 14:36:52
2025-12-30 15:51:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
665792文章数 1016390关注度
往期回顾 全部

科技要闻

估值150亿的智元,开始批量"制造"小独角兽

头条要闻

普京通知特朗普自己官邸遇袭 泽连斯基:完全的捏造

头条要闻

普京通知特朗普自己官邸遇袭 泽连斯基:完全的捏造

体育要闻

这个59岁的胖子,还在表演“蝎子摆尾”

娱乐要闻

林俊杰官宣文案争议!女方名字都不提

财经要闻

朱光耀:美关税政策正使WTO名存实亡

汽车要闻

标配华为乾崑ADS 4 Pro 华境S明年上半年上市

态度原创

时尚
家居
旅游
本地
军事航空

“短大衣”今年冬天又火了,这4件怎么搭都好看!

家居要闻

当归之宅 三胎圆满居所

旅游要闻

跨年怎么玩?济南多个景区放大招,仪式感拉满

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

军事要闻

福建海警舰艇与台海巡船对峙航行

无障碍浏览 进入关怀版