网易首页 > 网易号 > 正文 申请入驻

英伟达发布超长上下文推理芯片Rubin CPX 算力效率拉爆当前旗舰

0
分享至

财联社9月10日讯(编辑 史正丞)全球人工智能算力芯片龙头英伟达周二宣布,推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。

英伟达CEO黄仁勋表示,CPX是首款专为需要一次性处理大量知识(数百万级别tokens),并进行人工智能推理的模型而构建的芯片。

需要说明的是,Rubin就是英伟达将在明年发售的下一代顶级算力芯片,所以基于Rubin的CPX预计也要到2026年底出货。下一代英伟达旗舰AI服务器的全称叫做NVIDIA Vera Rubin NVL144 CPX——集成36个Vera CPU、144块Rubin GPU和144块Rubin CPX GPU。

(NVIDIA Vera Rubin NVL144 CPX机架与托盘,来源:公司博客)

英伟达透露,搭载Rubin CPX的Rubin机架在处理大上下文窗口时的性能,能比当前旗舰机架GB300 NVL72高出最多6.5倍。

据悉,下一代旗舰机架将提供8 exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍。同时单个机架就能提供100 TB的高速内存和1.7 PB/s的内存带宽。

言归正传,英伟达之所以要在Rubin GPU边上再配一块Rubin CPX GPU,自然是为了显著提升数据中心的算力效率——用户购买英伟达的芯片将能赚到更多的钱。英伟达表示,部署价值1亿美元的新芯片,将能为客户带来50亿美元的收入。

为何需要两个GPU?

作为行业首创之举,英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。

英伟达介绍称,推理过程包括两个截然不同的阶段:上下文阶段与生成阶段,两者对基础设施的要求本质上完全不同。

上下文阶段属于计算受限(compute-bound),需要高吞吐量的处理能力来摄取并分析大量输入数据,从而生成首个输出token。相反,生成阶段则属于内存带宽受限(memory bandwidth-bound),依赖高速的内存传输和高带宽互联(如 NVLink),以维持逐个token的输出性能。

当前顶级的GPU都是为了内存和网络限制的生成阶段设计,配备昂贵的HBM内存,然而在解码阶段并不需要这些内存。因此,通过分离式处理这两个阶段,并针对性地优化计算与内存资源,将显著提升算力的利用率。

据悉,Rubin CPX专门针对“数百万tokens”级别的长上下文性能进行优化,具备30 petaFLOPs的NVFP4算力、128GB GDDR7内存

英伟达估计,大约有20%的AI应用会“坐等”首个token出现。例如解码10万行代码可能需要5-10分钟。而多帧、多秒的视频,预处理和逐帧嵌入会迅速增加延迟,这也是为什么当前的视频大模型通常仅用于制作短片。

英伟达计划以两种形式提供Rubin CPX,一种是与Vera Rubin装在同一个托盘上。对于已经下单NVL144的用户,英伟达也会单独出售一整个机架的CPX芯片,数量正好匹配Rubin机架。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日媒:吓破胆!小泉指责中方航母针对日本,扬言警惕,全程监视

日媒:吓破胆!小泉指责中方航母针对日本,扬言警惕,全程监视

老癘体育解说
2026-06-02 13:25:41
亲眼目睹藏族少女天葬之行,参加全过程后心悸:颠覆我对生死的认知

亲眼目睹藏族少女天葬之行,参加全过程后心悸:颠覆我对生死的认知

古怪奇谈录
2025-09-09 14:36:35
女子利用天气预报频繁购买飞机延误险,5年买中900多次,获赔近300万,被抓时:我符合保险理赔要求

女子利用天气预报频繁购买飞机延误险,5年买中900多次,获赔近300万,被抓时:我符合保险理赔要求

谭老师地理大课堂
2026-04-15 20:11:42
日专家曾指出:中日一旦开战,以日本自卫队实力,中日难分胜负?

日专家曾指出:中日一旦开战,以日本自卫队实力,中日难分胜负?

混沌录
2026-04-27 19:31:17
没想到,马斯克离开中国才一天,78岁母亲一句话让中国网友破防

没想到,马斯克离开中国才一天,78岁母亲一句话让中国网友破防

南风不及你温柔
2026-05-22 05:13:52
顶级曲线美学!F级沙漏身材+飒爽御姐天花板,自带气场的顶级尤物

顶级曲线美学!F级沙漏身材+飒爽御姐天花板,自带气场的顶级尤物

生如稗草
2026-06-02 09:13:17
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

芳芳历史烩
2025-12-25 20:32:52
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

古史青云啊
2026-04-07 14:52:09
奚梦瑶的家庭背景如何

奚梦瑶的家庭背景如何

动物奇奇怪怪
2026-06-02 19:43:39
上海一租客签订合同当日,卧室、卫生间爬出大量蜈蚣,床底都是蜈蚣尸体,吓到不敢住,房东拒绝退还押金,法院判了

上海一租客签订合同当日,卧室、卫生间爬出大量蜈蚣,床底都是蜈蚣尸体,吓到不敢住,房东拒绝退还押金,法院判了

洪观新闻
2026-06-01 11:39:35
CBA第一小外援要走?广东有望抢下“得分机器”,保底能进总决赛

CBA第一小外援要走?广东有望抢下“得分机器”,保底能进总决赛

冷桂零落
2026-06-03 01:09:25
中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

中方已做最坏准备,一旦中美爆发战争,中国三大底牌一个比一个狠

阿校谈史
2026-05-14 00:12:02
他是开国上将,因生活作风屡入歧途,后终究犯了大错

他是开国上将,因生活作风屡入歧途,后终究犯了大错

舆图看世界
2026-05-29 10:55:03
在人均GDP基本相同的国家中,为什么中国生育率最低?

在人均GDP基本相同的国家中,为什么中国生育率最低?

何亚福
2026-06-02 19:23:06
美国夫妇游完中国后,回去跟朋友说:中国根本不是我们想象的那样

美国夫妇游完中国后,回去跟朋友说:中国根本不是我们想象的那样

手里有读
2026-05-17 09:17:35
浙江女子以190万把房子卖给租客,租客觉得贵拒绝了,随后女子170万卖给他人,租客知道后起诉女子,要求赔偿20万!法院判了

浙江女子以190万把房子卖给租客,租客觉得贵拒绝了,随后女子170万卖给他人,租客知道后起诉女子,要求赔偿20万!法院判了

犀利强哥
2026-05-31 21:15:20
紫牛头条|砖块松动“坑倒”骑车人致其多处骨折,交警无法出具责任认定,咋索赔?

紫牛头条|砖块松动“坑倒”骑车人致其多处骨折,交警无法出具责任认定,咋索赔?

扬子晚报
2026-06-02 22:08:24
法网女单太残酷了:随着斯维托丽娜1-2出局,世界前十仅剩2人

法网女单太残酷了:随着斯维托丽娜1-2出局,世界前十仅剩2人

侧身凌空斩
2026-06-02 20:28:22
独家:原中国航天科工集团董事长曾是著名导弹专家   其妻子曾在宾馆工作? 照顾了他半生

独家:原中国航天科工集团董事长曾是著名导弹专家  其妻子曾在宾馆工作? 照顾了他半生

新浪财经
2026-05-31 15:40:03
订单已经排到2027年下半年!价格暴涨

订单已经排到2027年下半年!价格暴涨

新浪财经
2026-06-02 18:04:37
2026-06-03 03:59:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
726781文章数 1021236关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

游戏
数码
亲子
旅游
军事航空

离发售不远了!《寂静岭》系列新作已公开游戏评级

数码要闻

苹果watchOS 27前瞻:改进心率追踪、引入新表盘、升级Siri

亲子要闻

《前面有多生气,后面就有多搞笑》

旅游要闻

北京位列全球数字旅游引领型城市榜首

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版