网易首页 > 网易号 > 正文 申请入驻

英伟达RISC-V,去年出货10亿颗

0
分享至

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容编译自riscv,谢谢。

在最近的 RISC-V 北美峰会上,NVIDIA 多媒体架构副总裁 Frans Sijstermans 深入阐述了 NVIDIA 选择 RISC-V 作为其嵌入式微控制器架构的原因,以及它如何成为其产品成功的重要组成部分。

NVIDIA 与 RISC-V 的历史可以追溯到 2016 年,当时该公司开始将其内部 Falcon 微处理器(用作 GPU 产品的逻辑控制器)转换为新的替代方案。在评估了可用的架构后,NVIDIA 选择了 RISC-V ISA,从那时起,他们一直在将 RISC-V 微控制器添加到其产品中并替换掉传统的 Falcons。

在其 10 年的生命周期中,NVIDIA 估计已出货了约 30 亿台 Falcon 处理器,而这一转变最终将导致数十亿台 RISC-V 处理器的出货量。通常,每个 NVIDIA 芯片组包含 10 到 40 个 RISC-V 核心,具体取决于配置。2024 年,根据出货的芯片总数,它们将突破 10 亿台 RISC-V 处理器大关。

自首次社区会议以来,NVIDIA 一直是 RISC-V 社区的积极成员,并且几乎一直在董事会层面拥有代表权。他们参与了许多技术工作组,既贡献和分享他们的工作,也从其他社区成员的共同贡献中受益,同时还参与了 RISE 软件组织。

尽管如此,NVIDIA 并不经常与 RISC-V 联系在一起,这可能是因为它的大部分工作都是内部完成的,而且虽然很重要,但往往与其产品的非面向客户方面有关。这些可以分为三个关键领域,其中 RISC-V 在 NVIDIA 产品组合中发挥着重要作用:

  • 功能级控制器包括视频编解码器、显示器、摄像头、内存控制器(训练)、Chip2Chip 接口和上下文切换;

  • 芯片/系统级控制,包括资源管理、电源管理和安全;

  • 数据处理包括网络中的数据包路由和激活以及 DLA(非 GPU)中的其他 DL 网络层;

NVIDIA 从 32 位 Falcon 核心过渡到 RISC-V 最初是出于对 64 位功能的需求。他们的第一个 RISC-V 开发是一个相当普通的双发射无序 RISC-V 核心,带有标准扩展,可部署为多处理器版本。随后,他们为面积受限的应用程序添加了 32 位版本,以及带有 1024 位矢量单元的矢量处理器。

NVIDIA 还开发了几个自定义扩展,其中一些是 NVIDIA 独有的,另一些则对普通用户有益。例如,2kB 页面大小扩展是 NVIDIA 独有的,可将旧软件性能提高 50% 。同样,64 位地址扩展在非常大的系统中很有用,例如数据中心,其中内存是分布式的,并且可能相距甚远。

相反,他们的指针掩码扩展对于整个社区的安全应用具有实用潜力。因此,NVIDIA 将该扩展提交给 RISC-V 标准,该标准已获得批准,目前已被众多社区成员使用。

NVIDIA 具有额外的扩展,可实现一般功能、安全性和性能,虽然这些都不是特别先进,但对于整个系统来说至关重要。

NVIDIA 的 SoC 使用自己的 RISC-V 子系统,名为 Peregrine。除了 RISC-V 内核之外,它还包括其他外设,例如 DMA 和安全 IP。Peregrine 对 NVIDIA 至关重要,因为它允许他们选择和重复使用他们想要包含的 30 多个系统控制和管理应用程序中的任何一个,而无需每次都进行特定的独立开发工作。RISC-V 架构使 NVIDIA 能够灵活和模块化地根据需求配置子系统。例如,他们可以选择 32 位或 64 位内核,然后选择工作负载所需的特定扩展,从而最大限度地提高开发重用率和投资回报率。

类似地,在软件方面,所有 30 多个应用程序都使用一个单一的堆栈,这允许在应用程序级别大量重用启动、操作系统、分离内核和库等项目。

NVIDIA 同样致力于使其产品尽可能安全,包括使用内部攻击性安全团队部署为“黑客”,积极尝试通过查找弱点、漏洞和错误来破坏设计。

Peregrine 子系统的核心组件是分离内核,可以将其视为非常基本的虚拟机管理程序系统。它将系统划分为彼此独立且可以单独验证的不同部分。这允许用户在单独的分区上运行不同的软件。例如,符合安全要求且获得 ASIL-D 认证的应用程序可以在一个分区上运行,而另一个未经认证的应用程序可以在另一个分区上独立运行。

NVIDIA 拥有 30 多个不同的系统控制和管理应用程序,这些应用程序使用 RISC-V 核心,并且可以根据具体用例灵活部署。下面详细介绍了其中两个应用程序。

首先,GPU 系统处理器 (GSP:GPU System Processor) 为 NVIDIA 带来了软件处理方式的根本性变化。GSP 是位于 GPU 顶部的处理器,它抽象了 GPU 中可以执行的操作。主机处理器和内核驱动程序不再使用 GPU 内部的单独控制寄存器,而是直接与 GSP 通信,GSP 将这些高级命令转换为低级控制寄存器速率。

GSP Peregrine 拥有 64 位 RISC-V 处理器,提供单 hart 和多 hart 版本。最重要的是,GSP 可以完全访问 GPU 中的所有内容,包括内存和显示控制器,这些都需要在软件中非常小心地管理。从软件角度来看,用户可以部署具有内核驱动程序和多个客户虚拟机的主机处理器。客户虚拟机在 GSP 上有相应的 vGPU 运行时分区,分离内核确保它们相互隔离且不会相互干扰。资源管理器交换不同的客户机并确保分配公平。此功能支持特定用例,例如机密计算,其中 GPU 移交给客户机而不会受到虚拟机管理程序的任何影响。在这种情况下,RISC-V 架构对于安全性至关重要,因为它具有特定的隔离功能以及 NVIDIA 自己的扩展属性。

描述的第二个支持 NVIDIA RISC-V 的应用程序是深度学习加速器,它是某些 AI 专用 SoC 的一部分。这本质上是一个在图形处理中编程的推理引擎。一个例子是 ONNX 程序,它表示在深度学习网络中处理的层图。然后,它使用标准 RISC-V 编译器获取内核代码并将其编译为可执行文件。最重要的是,有一个 RVV 编译器将其转换为可加载文件。还可以将不同的内核组合成一个内核,以便在运行时实现最快的执行速度。

DLA 并不会在 RISC-V 处理器上运行所有东西,主卷积核心和矩阵乘法器是独立的实体。在下面的硬件图中,有两个 RISC-V 处理器,一个是控制;一个简单的 32 位单元,然后是矢量,即 NVRVV,一个 1024 位矢量单元。有一个卷积核心和总共六个硬件引擎。例如,Rubik 是一个智能 DMA 数据转换器,可以移动数据,而 RISC-V RVV 矢量处理器用于大多数非矩阵乘法器的层。简而言之,它本质上是在 DLA 上运行的完整 ONNX 实现。

总而言之,NVIDIA 选择 RISC-V ISA 以及它取得成功的原因有 5 个:

  1. 定制:定制能力是关键,因为它允许 NVIDIA 最大限度地利用硅片。RISC-V 许可模式允许他们使用基本 ISA 作为构建块来调整芯片,并添加适合特定应用要求的扩展和配置文件;

  2. 硬件/软件协同设计:这是关键,因为它可以确保硬件针对软件工作负载进行优化,从而提高效率和性能;

  3. 配置选项:标准的“现成”处理器通常针对应用程序进行了过度指定。借助 RISC-V,NVIDIA 可以通过仅使用特定所需的扩展来配置其实现,从而节省成本和开发工作;

  4. 自定义扩展:允许 NVIDIA 添加自己的功能要求,如特定功能、安全性和/或性能;

  5. 一个通用的硬件和软件架构:允许 NVIDIA 在其 30 多个应用程序中重复使用资产,而无需为每个应用程序创建或调整新架构。减少开发工作量、简化部署并降低成本;


https://riscv.org/blog/2025/02/how-nvidia-shipped-one-billion-risc-v-cores-in-2024/

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4052期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泽连斯基越线了!把手伸向台海南海,真以为中国会一忍再忍?

泽连斯基越线了!把手伸向台海南海,真以为中国会一忍再忍?

叶老四
2026-06-23 19:37:26
乌兹国脚:如果被吹那个进球算数,我想比赛的走向会完全不同

乌兹国脚:如果被吹那个进球算数,我想比赛的走向会完全不同

懂球帝
2026-06-24 08:05:13
终于明白!普通人再也不养冯小刚们了:你住豪宅,我凭啥给你撑面

终于明白!普通人再也不养冯小刚们了:你住豪宅,我凭啥给你撑面

魔都姐姐杂谈
2026-06-24 10:01:02
韩国队打平=出线!亚洲首支出线队即将诞生,CCTV5直播

韩国队打平=出线!亚洲首支出线队即将诞生,CCTV5直播

何老师呀
2026-06-24 13:38:00
被问内马尔能出场多久,安帅:如果走着踢,我也能踢满90分钟

被问内马尔能出场多久,安帅:如果走着踢,我也能踢满90分钟

懂球帝
2026-06-24 11:39:30
“钠离子电池=新石油”!大摩喊出口号

“钠离子电池=新石油”!大摩喊出口号

华尔街见闻官方
2026-06-24 22:27:56
炖鸡时,有人焯水,有人直接炖,都不对!教你一招,营养翻倍

炖鸡时,有人焯水,有人直接炖,都不对!教你一招,营养翻倍

邹小蘑菇
2026-06-24 10:56:19
金价大跳水!上海金跌破900元一克,现在到底能不能入手黄金?

金价大跳水!上海金跌破900元一克,现在到底能不能入手黄金?

次元君情感
2026-06-24 15:36:03
拉文带娇妻看世界杯,只打39场,明年薪水4896万,娇妻很漂亮

拉文带娇妻看世界杯,只打39场,明年薪水4896万,娇妻很漂亮

大西体育
2026-06-24 11:10:50
苦撑五个月,燃油车价格崩塌,国内经销商现倒闭潮,无奈退居二线

苦撑五个月,燃油车价格崩塌,国内经销商现倒闭潮,无奈退居二线

闻识
2026-06-25 00:27:07
一大波雨҈雨҈雨҈雨҈雨҈……

一大波雨҈雨҈雨҈雨҈雨҈……

江苏警方
2026-06-22 22:26:40
这次我站纸尿裤企业这边!

这次我站纸尿裤企业这边!

葱哥说
2026-06-23 22:51:15
开盘大涨超900%!A股再现半导体大肉签,中一签最高赚21万元

开盘大涨超900%!A股再现半导体大肉签,中一签最高赚21万元

21世纪经济报道
2026-06-24 10:29:13
曾经加价60万还得排队半年,如今一年蒸发60万:LX570的神坛塌了

曾经加价60万还得排队半年,如今一年蒸发60万:LX570的神坛塌了

刘哥谈体育
2026-06-24 16:34:31
辛芷蕾新造型美疯,“白衬衫+灰色阔腿裤”,丝巾绑棒球帽好松弛

辛芷蕾新造型美疯,“白衬衫+灰色阔腿裤”,丝巾绑棒球帽好松弛

明星私服穿搭daily
2026-06-24 09:21:55
多弗集团董事长胡兴荣失联,全员停薪

多弗集团董事长胡兴荣失联,全员停薪

地产微资讯
2026-06-24 11:35:55
陈坤周迅在北京聚餐!陈坤穿垂裆裤显随意,周迅披着外衣装扮逗趣

陈坤周迅在北京聚餐!陈坤穿垂裆裤显随意,周迅披着外衣装扮逗趣

一盅情怀
2026-06-24 14:35:38
原来她是姆巴佩新女友,坐拥全球超2400万粉丝,曾对足球一窍不通

原来她是姆巴佩新女友,坐拥全球超2400万粉丝,曾对足球一窍不通

手工制作阿歼
2026-06-24 04:57:16
消失三年后32岁乔欣近照流出,豪门阔太面相大变,网友直呼不敢认

消失三年后32岁乔欣近照流出,豪门阔太面相大变,网友直呼不敢认

橙星文娱
2026-06-24 14:23:07
高考屏蔽生流出!这些学校,真给广州长脸

高考屏蔽生流出!这些学校,真给广州长脸

广州楼市发布
2026-06-24 23:13:10
2026-06-25 01:00:49
半导体行业观察
半导体行业观察
专注观察全球半导体行业资讯
13995文章数 34960关注度
往期回顾 全部

数码要闻

宇树R1人形机器人大降价:2.99万元起!现货发售

头条要闻

谢锋当众质问巴拿马:若契约想撕毁就撕毁 谁还来投资

头条要闻

谢锋当众质问巴拿马:若契约想撕毁就撕毁 谁还来投资

体育要闻

字母哥,会把凯尔特人拆了吗?

娱乐要闻

向佐向佑兄弟合体直播!母子终于和解

财经要闻

逃税23亿:审计署年报直指七家机构

科技要闻

豆包专业版上线:定价68-500元每月

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

手机
亲子
本地
数码
公开课

手机要闻

华为Mate80:销量逼近700万!华为Pura 100:2亿像素长焦蓄势待发

亲子要闻

婴儿纸尿裤十大品牌排行榜:2026母婴安心回购清单

本地新闻

2026世界杯全勤太难?这份保姆级攻略请收好

数码要闻

影石回应Luna Ultra“骗国补”质疑:不存在骗补,系品牌补贴与政策落地差异

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版