网易首页 > 网易号 > 正文 申请入驻

RISC-V与虚拟指令技术:奕行智能的创新计算架构探索

0
分享至

在人工智能驱动的Software 3.0 时代,计算架构的革新已成为技术突破的核心命题。OpenAI 创始成员 Andrej Karpathy 首次系统提出 “Software 3.0” 概念,揭示了自然语言提示(Prompts)取代传统代码、大型语言模型(LLM)成为新编程接口的范式转变。这一变革不仅重构了软件开发逻辑,更倒逼硬件架构进入以 AI 需求为导向的 3.0 时代。如何构建兼具效率与通用性的下一代计算架构?奕行智能提出的 RISC-V 与虚拟指令技术融合方案,为这一命题提供了突破性答案。

近日,奕行智能联合创始人、COO 杨宜博士在第五届 RISC-V 中国峰会发表题为《RISC-V 与虚拟指令技术结合打造创新的计算架构》的主题演讲,深入探讨如何通过 RISC-V 指令扩展与虚拟指令技术的创新结合,应对 AI 时代计算架构的核心挑战。针对传统 ASIC 的僵化与通用处理器的低效这一行业痛点,该公司揭示了一种突破性解决方案 —— 通过指令集层面的创新,实现 AI 计算效率与编程灵活性的革命性平衡,为下一代 AI 计算架构指明了发展方向。

Hardware 3.0 的核心矛盾与解决方案

硬件架构的演进与之形成镜像呼应。从CPU主导的Hardware 1.0到GPU/NPU支撑的Hardware 2.0,再到当前以领域专用架构(DSA)为核心的Hardware 3.0,计算平台始终围绕软件需求迭代。大模型时代催生的TPU、存算一体芯片及GPU的DSA化设计(如NVIDIA Tensor Core),均体现了硬件对AI计算特性的深度适配。然而,传统CPU/GPU在算力利用率上的局限性,与专用AI芯片难以适应算法迭代的矛盾,成为Hardware 3.0必须突破的核心痛点。

针对Hardware 3.0,杨宜博士指出,AI计算属于领域特定范式,其核心在于通过提升算力利用率实现硬件效率的最大化。但与此同时,模型的多样性以及海量用户的编程需求是必须面对的现实,因此在领域内兼顾通用性与专用性成为核心诉求。

“算力的利用率并非仅指程序运行时可加载的计算单元占比,还包括能让多大比例的用户便捷使用。从这一角度而言,计算效率与通用性并非对立关系,而是一体化的‘用户诉求’。” 杨宜博士进一步解释道。

在AI处理器的构建过程中,面临着多重挑战:AI 计算架构设计耗时较长,从零开始构建需经历复杂的技术决策与优化过程,周期相对漫长;指令系统打磨周期久,从零开始打造一套获得产品与生态认可的指令系统,需要大量时间进行验证与完善;AI 编译软件落地周期长,从零开始研发后端编译软件并使其达到成熟商用水平,需经过长时间的调试与优化;生态兼容存在难题,自主构建的指令系统要获得广泛的生态支持,这一过程门槛较高且存在不确定性。

RISC-V 与虚拟指令技术的创新结合

面对上述挑战,奕行智能决定采用RISC-V + RVV来构建 AI 计算架构。杨宜博士阐述了这一选择的考量:RISC-V 具备开放性与模块化设计特点,能够灵活定制专用 AI 加速指令集,这对构建领域特定架构(DSA)大有裨益;同时,其精简架构降低了芯片设计门槛,可助力企业实现快速迭代。

“奕行智能将 RISC-V 作为架构创新的基础底座。其开放的指令集支持定制 AI 专用扩展,而 RVV 可变长向量指令能直接适配张量计算,向量掩码机制则可直接支持稀疏矩阵运算。更关键的是,RISC-V 的生态正日趋成熟 ——LLVM、GCC 等主流编译器已支持该架构,主流 AI 框架也在积极适配 RISC-V 平台,这为我们的产品快速落地提供了有力支撑。” 杨宜博士补充道。

关于DSA 的指令路径选择,杨宜博士结合奕行智能的 EVAMIND™ AI 内核,深入剖析了 RISC-V 指令扩展与虚拟指令技术(VISA)的创新性结合。

VISA 是奕行智能独创的中间层,介于 AI 编译器与后端编译之间:它既是一套软件的中间层封装,也是 EVAMIND™内核硬件中可真实乱序发射的宏指令,通过在硬件 ISA(指令集架构)之上抽象出的一套统一虚拟 ISA 实现。VISA 的核心作用,是解决 AI 计算架构演进中的三大关键问题:硬件与算子、编译器等软件栈深度耦合,相互制约彼此演进;AI 处理器设计中难以平衡通用性与专用性需求;AI 编译的中间表达(IR)在下降过程中,从张量到细粒度 SIMD 的过渡过于陡峭,导致优化机会流失。

杨宜在技术分享中详细阐释了EVAS 架构的创新设计:该架构通过 VISA 体系中的细粒度硬件指令实现粗粒度 VISA 算子,每个算子内部采用软件流水、循环展开等优化手段确保性能表现。这种设计使 AI 编译层只需聚焦算子级调度,大幅降低指令发射复杂度。

架构创新体现在两大核心特征:一是跨单元调度,在DSA 异构计算单元间,具备张量语义的虚拟指令(VISA)实现乱序调度,强化 AI 专用属性;二是指令分解执行,结合 RISC-V RVV 微指令,将 VISA 宏指令拆解为图灵完备的细粒度微指令执行。

“VISA本质是由标量核硬件发射的宏指令,但其内部集成高效优化的软内核,这种软硬协同设计在保证专用计算效率的同时,显著提升编程体验。” 杨宜补充道。

在EVAMIND™内核中,各组件分工明确:标量引擎承担整个系统的协调与控制工作;VISA 调度器负责保障粗粒度宏指令的编排及乱序发射;张量引擎专门处理矩阵运算和张量计算;4D 加速引擎则负责核内外的数据搬运,以及随路激活、reduce 运算、4 维矩阵变换与各类转置操作;此外,RISC-V RVV 向量引擎提供了 AI 专用的硬件扩展,可确保细粒度微指令的高效执行。

依托EVAMIND 架构,奕行智能即将推出新一代智算芯片。该产品支持INT4/8 与 FP8/16/BF16 混合精度计算,尤其在 FP8/INT4 原生支持上实现 2-4 倍吞吐提升。通过多维并行计算与流水线掩盖技术,可最大化计算资源利用率。杨宜强调:“这款芯片将为大模型时代提供高效、灵活的混合精度计算解决方案。”

展望未来

在AI 技术快速发展的浪潮中,计算架构正迎来全面升级的关键阶段。奕行智能通过创新性的软硬协同设计理念,为解决 AI 计算领域的核心矛盾提供了全新思路。

未来,奕行智能将继续深化RISC-V 生态建设,推动虚拟指令技术标准化,与更多产业伙伴携手构建开放、高效的 AI 计算生态系统。在 Software 3.0 时代,只有通过持续的技术创新和架构突破,才能真正为数字经济发展注入强劲动力。正如杨宜博士所展望的:“我们正站在 AI 计算架构变革的历史节点上,RISC-V 与虚拟指令技术的创新结合,将重新定义下一代智能计算的发展方向。”

- End -

芯榜成立于 2015 年,是半导体垂直领域产业媒体,全网粉丝量超 100 万。其聚焦芯片产业,发布专业榜单,提供多样化服务,如举办峰会活动、原创内容访谈、开展研究咨询等,致力于成为智能数字服务平台,推动半导体及硬科技产业发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑丽文还没踏上赴美的飞机,大陆突然发出警告,岛内说了句大实话

郑丽文还没踏上赴美的飞机,大陆突然发出警告,岛内说了句大实话

古史青云啊
2026-05-14 14:29:40
三过草地的女红军当农民,朱老总怒斥当地领导:你知道她是谁吗?

三过草地的女红军当农民,朱老总怒斥当地领导:你知道她是谁吗?

史之铭
2026-05-07 20:06:03
最新研究表明,维生素B12可能是健康老龄化的关键,真相来了!

最新研究表明,维生素B12可能是健康老龄化的关键,真相来了!

岐黄传人孙大夫
2026-05-12 20:10:03
很多男人已经养不起家了,无数普通顶梁柱被压垮!

很多男人已经养不起家了,无数普通顶梁柱被压垮!

黯泉
2026-05-14 10:57:59
人民日报国纪平:中美关系回不到过去,但能够有一个更好的未来

人民日报国纪平:中美关系回不到过去,但能够有一个更好的未来

每日经济新闻
2026-05-13 18:23:39
不法商贩售卖翻新硬盘致信息泄露 国家安全部:规范处置闲置硬盘

不法商贩售卖翻新硬盘致信息泄露 国家安全部:规范处置闲置硬盘

每日经济新闻
2026-05-14 07:12:11
空军一号轰鸣中纹丝不动!外媒:中国军人让特朗普看呆了

空军一号轰鸣中纹丝不动!外媒:中国军人让特朗普看呆了

隐于山海
2026-05-14 15:13:17
宋佳调侃张嘉益:为何不推荐我试镜《主角》? 张嘉益回复全场笑翻

宋佳调侃张嘉益:为何不推荐我试镜《主角》? 张嘉益回复全场笑翻

娱最资讯
2026-05-14 09:47:07
玄学不敢明说的10个秘密:看懂一个,少走十年弯路

玄学不敢明说的10个秘密:看懂一个,少走十年弯路

白浅娱乐聊
2026-05-14 00:47:03
张柏芝案终判,三胎生父曝光,好消息传来,遗嘱早立

张柏芝案终判,三胎生父曝光,好消息传来,遗嘱早立

老汆古装影视解说
2026-05-14 11:44:38
歼20A“完全体”:换新引擎新航电,开始装备精锐部队

歼20A“完全体”:换新引擎新航电,开始装备精锐部队

国平视野
2026-05-14 14:59:23
若世界杯无缘中国观众,将引发多个连锁反应,梅西就是前车之鉴

若世界杯无缘中国观众,将引发多个连锁反应,梅西就是前车之鉴

混沌录
2026-05-13 18:08:17
隔空喊话前妻?王力宏演唱会情绪激动下跪哽咽:我们重新开始吧

隔空喊话前妻?王力宏演唱会情绪激动下跪哽咽:我们重新开始吧

八卦王者
2026-05-14 11:37:21
阿里AI进入回报期,年化收入达358亿,吴泳铭:未来三年资本开支或远超3800亿

阿里AI进入回报期,年化收入达358亿,吴泳铭:未来三年资本开支或远超3800亿

时代财经
2026-05-14 07:33:38
特朗普精力充沛,养生秘诀是吃大量阿司匹林,日常三餐吃麦当劳

特朗普精力充沛,养生秘诀是吃大量阿司匹林,日常三餐吃麦当劳

南权先生
2026-04-04 05:05:03
勇士获3大喜讯!库里盼至少打20年 追梦愿为补强降薪至2000万以下

勇士获3大喜讯!库里盼至少打20年 追梦愿为补强降薪至2000万以下

锅子篮球
2026-05-14 15:24:42
霍光后来查卫子夫的旧案,发现那枚兵符其实可以调动三万禁军。

霍光后来查卫子夫的旧案,发现那枚兵符其实可以调动三万禁军。

小豫讲故事
2026-05-14 06:00:17
彭德怀打仗那么厉害,为啥带出来的名将却不多?陈毅评价一语中的

彭德怀打仗那么厉害,为啥带出来的名将却不多?陈毅评价一语中的

史之铭
2026-05-14 14:05:34
到底什么意思?卢比奥随特朗普来北京,高志凯:中美双方都很聪明

到底什么意思?卢比奥随特朗普来北京,高志凯:中美双方都很聪明

一个有灵魂的作者
2026-05-14 08:34:46
警惕基本盘正在被污名化,成为被嘲讽的对象?

警惕基本盘正在被污名化,成为被嘲讽的对象?

黯泉
2026-05-14 12:13:00
2026-05-14 15:55:01
芯榜 incentive-icons
芯榜
中国芯片排行榜
4628文章数 3248关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

男子称火车站走错口遭安检员追打 被认定互殴各拘5天

头条要闻

男子称火车站走错口遭安检员追打 被认定互殴各拘5天

体育要闻

登海报!哈登30+8+6创多项纪录 第8次赢天王山

娱乐要闻

肖战提名金海燕奖,这一步走得太稳

财经要闻

习近平同美国总统特朗普会谈

汽车要闻

云辇-P Ultra降维打击!三轮也能越野?方程豹豹8/豹5闪充版30.58万起

态度原创

本地
旅游
艺术
数码
公开课

本地新闻

用苏绣的方式,打开江西婺源

旅游要闻

别再只去寒山寺了!太湖边这座四百多年的古寺,趁没火赶紧去

艺术要闻

充满光感的花卉油画 | 亚历山大·沙巴德伊

数码要闻

Keychron J5 Ultra 8K三模机械键盘预售,390元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版