网易首页 > 网易号 > 正文 申请入驻

科学家研发大模型新框架,助力解决RISC-V软件生态瓶颈

0
分享至

算子(Kernel),作为连接硬件与软件的核心软件层,是软件生态中的重要一环。算子优化是旨在根据硬件架构和芯片设计,优化特定程式代码,以尽可能挖掘硬件潜力,提高程序运行速度的工作。

当前算子优化主要依靠专家通过试错法进行手动优化,这一过程不仅耗时,而且需要跨硬件、软件和指令集架构(ISA,Instruction Set Architecture)的多学科专业专家合作开发,人力和时间成本都十分高昂。对于新兴的 ISA 架构而言,其配套算子库的性能优化缺口已成为阻碍广泛部署的主要瓶颈。

随着大模型的发展,自动化算子优化领域出现了新范式。大模型驱动的方法利用其生成能力,通过最少的人工指导生成或迭代改进算子实现,已经涌现出了一批科研成果。尤其在 CUDA 算子优化领域,这一范式已展现出显著潜力——完备的技术文档和成熟的代码库使得现成的大模型能够在部分算子问题上取得超越人类专家的效果。

然而,在 RISC-V 等新兴架构或指令集上,参考材料的稀缺,限制了这种新兴范式的有效性。

为此,来自香港城市大学的研究人员开展了一项课题,并研发出了一款名为 EoK 的应用。


图 | 研究人员(来源:研究人员)

首先,EoK 通过系统化挖掘成熟开源算子库的开发历史(如 Git 提交记录),构建结构化的优化“想法”池。每个想法包含通用设计原则和一系列可操作思路,其中包括简明技术描述、示例代码和历史效果评估。这种方法为大模型提供了明确的数据驱动指导,弥补了训练数据中 RISC-V 参考材料的缺失。

其次,EoK 采用基于检索增强生成(RAG,Retrieval-Augmented Generation)的并行搜索策略,通过同时沿多个优化方向(由想法池中的不同想法定义)进行并行探索,并结合 RISC-V 特定的上下文信息(包括 ISA 手册和硬件配置文件),显著提高了搜索效率和效果。每个想法引导的搜索都根据历史效果加权采样可操作思路,确保优先验证经过实践检验的技术,同时保持探索多样性。

通过这种方法,EoK 在 80 个算子设计任务中实现了中位数 1.27 倍的加速效果,在几乎所有任务上超越人类专家性能,并将现有大模型方法的性能提升了 20%。这些结果表明,将人类经验系统化地融入新兴领域优化过程的可行性,同时也凸显了大模型驱动的自动化算子优化在 RISC-V 领域的巨大潜力。


(来源:https://arxiv.org/pdf/2509.14265)

在应用前景上:

其一,可用于多架构支持扩展:EoK 的方法论可以扩展到其他开放或专有 ISA(如神经网络异构计算架构、元计算统一系统架构等 AI 加速指令集或其它新兴 ISA),通过适配想法池和参考材料,打破 CUDA 壁垒,实现跨平台算子优化,促进硬件创新和软件创新的协同进化。

其二,可用于 DAY0/DAY1 级适配:EoK 相较于其它大模型方法,其算子优化时间开销更低,能够帮助国产新兴的 AI 加速算力在 Day0/Day1 级别对于类似于 Deepseek v3.2 等新型模型软件架构实现支持,推动新兴软硬件生态正循环。

其三,可用于定制处理器算子优化:针对特定应用场景(如边缘计算、具身智能等),EoK 可以自动生成高度优化的算子,减少开发时间并提升能效。

其四,可用于硬件-软件协同设计:在芯片设计阶段,EoK 可用于快速原型化和评估不同硬件配置下的算子性能,辅助设计决策,缩短产品上市周期。

目前,研究人员正在推进对于知识“想法”池的进一步挖掘,以期能够使大模型在学习人类算子优化经验和自动优化算子过程中,拓展可能的算子优化空间和范式。

参考资料:

https://arxiv.org/pdf/2509.14265

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女儿家族群发公告:姥姥退休管做饭,姥爷三千退休金专供孙儿托费

女儿家族群发公告:姥姥退休管做饭,姥爷三千退休金专供孙儿托费

晓艾故事汇
2025-11-01 17:05:25
上海地铁回应“一老年乘客强坐女乘客腿上”

上海地铁回应“一老年乘客强坐女乘客腿上”

大象新闻
2025-11-01 19:22:05
河南中牟灭门惨案‖发小杀害妻儿3人,平时经常喊他吃饭…

河南中牟灭门惨案‖发小杀害妻儿3人,平时经常喊他吃饭…

恪守原则和底线
2025-10-31 18:41:22
美航母在南海坠机果然不寻常,特朗普无意间的一句话,说出了真相

美航母在南海坠机果然不寻常,特朗普无意间的一句话,说出了真相

空天力量
2025-10-31 17:07:24
你的生日尾数是多少,就是什么命!

你的生日尾数是多少,就是什么命!

大禹小城
2025-11-01 20:36:49
汪东兴的子女现状如何?两个儿子都是军人,女婿的身份不一般

汪东兴的子女现状如何?两个儿子都是军人,女婿的身份不一般

秀心文雅
2025-10-28 07:05:03
英国球迷协会炮轰纽卡客战曼联安排在节礼日晚进行:荒谬!

英国球迷协会炮轰纽卡客战曼联安排在节礼日晚进行:荒谬!

雷速体育
2025-11-01 18:32:41
随着阿森纳2-0!曼联2-2 英超积分榜:阿森纳领先7分!曼联进欧战

随着阿森纳2-0!曼联2-2 英超积分榜:阿森纳领先7分!曼联进欧战

郝小小看体育
2025-11-02 01:23:50
市政协副主席王红侠,跨省任副市长

市政协副主席王红侠,跨省任副市长

新京报政事儿
2025-11-01 09:59:40
东莞往事:我在东莞打工时,与一对母女合租的那些年

东莞往事:我在东莞打工时,与一对母女合租的那些年

纸鸢奇谭
2025-08-27 16:30:34
突发特讯!外交部通告全球:就日本领导人涉台错误言行,强烈敦促日方反思纠错,罕见言辞引爆国际舆论

突发特讯!外交部通告全球:就日本领导人涉台错误言行,强烈敦促日方反思纠错,罕见言辞引爆国际舆论

在新加坡生活
2025-11-02 00:26:12
24GB+1TB!华为新机公布:11月18日,即将上市!

24GB+1TB!华为新机公布:11月18日,即将上市!

科技堡垒
2025-11-01 10:34:52
一个省级官员没有让座的代价有多大

一个省级官员没有让座的代价有多大

霹雳炮
2025-10-31 19:34:39
官媒发文,高调官宣49岁马伊琍喜讯,全网恭喜,终于等到这一天

官媒发文,高调官宣49岁马伊琍喜讯,全网恭喜,终于等到这一天

动物奇奇怪怪
2025-11-02 03:16:30
又一汽车安徽总部项目,落地合肥

又一汽车安徽总部项目,落地合肥

新站楼市
2025-11-01 17:16:28
女生穿成这样去健身房,真的合适吗??

女生穿成这样去健身房,真的合适吗??

健身厨屋
2025-10-20 12:22:34
1-0,英超第9掀翻英超第3,佩德罗一剑封喉,切尔西逼近前二

1-0,英超第9掀翻英超第3,佩德罗一剑封喉,切尔西逼近前二

侧身凌空斩
2025-11-02 03:32:28
就在今天!NBA开拓者官宣:下放杨瀚森!6场比赛只拿9分4篮板!

就在今天!NBA开拓者官宣:下放杨瀚森!6场比赛只拿9分4篮板!

郝小小看体育
2025-11-02 02:06:10
好消息爆棚!东莞这个镇要起飞了!

好消息爆棚!东莞这个镇要起飞了!

我们的东莞
2025-10-31 17:39:40
我招待老乡一周花11万,走时他们只字不提,一周后律师敲响我家门

我招待老乡一周花11万,走时他们只字不提,一周后律师敲响我家门

牛魔王与芭蕉扇
2025-10-15 17:15:08
2025-11-02 04:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15806文章数 514254关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

美国防长国务卿受威胁 躲进军事基地

头条要闻

美国防长国务卿受威胁 躲进军事基地

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

换新一口价11.98万 第三代蓝电E5 PLUS开启预售

态度原创

家居
房产
艺术
手机
军事航空

家居要闻

吸睛艺术 富有传奇色彩

房产要闻

实力破圈!这个豪宅交付,正在定义海口品质样本!

艺术要闻

美貌与艺术的碰撞!9位摄影师,哪一位是你的菜?

手机要闻

疑似OPPO Find X10被曝光:2亿潜望镜确认加持,其他厂商怎么玩?

军事要闻

卡塔尔:加沙可能陷入“无战无和”局面

无障碍浏览 进入关怀版