网易首页 > 网易号 > 正文 申请入驻

科学家研发大模型新框架,助力解决RISC-V软件生态瓶颈

0
分享至

算子(Kernel),作为连接硬件与软件的核心软件层,是软件生态中的重要一环。算子优化是旨在根据硬件架构和芯片设计,优化特定程式代码,以尽可能挖掘硬件潜力,提高程序运行速度的工作。

当前算子优化主要依靠专家通过试错法进行手动优化,这一过程不仅耗时,而且需要跨硬件、软件和指令集架构(ISA,Instruction Set Architecture)的多学科专业专家合作开发,人力和时间成本都十分高昂。对于新兴的 ISA 架构而言,其配套算子库的性能优化缺口已成为阻碍广泛部署的主要瓶颈。

随着大模型的发展,自动化算子优化领域出现了新范式。大模型驱动的方法利用其生成能力,通过最少的人工指导生成或迭代改进算子实现,已经涌现出了一批科研成果。尤其在 CUDA 算子优化领域,这一范式已展现出显著潜力——完备的技术文档和成熟的代码库使得现成的大模型能够在部分算子问题上取得超越人类专家的效果。

然而,在 RISC-V 等新兴架构或指令集上,参考材料的稀缺,限制了这种新兴范式的有效性。

为此,来自香港城市大学的研究人员开展了一项课题,并研发出了一款名为 EoK 的应用。


图 | 研究人员(来源:研究人员)

首先,EoK 通过系统化挖掘成熟开源算子库的开发历史(如 Git 提交记录),构建结构化的优化“想法”池。每个想法包含通用设计原则和一系列可操作思路,其中包括简明技术描述、示例代码和历史效果评估。这种方法为大模型提供了明确的数据驱动指导,弥补了训练数据中 RISC-V 参考材料的缺失。

其次,EoK 采用基于检索增强生成(RAG,Retrieval-Augmented Generation)的并行搜索策略,通过同时沿多个优化方向(由想法池中的不同想法定义)进行并行探索,并结合 RISC-V 特定的上下文信息(包括 ISA 手册和硬件配置文件),显著提高了搜索效率和效果。每个想法引导的搜索都根据历史效果加权采样可操作思路,确保优先验证经过实践检验的技术,同时保持探索多样性。

通过这种方法,EoK 在 80 个算子设计任务中实现了中位数 1.27 倍的加速效果,在几乎所有任务上超越人类专家性能,并将现有大模型方法的性能提升了 20%。这些结果表明,将人类经验系统化地融入新兴领域优化过程的可行性,同时也凸显了大模型驱动的自动化算子优化在 RISC-V 领域的巨大潜力。


(来源:https://arxiv.org/pdf/2509.14265)

在应用前景上:

其一,可用于多架构支持扩展:EoK 的方法论可以扩展到其他开放或专有 ISA(如神经网络异构计算架构、元计算统一系统架构等 AI 加速指令集或其它新兴 ISA),通过适配想法池和参考材料,打破 CUDA 壁垒,实现跨平台算子优化,促进硬件创新和软件创新的协同进化。

其二,可用于 DAY0/DAY1 级适配:EoK 相较于其它大模型方法,其算子优化时间开销更低,能够帮助国产新兴的 AI 加速算力在 Day0/Day1 级别对于类似于 Deepseek v3.2 等新型模型软件架构实现支持,推动新兴软硬件生态正循环。

其三,可用于定制处理器算子优化:针对特定应用场景(如边缘计算、具身智能等),EoK 可以自动生成高度优化的算子,减少开发时间并提升能效。

其四,可用于硬件-软件协同设计:在芯片设计阶段,EoK 可用于快速原型化和评估不同硬件配置下的算子性能,辅助设计决策,缩短产品上市周期。

目前,研究人员正在推进对于知识“想法”池的进一步挖掘,以期能够使大模型在学习人类算子优化经验和自动优化算子过程中,拓展可能的算子优化空间和范式。

参考资料:

https://arxiv.org/pdf/2509.14265

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京小客车指标,明天摇号!最新通告!

北京小客车指标,明天摇号!最新通告!

BRTV新闻
2025-12-25 12:11:00
悲催!东莞一万人工厂停业,大部分人欲哭无泪,签订协议打包走人

悲催!东莞一万人工厂停业,大部分人欲哭无泪,签订协议打包走人

火山詩话
2025-12-25 05:54:47
彻底摊牌了!美国再次改变芯片解禁条件,外媒:终究还是顶不住了

彻底摊牌了!美国再次改变芯片解禁条件,外媒:终究还是顶不住了

始于初见见
2025-12-25 01:30:58
年龄越大越能体会到“先敬罗衣后敬人”的含金量!

年龄越大越能体会到“先敬罗衣后敬人”的含金量!

另子维爱读史
2025-12-25 16:11:59
我帮公司拿下我姑姑2亿的合作,秘书偷偷发消息说我被开除了,

我帮公司拿下我姑姑2亿的合作,秘书偷偷发消息说我被开除了,

荷兰豆爱健康
2025-12-24 14:59:19
放大招!山东录用公务员前将核查网络言论

放大招!山东录用公务员前将核查网络言论

看看新闻Knews
2025-12-25 15:13:02
央视郎永淳谈饭圈:陈梦是所有奥运冠军中,唯一承受这么大压力的

央视郎永淳谈饭圈:陈梦是所有奥运冠军中,唯一承受这么大压力的

丁丁鲤史纪
2025-12-25 16:11:38
1976年尼克松重返北京,执意要去周总理墓前磕头,秘书一句话让他瞬间泪崩

1976年尼克松重返北京,执意要去周总理墓前磕头,秘书一句话让他瞬间泪崩

史海残云
2025-12-19 14:26:17
大陆扩大反制范围,宣布给两位台湾人定罪,重金悬赏并展开追捕

大陆扩大反制范围,宣布给两位台湾人定罪,重金悬赏并展开追捕

叹知
2025-12-24 16:54:18
杨幂化身维密天使,纽约天际线演绎黑羽魅惑,白翼造型美到封神

杨幂化身维密天使,纽约天际线演绎黑羽魅惑,白翼造型美到封神

章眽八卦
2025-12-23 12:35:04
粟裕有一个能力,山野领导人都缺,所以他能把宋时轮教成阻援专家

粟裕有一个能力,山野领导人都缺,所以他能把宋时轮教成阻援专家

浩渺青史
2025-12-25 19:05:40
杨紫为演董竹君苦练上海话,网友感叹:北京孩子说上海话说这么好

杨紫为演董竹君苦练上海话,网友感叹:北京孩子说上海话说这么好

韩小娱
2025-12-25 10:28:45
美媒称俄油气收入锐减、外汇储备耗尽,经济恐2026崩溃

美媒称俄油气收入锐减、外汇储备耗尽,经济恐2026崩溃

梁猕爱玩车
2025-12-25 11:41:42
沧州杀妻案凶手得知被判死刑:大小便失禁,晚上睡觉不敢睁开眼睛

沧州杀妻案凶手得知被判死刑:大小便失禁,晚上睡觉不敢睁开眼睛

诗意世界
2025-12-12 21:47:03
波兰军方称拦截一架俄罗斯侦察机 俄方暂无回应

波兰军方称拦截一架俄罗斯侦察机 俄方暂无回应

财联社
2025-12-25 20:40:05
为什么中国和俄国的历史学界,都认为《尼布楚条约》是自家吃亏?

为什么中国和俄国的历史学界,都认为《尼布楚条约》是自家吃亏?

文史道
2025-12-22 13:29:06
没想到,46条中日航线取消后,各方势力纷纷现身

没想到,46条中日航线取消后,各方势力纷纷现身

有牙的兔纸
2025-12-25 01:46:25
俄罗斯国内建议迁都,搬到中国旁边,普京亲信回应:担心俄国分裂

俄罗斯国内建议迁都,搬到中国旁边,普京亲信回应:担心俄国分裂

博览历史
2025-12-24 19:45:40
下一只十倍股或从这里诞生!

下一只十倍股或从这里诞生!

证券市场周刊市场号
2025-12-25 20:46:21
中国重磅回应:无中国同意,美国别想东山再起!

中国重磅回应:无中国同意,美国别想东山再起!

单手搓核弹
2025-12-25 18:16:34
2025-12-25 21:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16035文章数 514436关注度
往期回顾 全部

科技要闻

屠龙少年被"招安"!英伟达平安夜豪掷200亿

头条要闻

美司法部发现上百万份爱泼斯坦新文件 涂黑操作翻车

头条要闻

美司法部发现上百万份爱泼斯坦新文件 涂黑操作翻车

体育要闻

单赛季11冠,羽坛“安洗莹时代”真的来了

娱乐要闻

朱孝天把阿信好意当球踢!

财经要闻

时隔15月,人民币升破7,三大推手曝光

汽车要闻

速来!智界在上海西岸准备了年末潮流盛典

态度原创

教育
房产
艺术
亲子
公开课

教育要闻

作文阅读公益课68课|如何把文章写得又长又好?

房产要闻

太猛了!单月新增企业4.1万家,又一波巨头涌向海南!

艺术要闻

缅怀 | 著名油画家宫立龙逝世,享年73岁

亲子要闻

国家明确幼儿园收费标准。(杨曦 罗中琳)

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版