网易首页 > 网易号 > 正文 申请入驻

科学家研发大模型新框架,助力解决RISC-V软件生态瓶颈

0
分享至

算子(Kernel),作为连接硬件与软件的核心软件层,是软件生态中的重要一环。算子优化是旨在根据硬件架构和芯片设计,优化特定程式代码,以尽可能挖掘硬件潜力,提高程序运行速度的工作。

当前算子优化主要依靠专家通过试错法进行手动优化,这一过程不仅耗时,而且需要跨硬件、软件和指令集架构(ISA,Instruction Set Architecture)的多学科专业专家合作开发,人力和时间成本都十分高昂。对于新兴的 ISA 架构而言,其配套算子库的性能优化缺口已成为阻碍广泛部署的主要瓶颈。

随着大模型的发展,自动化算子优化领域出现了新范式。大模型驱动的方法利用其生成能力,通过最少的人工指导生成或迭代改进算子实现,已经涌现出了一批科研成果。尤其在 CUDA 算子优化领域,这一范式已展现出显著潜力——完备的技术文档和成熟的代码库使得现成的大模型能够在部分算子问题上取得超越人类专家的效果。

然而,在 RISC-V 等新兴架构或指令集上,参考材料的稀缺,限制了这种新兴范式的有效性。

为此,来自香港城市大学的研究人员开展了一项课题,并研发出了一款名为 EoK 的应用。


图 | 研究人员(来源:研究人员)

首先,EoK 通过系统化挖掘成熟开源算子库的开发历史(如 Git 提交记录),构建结构化的优化“想法”池。每个想法包含通用设计原则和一系列可操作思路,其中包括简明技术描述、示例代码和历史效果评估。这种方法为大模型提供了明确的数据驱动指导,弥补了训练数据中 RISC-V 参考材料的缺失。

其次,EoK 采用基于检索增强生成(RAG,Retrieval-Augmented Generation)的并行搜索策略,通过同时沿多个优化方向(由想法池中的不同想法定义)进行并行探索,并结合 RISC-V 特定的上下文信息(包括 ISA 手册和硬件配置文件),显著提高了搜索效率和效果。每个想法引导的搜索都根据历史效果加权采样可操作思路,确保优先验证经过实践检验的技术,同时保持探索多样性。

通过这种方法,EoK 在 80 个算子设计任务中实现了中位数 1.27 倍的加速效果,在几乎所有任务上超越人类专家性能,并将现有大模型方法的性能提升了 20%。这些结果表明,将人类经验系统化地融入新兴领域优化过程的可行性,同时也凸显了大模型驱动的自动化算子优化在 RISC-V 领域的巨大潜力。


(来源:https://arxiv.org/pdf/2509.14265)

在应用前景上:

其一,可用于多架构支持扩展:EoK 的方法论可以扩展到其他开放或专有 ISA(如神经网络异构计算架构、元计算统一系统架构等 AI 加速指令集或其它新兴 ISA),通过适配想法池和参考材料,打破 CUDA 壁垒,实现跨平台算子优化,促进硬件创新和软件创新的协同进化。

其二,可用于 DAY0/DAY1 级适配:EoK 相较于其它大模型方法,其算子优化时间开销更低,能够帮助国产新兴的 AI 加速算力在 Day0/Day1 级别对于类似于 Deepseek v3.2 等新型模型软件架构实现支持,推动新兴软硬件生态正循环。

其三,可用于定制处理器算子优化:针对特定应用场景(如边缘计算、具身智能等),EoK 可以自动生成高度优化的算子,减少开发时间并提升能效。

其四,可用于硬件-软件协同设计:在芯片设计阶段,EoK 可用于快速原型化和评估不同硬件配置下的算子性能,辅助设计决策,缩短产品上市周期。

目前,研究人员正在推进对于知识“想法”池的进一步挖掘,以期能够使大模型在学习人类算子优化经验和自动优化算子过程中,拓展可能的算子优化空间和范式。

参考资料:

https://arxiv.org/pdf/2509.14265

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个拉链,短短7秒的画面,竟然值100万美元?

一个拉链,短短7秒的画面,竟然值100万美元?

眼界看视野
2026-02-20 15:26:33
超越国界!苏翊鸣激动拥抱日本女选手,感恩日本教练培养

超越国界!苏翊鸣激动拥抱日本女选手,感恩日本教练培养

米修体育
2026-02-20 16:12:13
整容成瘾、抛妻娶粉?“消失”的宋小宝,终究为曾经的荒唐买了单

整容成瘾、抛妻娶粉?“消失”的宋小宝,终究为曾经的荒唐买了单

启迪你的思维
2026-02-02 20:56:29
父亲葬礼收了近4万份子钱!山东网友哭诉,没有一个是因自己来的

父亲葬礼收了近4万份子钱!山东网友哭诉,没有一个是因自己来的

火山詩话
2026-02-21 11:45:52
莱奥:伊布曾因输掉训练赛,拒绝同队的青年球员再次参加合练

莱奥:伊布曾因输掉训练赛,拒绝同队的青年球员再次参加合练

懂球帝
2026-02-21 16:31:05
今晚吉林省有大范围降雪!局部有大到暴雪!

今晚吉林省有大范围降雪!局部有大到暴雪!

吉刻新闻
2026-02-21 16:09:21
五五分流为什么分不下去了?背后的真相

五五分流为什么分不下去了?背后的真相

枫冷慕诗
2026-01-24 13:09:19
“这种儿子,直接用钢筋揍!”家长晒农村儿子现状,网友忍无可忍

“这种儿子,直接用钢筋揍!”家长晒农村儿子现状,网友忍无可忍

妍妍教育日记
2026-01-08 20:37:01
金价一夜大反转!2月20日全国金店最新价出炉,入手的最佳时机?

金价一夜大反转!2月20日全国金店最新价出炉,入手的最佳时机?

奇思妙想生活家
2026-02-20 21:34:24
揭秘《飞驰人生3》断层领先原因:这就是韩寒价值观的胜利

揭秘《飞驰人生3》断层领先原因:这就是韩寒价值观的胜利

人格志
2026-02-18 20:52:58
烟酒不离身却拿下59块金牌,23岁选择退役,今63岁仍为国家做贡献

烟酒不离身却拿下59块金牌,23岁选择退役,今63岁仍为国家做贡献

寒士之言本尊
2025-12-24 12:26:45
很多人低估了一万块的威力

很多人低估了一万块的威力

洞见
2026-01-12 20:34:37
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
黄晓明公开回应“在澳门输掉十几亿”:是AI生成的虚假内容

黄晓明公开回应“在澳门输掉十几亿”:是AI生成的虚假内容

大象新闻
2026-02-21 15:28:04
你是否也经常往马桶里倒水?这样做看似环保,实则危险重重

你是否也经常往马桶里倒水?这样做看似环保,实则危险重重

爆炸营养彭鑫蕊
2026-02-20 16:07:19
刘卫东“受贿数额特别巨大”是怎么回事?

刘卫东“受贿数额特别巨大”是怎么回事?

雪中风车
2026-02-20 22:18:22
研究显示:“猎鹰9”火箭解体致高空大气锂原子浓度飙升10倍

研究显示:“猎鹰9”火箭解体致高空大气锂原子浓度飙升10倍

界面新闻
2026-02-20 16:34:02
14亿人“生死”交给外资?若自来水和食盐被控制,后果有多严重?

14亿人“生死”交给外资?若自来水和食盐被控制,后果有多严重?

云景侃记
2026-02-04 22:34:38
2023年,985女硕士王懿在东京活活饿死,父母拒绝为其收尸

2023年,985女硕士王懿在东京活活饿死,父母拒绝为其收尸

谈史论天地
2026-02-18 17:45:40
李亚鹏前妻带娃回村过年,山里盖三层小楼,院子大到能遛弯

李亚鹏前妻带娃回村过年,山里盖三层小楼,院子大到能遛弯

松林侃世界
2026-02-20 20:37:08
2026-02-21 17:16:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16294文章数 514627关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

在贝加尔湖遇难的3名中国游客身份已确认:系一家人

头条要闻

在贝加尔湖遇难的3名中国游客身份已确认:系一家人

体育要闻

冬奥第一"海王"?一人和13国选手都有关系

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

旅游
亲子
教育
健康
公开课

旅游要闻

海鸥翩跹贺新岁 来青岛开启海上欢乐新春之旅

亲子要闻

放寒假别老催着孩子写作业了,跳绳机会来了!

教育要闻

新春走基层 | 慢飞天使捏出 “年的形状”

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版