网易首页 > 网易号 > 正文 申请入驻

太猛了!英伟达让 Deepseek R1 编写 GPU 内核,结果 R1 写的比熟练工程师还好

0
分享至

DeepSeek 又上大分!

英伟达使用 DeepSeek-R1 让 AI 自动生成 GPU 内核代码,结果效果超越人类工程师,更离谱的是在 KernelBench Level 1 上实现了 100% 的数值正确性

我们一起来扒一扒事情原委:

随着 AI 模型越来越强大,要解决的问题也越来越复杂。这时候,一种叫做“推理时序 scaling” (inference-time scaling)的新技巧就火了起来,听起来高大上,其实说白了,就是给 AI更多的时间去思考

就像我们人类解难题一样,难题太复杂?那就多花点时间,多想想不同的解法,最终选出最优方案!“推理时序 scaling” 就是让 AI 在推理过程中,分配更多的计算资源,尝试更多可能性,最终找到最佳答案。这也被称为AI 的“reasoning” 或 “long-thinking” (长思考)能力

这次 Nvidia 的工程师们就用DeepSeek-R1模型,加上“推理时序 scaling”技术,搞了个实验,结果让人惊掉下巴!他们想让 AI自动生成 GPU 上的 Attention (注意力机制) 内核代码

要知道,Attention 机制可是大语言模型的基石,但是它的计算量巨大,尤其是处理长文本的时候,简直是性能杀手!所以,优化 Attention 内核代码就显得尤为重要。这活儿非常考验技术,经验丰富的工程师也要花费大量时间和精力

更麻烦的是,Attention 机制还有各种变体 (比如 causal, relative positional embeddings 等等),多模态模型 (比如 vision transformers) 还会引入更复杂的 Attention 机制 (Spatial Neighborhood Attention), 人工优化简直要命!

但是!Nvidia 这次直接让DeepSeek-R1 模型上阵,自动生成这些复杂的 GPU 内核代码!而且还用上了 “推理时序 scaling” 的大招!

⚙️ “闭环验证” + “长时间推理” = 超强 AI 代码生成器!

Nvidia 的工程师们设计了一个巧妙的“闭环验证” (closed-loop)工作流程。简单来说就是:

  1. 1. 人工给 DeepSeek-R1 模型一个初始 prompt (指令),告诉它要生成什么样的 GPU 内核代码

  2. 2. DeepSeek-R1 生成第一版代码

  3. 3. “验证器” (verifier) 在 Nvidia H100 GPU 上运行生成的代码,并进行分析

  4. 4. 验证器根据分析结果,生成新的 prompt,反馈给 DeepSeek-R1 模型

  5. 5. DeepSeek-R1 模型根据新的 prompt,继续优化代码

这个过程就像一个AI 程序员和 AI 代码评审员之间的持续对话,不断迭代优化代码。更厉害的是,Nvidia 工程师们让这个过程持续了 15 分钟!这就是 “推理时序 scaling” 的威力!给 AI 足够的时间,它就能不断改进,最终达到惊人的效果!

KernelBench 权威评测:100% Level-1 问题搞定!96% Level-2 问题拿下!

效果怎么样呢?数据说话!Nvidia 用 Stanford 的KernelBench 基准测试来评估生成的内核代码。结果显示,对于Level-1 难度的问题,DeepSeek-R1 生成的代码 100% 数值正确!对于 Level-2 难度的问题,也达到了 96% 的正确率!

在某些情况下,DeepSeek-R1 生成的内核代码,性能甚至超过了经验丰富的工程师手工优化的代码!

推理时间越长,效果越好!

英伟达还展示了“推理时间预算” (inference-time budget)对模型性能的影响。分配给 AI 更多的时间 (超过 10 分钟),就能显著提高代码的正确率!这再次证明了 “推理时序 scaling” 的有效性

Nvidia 这次实验,无疑展示了DeepSeek-R1 模型“推理时序 scaling”技术在GPU 内核自动生成领域的巨大潜力

未来 AI 可以自动优化各种底层代码,程序员可以把更多精力放在更高层次的创新上,这将极大地加速 AI 技术的发展!

当然,Nvidia 也承认,这还只是一个开始,要实现更广泛、更稳定的应用,还需要更多的研究和努力。但无论如何,这都是一个激动人心的开端

参考:

https://developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

医学科普汇
2026-01-29 06:25:03
中东还没结束,亚太又出问题?朝鲜突发导弹,特朗普收到一封挑战书

中东还没结束,亚太又出问题?朝鲜突发导弹,特朗普收到一封挑战书

健身狂人
2026-03-06 01:12:39
陈昌浩回国后默默无闻,前妻任副部长,儿子却是万人敬仰的大人物

陈昌浩回国后默默无闻,前妻任副部长,儿子却是万人敬仰的大人物

比利
2026-03-04 10:59:11
猪油再次被关注!医生发现:高血压患者常吃猪油,或出现几种变化

猪油再次被关注!医生发现:高血压患者常吃猪油,或出现几种变化

蜉蝣说
2026-02-23 21:23:05
全勤战神!场均25.9分+三分53.7%,4个首轮啊,值了

全勤战神!场均25.9分+三分53.7%,4个首轮啊,值了

球童无忌
2026-03-05 21:23:31
看到段曦和张杰旧照才懂 谢娜18年不澄清被扇耳光 从来不是大度

看到段曦和张杰旧照才懂 谢娜18年不澄清被扇耳光 从来不是大度

草莓解说体育
2026-03-05 16:45:31
不得不说!宫鲁鸣做出了1个重要的决定,挽救了中国女篮

不得不说!宫鲁鸣做出了1个重要的决定,挽救了中国女篮

体育哲人
2026-03-05 12:38:35
伊朗反击美国,国际局势大乱,中国收复台湾的时机到了吗?

伊朗反击美国,国际局势大乱,中国收复台湾的时机到了吗?

心灵短笛
2026-03-05 14:16:51
首批滞留迪拜的中国游客回国后发声:机票8500元一张 航班全部满员 朋友凌晨把自己叫醒抢票

首批滞留迪拜的中国游客回国后发声:机票8500元一张 航班全部满员 朋友凌晨把自己叫醒抢票

快科技
2026-03-05 11:54:08
美伊大战中国吃亏!油轮被击沉,海峡也被锁死,中国油价会暴涨吗

美伊大战中国吃亏!油轮被击沉,海峡也被锁死,中国油价会暴涨吗

晓焎科普
2026-03-04 15:01:33
五角大楼:美国力求避免与中国发生冲突

五角大楼:美国力求避免与中国发生冲突

俄罗斯卫星通讯社
2026-03-04 15:06:03
曼联3000万卖芒特有下家!拉爵或捧青训新太子,表现已征服卡里克

曼联3000万卖芒特有下家!拉爵或捧青训新太子,表现已征服卡里克

罗米的曼联博客
2026-03-06 07:02:10
中美俄导弹射程差距对比:俄18000公里、美12500公里,中国呢?

中美俄导弹射程差距对比:俄18000公里、美12500公里,中国呢?

科学知识点秀
2026-02-14 08:00:17
偷鸡不成蚀把米!以为能“扳倒”薛之谦,自己却先被扒了个底朝天

偷鸡不成蚀把米!以为能“扳倒”薛之谦,自己却先被扒了个底朝天

八卦南风
2026-03-04 12:18:44
某音就是个很擦边的平台!呆妹儿被吐槽拉完了,直言没人能一直火

某音就是个很擦边的平台!呆妹儿被吐槽拉完了,直言没人能一直火

清衣渡a
2026-03-04 14:21:18
郑强教授直言:全世界没有一个国家,像中国现在孩子这么疯的

郑强教授直言:全世界没有一个国家,像中国现在孩子这么疯的

混沌录
2026-03-05 22:07:09
日媒:伊拉克队可能无法参加洲际附加赛 中国男足会被馅饼砸中吗?

日媒:伊拉克队可能无法参加洲际附加赛 中国男足会被馅饼砸中吗?

林子说事
2026-03-05 17:46:44
中纪委明确:公职人员犯罪符合这些情形可以不开除(含公务员、参公、事业和国企)

中纪委明确:公职人员犯罪符合这些情形可以不开除(含公务员、参公、事业和国企)

微法官
2026-02-28 00:04:56
马特拉齐:我跟齐达内道了两次歉,之后他主动要和我换球衣

马特拉齐:我跟齐达内道了两次歉,之后他主动要和我换球衣

懂球帝
2026-03-05 22:53:26
物理学停滞100年,三座大山难以逾越!或许永远都无法进步?

物理学停滞100年,三座大山难以逾越!或许永远都无法进步?

心中的麦田
2026-03-03 20:19:10
2026-03-06 08:56:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

牛弹琴:没武器的伊朗军舰回家 全员绝望中"安静死亡"

头条要闻

牛弹琴:没武器的伊朗军舰回家 全员绝望中"安静死亡"

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

黄金,牛市没了?!

汽车要闻

15.98万元起 第三代领克03大尾翼版上市

态度原创

房产
游戏
家居
艺术
教育

房产要闻

超猛!又有2800套房源砸出,2026海口安居房,彻底爆发!

《三角洲行动》假如GTI要选一把手,哪个干员才能胜任这个岗位?

家居要闻

奶白柔境 闲卧享时光

艺术要闻

世界上最幸福的照片

教育要闻

被嘲笑的“高学历宝妈”事件,揭开家长自私一面,高认知不怕拒绝

无障碍浏览 进入关怀版