网易首页 > 网易号 > 正文 申请入驻

太猛了!英伟达让 Deepseek R1 编写 GPU 内核,结果 R1 写的比熟练工程师还好

0
分享至

DeepSeek 又上大分!

英伟达使用 DeepSeek-R1 让 AI 自动生成 GPU 内核代码,结果效果超越人类工程师,更离谱的是在 KernelBench Level 1 上实现了 100% 的数值正确性

我们一起来扒一扒事情原委:

随着 AI 模型越来越强大,要解决的问题也越来越复杂。这时候,一种叫做“推理时序 scaling” (inference-time scaling)的新技巧就火了起来,听起来高大上,其实说白了,就是给 AI更多的时间去思考

就像我们人类解难题一样,难题太复杂?那就多花点时间,多想想不同的解法,最终选出最优方案!“推理时序 scaling” 就是让 AI 在推理过程中,分配更多的计算资源,尝试更多可能性,最终找到最佳答案。这也被称为AI 的“reasoning” 或 “long-thinking” (长思考)能力

这次 Nvidia 的工程师们就用DeepSeek-R1模型,加上“推理时序 scaling”技术,搞了个实验,结果让人惊掉下巴!他们想让 AI自动生成 GPU 上的 Attention (注意力机制) 内核代码

要知道,Attention 机制可是大语言模型的基石,但是它的计算量巨大,尤其是处理长文本的时候,简直是性能杀手!所以,优化 Attention 内核代码就显得尤为重要。这活儿非常考验技术,经验丰富的工程师也要花费大量时间和精力

更麻烦的是,Attention 机制还有各种变体 (比如 causal, relative positional embeddings 等等),多模态模型 (比如 vision transformers) 还会引入更复杂的 Attention 机制 (Spatial Neighborhood Attention), 人工优化简直要命!

但是!Nvidia 这次直接让DeepSeek-R1 模型上阵,自动生成这些复杂的 GPU 内核代码!而且还用上了 “推理时序 scaling” 的大招!

⚙️ “闭环验证” + “长时间推理” = 超强 AI 代码生成器!

Nvidia 的工程师们设计了一个巧妙的“闭环验证” (closed-loop)工作流程。简单来说就是:

  1. 1. 人工给 DeepSeek-R1 模型一个初始 prompt (指令),告诉它要生成什么样的 GPU 内核代码

  2. 2. DeepSeek-R1 生成第一版代码

  3. 3. “验证器” (verifier) 在 Nvidia H100 GPU 上运行生成的代码,并进行分析

  4. 4. 验证器根据分析结果,生成新的 prompt,反馈给 DeepSeek-R1 模型

  5. 5. DeepSeek-R1 模型根据新的 prompt,继续优化代码

这个过程就像一个AI 程序员和 AI 代码评审员之间的持续对话,不断迭代优化代码。更厉害的是,Nvidia 工程师们让这个过程持续了 15 分钟!这就是 “推理时序 scaling” 的威力!给 AI 足够的时间,它就能不断改进,最终达到惊人的效果!

KernelBench 权威评测:100% Level-1 问题搞定!96% Level-2 问题拿下!

效果怎么样呢?数据说话!Nvidia 用 Stanford 的KernelBench 基准测试来评估生成的内核代码。结果显示,对于Level-1 难度的问题,DeepSeek-R1 生成的代码 100% 数值正确!对于 Level-2 难度的问题,也达到了 96% 的正确率!

在某些情况下,DeepSeek-R1 生成的内核代码,性能甚至超过了经验丰富的工程师手工优化的代码!

推理时间越长,效果越好!

英伟达还展示了“推理时间预算” (inference-time budget)对模型性能的影响。分配给 AI 更多的时间 (超过 10 分钟),就能显著提高代码的正确率!这再次证明了 “推理时序 scaling” 的有效性

Nvidia 这次实验,无疑展示了DeepSeek-R1 模型“推理时序 scaling”技术在GPU 内核自动生成领域的巨大潜力

未来 AI 可以自动优化各种底层代码,程序员可以把更多精力放在更高层次的创新上,这将极大地加速 AI 技术的发展!

当然,Nvidia 也承认,这还只是一个开始,要实现更广泛、更稳定的应用,还需要更多的研究和努力。但无论如何,这都是一个激动人心的开端

参考:

https://developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
妻子升任副县长陪我扫墓,村霸踢翻供桌,我准备动手妻子使来眼色

妻子升任副县长陪我扫墓,村霸踢翻供桌,我准备动手妻子使来眼色

小月故事
2026-03-20 15:09:15
辽宁人必看!高铁虽通了,但这些痛点太扎心, 你有过这样的经历吗

辽宁人必看!高铁虽通了,但这些痛点太扎心, 你有过这样的经历吗

吃货的分享
2026-04-23 21:31:44
谁更脆弱?中东变局下的能源韧性与通胀分化

谁更脆弱?中东变局下的能源韧性与通胀分化

华夏时报
2026-04-24 10:36:09
告别广东队,萨姆纳感慨万千!

告别广东队,萨姆纳感慨万千!

体育哲人
2026-04-24 20:38:44
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,而是这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,而是这6点

周哥一影视
2026-04-17 06:45:59
41岁C罗肌肉依旧炸裂!前私厨揭秘饮食红线:牛奶坚决不碰!

41岁C罗肌肉依旧炸裂!前私厨揭秘饮食红线:牛奶坚决不碰!

仰卧撑FTUer
2026-04-24 14:38:03
参与控制转移马杜罗的美国特种兵提前押注马杜罗将下台获利超40万美元 已被法院起诉

参与控制转移马杜罗的美国特种兵提前押注马杜罗将下台获利超40万美元 已被法院起诉

每日经济新闻
2026-04-24 17:38:59
美股收盘:美伊和谈将重启 标普、纳指再创新高 英伟达市值突破5万亿美元

美股收盘:美伊和谈将重启 标普、纳指再创新高 英伟达市值突破5万亿美元

财联社
2026-04-25 05:10:05
伊朗外交部:阿拉格齐三国行将讨论终战议题

伊朗外交部:阿拉格齐三国行将讨论终战议题

新华社
2026-04-25 00:31:03
42岁,傅首尔彻底变样了!瘦成标准美女,网友:和麦琳像亲姐妹

42岁,傅首尔彻底变样了!瘦成标准美女,网友:和麦琳像亲姐妹

娱乐皮皮酱
2026-04-24 17:33:27
差距悬殊!胡歌饭局雪茄曝光,普通人根本消费不起

差距悬殊!胡歌饭局雪茄曝光,普通人根本消费不起

南万说娱26
2026-04-24 10:33:19
江苏富豪减持宁德时代套现238亿

江苏富豪减持宁德时代套现238亿

新浪财经
2026-04-24 22:13:17
美国全面封锁伊朗进出口,对伊朗的伤害有多大?

美国全面封锁伊朗进出口,对伊朗的伤害有多大?

高博新视野
2026-04-24 07:30:14
全是遗憾!《八千里路云和月》大结局,是今年看过最悲壮的结局

全是遗憾!《八千里路云和月》大结局,是今年看过最悲壮的结局

阿讯说天下
2026-04-25 01:19:57
2次毁约拒绝赔偿,墨西哥再次找中国建高铁,中国这次不再惯着

2次毁约拒绝赔偿,墨西哥再次找中国建高铁,中国这次不再惯着

小兰聊历史
2026-04-24 15:54:29
突传噩耗,这位影响中美的大佬逝世,川普派人来华,中方送上大礼

突传噩耗,这位影响中美的大佬逝世,川普派人来华,中方送上大礼

知法而形
2026-04-24 18:28:40
世锦赛战报:世界第2六连鞭仍落后了!中国冠军轮番黑球绝杀4-4

世锦赛战报:世界第2六连鞭仍落后了!中国冠军轮番黑球绝杀4-4

求球不落谛
2026-04-25 01:51:59
成年人最顶级的自律,是学会看人

成年人最顶级的自律,是学会看人

青苹果sht
2026-04-11 05:13:13
73岁天赐父亲诉说太辛苦,大女儿来家里带妹妹,太暖心了

73岁天赐父亲诉说太辛苦,大女儿来家里带妹妹,太暖心了

童叔不飙车
2026-04-19 11:09:23
李奇微晚年曾说过,战斗力一流的国家只有三个,其他的都不值一提

李奇微晚年曾说过,战斗力一流的国家只有三个,其他的都不值一提

老范谈史
2026-04-23 17:35:54
2026-04-25 05:48:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1036文章数 396关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

航班提前起飞10分钟 大学生把海航告了

头条要闻

航班提前起飞10分钟 大学生把海航告了

体育要闻

上海男篮23连胜+主场全胜 姚明之后最强一季

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

数码
时尚
手机
家居
教育

数码要闻

苹果继续拓展赛道!换帅后将进军新品类?

今日热点:爱奇艺回应暂停页面广告争议;经纪公司否认THEBOYZ解约成功……

手机要闻

续航大战!红米、vivo、荣耀手机,电池都往一万毫安时以上堆

家居要闻

自然肌理 温润美学

教育要闻

高考地理|各种地形图知识点总结大全

无障碍浏览 进入关怀版