网易首页 > 网易号 > 正文 申请入驻

太猛了!英伟达让 Deepseek R1 编写 GPU 内核,结果 R1 写的比熟练工程师还好

0
分享至


DeepSeek 又上大分!

英伟达使用 DeepSeek-R1 让 AI 自动生成 GPU 内核代码,结果效果超越人类工程师,更离谱的是在 KernelBench Level 1 上实现了 100% 的数值正确性


我们一起来扒一扒事情原委:

随着 AI 模型越来越强大,要解决的问题也越来越复杂。这时候,一种叫做“推理时序 scaling” (inference-time scaling)的新技巧就火了起来,听起来高大上,其实说白了,就是给 AI更多的时间去思考

就像我们人类解难题一样,难题太复杂?那就多花点时间,多想想不同的解法,最终选出最优方案!“推理时序 scaling” 就是让 AI 在推理过程中,分配更多的计算资源,尝试更多可能性,最终找到最佳答案。这也被称为AI 的“reasoning” 或 “long-thinking” (长思考)能力

这次 Nvidia 的工程师们就用DeepSeek-R1模型,加上“推理时序 scaling”技术,搞了个实验,结果让人惊掉下巴!他们想让 AI自动生成 GPU 上的 Attention (注意力机制) 内核代码

要知道,Attention 机制可是大语言模型的基石,但是它的计算量巨大,尤其是处理长文本的时候,简直是性能杀手!所以,优化 Attention 内核代码就显得尤为重要。这活儿非常考验技术,经验丰富的工程师也要花费大量时间和精力

更麻烦的是,Attention 机制还有各种变体 (比如 causal, relative positional embeddings 等等),多模态模型 (比如 vision transformers) 还会引入更复杂的 Attention 机制 (Spatial Neighborhood Attention), 人工优化简直要命!

但是!Nvidia 这次直接让DeepSeek-R1 模型上阵,自动生成这些复杂的 GPU 内核代码!而且还用上了 “推理时序 scaling” 的大招!

⚙️ “闭环验证” + “长时间推理” = 超强 AI 代码生成器!

Nvidia 的工程师们设计了一个巧妙的“闭环验证” (closed-loop)工作流程。简单来说就是:


  1. 1. 人工给 DeepSeek-R1 模型一个初始 prompt (指令),告诉它要生成什么样的 GPU 内核代码


  2. 2. DeepSeek-R1 生成第一版代码

  3. 3. “验证器” (verifier) 在 Nvidia H100 GPU 上运行生成的代码,并进行分析

  4. 4. 验证器根据分析结果,生成新的 prompt,反馈给 DeepSeek-R1 模型

  5. 5. DeepSeek-R1 模型根据新的 prompt,继续优化代码

这个过程就像一个AI 程序员和 AI 代码评审员之间的持续对话,不断迭代优化代码。更厉害的是,Nvidia 工程师们让这个过程持续了 15 分钟!这就是 “推理时序 scaling” 的威力!给 AI 足够的时间,它就能不断改进,最终达到惊人的效果!

KernelBench 权威评测:100% Level-1 问题搞定!96% Level-2 问题拿下!

效果怎么样呢?数据说话!Nvidia 用 Stanford 的KernelBench 基准测试来评估生成的内核代码。结果显示,对于Level-1 难度的问题,DeepSeek-R1 生成的代码 100% 数值正确!对于 Level-2 难度的问题,也达到了 96% 的正确率!


在某些情况下,DeepSeek-R1 生成的内核代码,性能甚至超过了经验丰富的工程师手工优化的代码!

推理时间越长,效果越好!

英伟达还展示了“推理时间预算” (inference-time budget)对模型性能的影响。分配给 AI 更多的时间 (超过 10 分钟),就能显著提高代码的正确率!这再次证明了 “推理时序 scaling” 的有效性

Nvidia 这次实验,无疑展示了DeepSeek-R1 模型“推理时序 scaling”技术在GPU 内核自动生成领域的巨大潜力

未来 AI 可以自动优化各种底层代码,程序员可以把更多精力放在更高层次的创新上,这将极大地加速 AI 技术的发展!

当然,Nvidia 也承认,这还只是一个开始,要实现更广泛、更稳定的应用,还需要更多的研究和努力。但无论如何,这都是一个激动人心的开端

参考:

https://developer.nvidia.com/blog/automating-gpu-kernel-generation-with-deepseek-r1-and-inference-time-scaling/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网传判决书曝光12场假球比赛!泰山4场焦点战最多 申花+江苏各2场

网传判决书曝光12场假球比赛!泰山4场焦点战最多 申花+江苏各2场

我爱英超
2025-03-22 22:02:32
重磅信号!中美,传来大消息!

重磅信号!中美,传来大消息!

证券时报
2025-03-22 08:06:03
全运会惊现11-0!国家队超级天才被省队打爆,队友呆了,教练无语

全运会惊现11-0!国家队超级天才被省队打爆,队友呆了,教练无语

嘴炮体坛
2025-03-22 18:47:05
港星打破沉默为李嘉诚事件发声,一针见血戳中痛点,诸多人鸣不平

港星打破沉默为李嘉诚事件发声,一针见血戳中痛点,诸多人鸣不平

蓝色海边
2025-03-22 12:27:27
继 315 后洗发水黑榜曝光!这几款 "烂发" 洗发水赶紧扔了

继 315 后洗发水黑榜曝光!这几款 "烂发" 洗发水赶紧扔了

晴晴给你讲故事
2025-03-22 11:33:05
中巴双方达成共识,大局基本已定,港媒趁热打铁,李嘉诚企业发声

中巴双方达成共识,大局基本已定,港媒趁热打铁,李嘉诚企业发声

游古史
2025-03-22 12:37:52
完成职业生涯突破!皮亚斯特里拿下F1中国大奖赛杆位

完成职业生涯突破!皮亚斯特里拿下F1中国大奖赛杆位

澎湃新闻
2025-03-22 16:28:28
加拿大选情突变,民调逆转

加拿大选情突变,民调逆转

寰宇大观察
2025-03-22 23:08:05
特朗普政府将终止50多万移民合法身份

特朗普政府将终止50多万移民合法身份

参考消息
2025-03-22 21:52:11
茶是老年痴呆的“催化剂”?医生反复强调:上了年纪,3种茶少喝

茶是老年痴呆的“催化剂”?医生反复强调:上了年纪,3种茶少喝

马蹄烫嘴说美食
2025-03-22 12:04:57
已确认离世,年仅32岁:老婆已崩溃,还有4个孩子

已确认离世,年仅32岁:老婆已崩溃,还有4个孩子

美芽
2025-03-21 19:34:49
汪小菲直播晒儿女,小玥儿穿新裙子气质大变,张兰或去台北陪孩子

汪小菲直播晒儿女,小玥儿穿新裙子气质大变,张兰或去台北陪孩子

心静物娱
2025-03-22 14:20:42
意媒:佛罗伦萨准备双倍年薪续约德赫亚1年,德赫亚满意当前环境

意媒:佛罗伦萨准备双倍年薪续约德赫亚1年,德赫亚满意当前环境

直播吧
2025-03-22 23:29:06
78岁易中天现状:被厦大返聘当院长,身体暴瘦,女儿是他的骄傲

78岁易中天现状:被厦大返聘当院长,身体暴瘦,女儿是他的骄傲

比利
2025-03-22 11:45:45
36岁景甜增肥后气质大变,脸肉肉地,更像清纯女大学生了!

36岁景甜增肥后气质大变,脸肉肉地,更像清纯女大学生了!

木子爱娱乐大号
2025-03-21 14:28:22
韩投票结果出来了,179票赞成!朴槿惠布好局了?尹锡悦痛心

韩投票结果出来了,179票赞成!朴槿惠布好局了?尹锡悦痛心

虹声天下
2025-03-22 17:38:26
中医药大学教授杨炳友去世,年仅54岁,2个月前还露面,死因惋惜

中医药大学教授杨炳友去世,年仅54岁,2个月前还露面,死因惋惜

归史
2025-03-22 15:03:59
23岁女生直播间疯狂打赏200万元!母亲被气进医院,退款遭平台拒绝

23岁女生直播间疯狂打赏200万元!母亲被气进医院,退款遭平台拒绝

新民周刊
2025-03-22 16:45:40
哈兰德:以色列是否应该入选,这种事情你别问我一个球员

哈兰德:以色列是否应该入选,这种事情你别问我一个球员

直播吧
2025-03-22 15:50:14
高潮来了!小米高管王腾连发两条微博,疑嘲讽余承东!评论区炸锅

高潮来了!小米高管王腾连发两条微博,疑嘲讽余承东!评论区炸锅

青青子衿
2025-03-22 02:44:24
2025-03-23 03:59:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
594文章数 246关注度
往期回顾 全部

科技要闻

蔚来一年巨亏224亿!李斌解释了一个半小时

头条要闻

女生直播间打赏200万把母亲气进医院 退款遭平台拒绝

头条要闻

女生直播间打赏200万把母亲气进医院 退款遭平台拒绝

体育要闻

生涯突破!皮亚斯特里夺F1中国站杆位

娱乐要闻

大S遗愿曝光!汪小菲曾打电话咆哮S妈

财经要闻

财报里的电商三巨头:AI豪赌

汽车要闻

艾瑞泽8 PRO 10.39万起 动力拉满豪华平权

态度原创

本地
亲子
手机
时尚
公开课

本地新闻

用AI唤醒花花世界|锡城春光正当时,一半花开一半诗

亲子要闻

超级治愈的可爱宝宝,笑起来的样子让人十分的温暖,“真的会忍不住揉她脸蛋的”

手机要闻

三星Galaxy S25 edge跑分曝光 高频骁龙8至尊版

春天衣服别买太多,40岁女人有这4件就够了,舒适还不过时

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版