网易首页 > 网易号 > 正文 申请入驻

CUDA要凉?Claude 30分钟铲平英伟达护城河,AMD要笑醒了

0
分享至

  新智元报道

  编辑:桃子

  【新智元导读】英伟达护城河要守不住了?Claude Code半小时编程,直接把CUDA后端迁移到AMD ROCm上了。

  一夜之间,CUDA护城河被AI终结了?

  这几天,一位开发者johnnytshi在Reddit上分享了一个令人震惊的操作:

  Claude Code仅用了30分钟,便将一段完整的CUDA后端代码,成功移植到AMD的ROCm上。

  整个过程,没有手写一行代码。

  这架势,简直是要填平这两个生态系统之间的鸿沟。

  

  更关键的是,这次移植完全没有依赖传统的「中间转换工具」,如Hipify翻译层,而是一键通过CLI完成。

  就连AMD软件副总Anush E.为之震惊,GPU编程的未来,是AI智能体的。

  

  消息一出,整个科技圈瞬间沸腾,很多人直呼:英伟达CUDA护城河要守不住了.....

  

  

  这究竟是怎么回事?

  Claude手撕CUDA,仅30分钟

  Claude Code是在一个智能体框架运行的,这意味着它可以自己「动脑子」。

  在执行过程中,他不会机械地转换关键词,而去真正理解代码,即特定核函数的底层逻辑。

  开发者johnnytshi介绍,这次移植中,最棘手的数据布局差异问题也被AI解决了,确保了内核核心计算逻辑保持一致。

  

  令人惊叹的是,johnnytshi在短短30分钟内,就把整个CUDA后端移植到了AMD ROCm上,而且中间没用任何翻译层。

  另外一个好处当然是,不用费劲去搭像Hipify这种复杂的翻译环境了;直接在命令行(CLI)里就能干活。

  如今,全网都被CUDA护城河被攻破呼声淹没了。

  

  毕竟,英伟达霸主地位,很大程度上建立在CUDA这个几乎成为行业标准的编程生态上。

  无数AI框架、深度学习库、科学计算工具都深度依赖它。

  

  AMD的ROCm虽然功能强大,却一直面临生态兼容性,以及开发者迁移成本高的痛点。

  现在,一个Claude却用极短时间踢碎了门槛,说不定未来更多CUDA代码可能轻松在AMD GPU跑起来了。

  实现细节

  GitHub中,johnnytshi本人也更新了日志和说明。

  为AMD GPU实现了完整的ROCm后端,从而在RDNA 3.5及其他AMD架构上支持基于注意力机制的现代国际象棋网络。

  

  GitHub:https://github.com/LeelaChessZero/lc0/pull/2375

  在src/neural/backends/rocm/中添加了完整的ROCm后端

  实现了注意力网络架构(多头自注意力、FFN、嵌入层)

  使用rocBLAS进行GEMM运算,使用MIOpen进行卷积运算

  针对RDNA 3.5上的FP16性能优化了NCHW布局

  提供三种后端变体:rocm(FP32)、rocm-fp16(FP16)、rocm-auto(自动检测)

  MIOpen是必选依赖(类似于CUDA的cuDNN)

  通过rocm_agent_enumerator自动检测AMD GPU架构

  编译选项:-Drocm=true -Damd_gfx=gfx1151(或使用自动检测)

  

  性能说明:

  FP16性能:在Strix Halo (Radeon 8060S, gfx1151) 上 >2000 nps

  自动Batch Size调优(RDNA 3.5上min_batch=64)

  测试过rocWMMA,但rocBLAS性能更好

  验证情况(Strix Halo - Radeon 8060S, gfx1151):

  测试模型768x15x24h-t82-swa-7464000.pb.gzmaia-1900.pb.gz

  后端rocm-fp16功能正常,能生成正确的走法

  环境:ROCm 7.2.53150, MIOpen 3.5.1

  :仅在RDNA 3.5上进行了测试;其他AMD架构暂未验证

  GPU未来,是AI智能体主场

  当然,这次演示也有局限性。

  对于简单或中等复杂度的内核,Claude Code表现得非常出色。更重要的是,写核函数的核心就在于搞定「深度硬件」优化。

  不过,一部分觉得Claude Code在这方面还是差点火候——

  如果遇到那些针对特定硬件缓存层级,内存访问模式做过极致优化的复杂内核,AI目前还难以完全取代人类专家。

  即便如此,这一事件释放出的信号已经足够强烈。

  过去几个月,ZLUDA项目、还有微软内部的尝试,都想要打破CUDA的垄断。

  

  但它们大多依赖规则映射或中间层,自动化程度和智能水平有限。

  Claude Code代表的智能体式编程,直接跳过了这些环节,用「理解+自主决策」的方式填平生态鸿沟。

  正如AMD软件副总所言,GPU编程的未来,是AI智能体主场。

  全员AI编程,浓度高达100%

  如今的Claude Code已经让整个硅谷入坑了(Claude-Pilled)。

  两天前,CEO Dario Amodei在达沃斯上再出暴论:软件工程师们没有时间了。未来6-12个月,AI能够彻底取代这些人!

  

  甚至,Anthropic内部工程师已经不再手写代码了,全是Claude完成。

  别不信,是真的。

  就在Wired最新采访中,Claude Code之父Boris Cherny坦承,「自己100%代码都是AI写的」。

  

  或许Anthropic工程师怎么也没有想到,一个「副业项目」竟让硅谷如此狂热。

  Boris Cherny回忆道,「一年前我们发布Claude Code时,甚至不确定『智能体编程』能不能成,但火爆来得太快了」。

  Cherny个人经历就是最好的缩影:

  刚发布时,他只有5%代码是用Claude Code写的;

  到了去年5月,有了Opus 4和Sonnet 4,这个比例变成了30%;

  而现在,有了Opus 4.5,他在过去两个月里100%的代码都是由Claude Code完成。

  在Anthropic内部,这种全员AI化更是到了极致。

  几乎100%技术员工都在使用Claude Code,甚至连Claude Code团队本身95%的代码也是由自身写出来的。

  

  斯坦福AI教授都在用了

  不得不说,AI编程的进化速度令人咋舌。

  回望2021到2024年,大多数工具不过是高级版的「自动补全」,在开发者打字时卑微地建议几行代码。

  但到了2025年初,随着Cursor和Windsurf等初创发布早期的Agentic编程产品,游戏规则改变了——

  开发者只需用大白话描述功能,剩下的脏活累活全扔给AI智能体完成。

  Claude Code也在这个时间点,真正诞生了。

  Boris Cherny坦承,早期版本也曾跌跌撞撞,甚至陷入死循环。但Anthropic下了一步狠棋:不为当下的AI能力开发产品,而要为AI即将抵达的未来而构建。

  这一赌注押对了。随着Anthropic下一代旗舰Claude Opus 4.5的发布,AI编程迎来了真正的「拐点」。

  

  斯坦福大学AI讲师、Workera CEO Kian Katanforoosh最近就把公司全员迁移到了Claude Code。

  他直言,对于高级工程师来说,Claude Code比Cursor、Windsurf更能打。

  Katanforoosh感叹道,最近唯一让我看到编程能力有阶跃式提升的模型,就是Claude Opus 4.5。

  「它给人的感觉不像是在模仿人类写代码,而是它真的找到了一种更聪明的解决路径」。

  据传,微软内部也在大规模采用Claude Code了。

  

  年入超10亿美金的「副业」

  Claude Code大获成功,给Anthropic带来了最直观的效益。

  去年,AI编程智能体业务彻底爆发。11月,Anthropic宣布Claude Code在上线不到一年内,年度经常性收入(ARR)就突破了10亿美元

  到2025年底,ARR至少又增长了1亿美元。

  

  彼时,该产品约占Anthropic总ARR(约90亿美元)的12%。虽然比起向大企业提供 AI 系统的核心业务来说还算「小弟」,但它已是公司增长最快的板块之一。

  尽管Anthropic在AI编程领域看似独孤求败,但Claude Opus 4.5的光环其实照亮了整个赛道。

  竞争对手Cursor也在11月达到了10亿美元ARR,OpenAI、谷歌和xAI更是磨刀霍霍,试图用自研模型分一杯羹。

  但Anthropic没打算停下。

  前几天,他们又发布了Cowork——这是一款面向非编程领域的AI智能体。

  它能管理你电脑里的文件、操作各种软件,而且完全不需要你在代码终端里敲命令。

  

  不是取代,是进化

  提及Cowork时,Cherny透露自己已经用疯了。

  比如项目管理,他会让Cowork盯着工程师的任务表格,谁没填名字,AI就会自动在Slack上发消息催人。

  Cherny感慨道,「这是我当工程师以来最爽的时候,因为我不再需要做那些枯燥乏味的脏活了」。

  面对那些因不再需要亲自写代码而感到失落的工程师,Cherny给出了他的建议:

  这行业一直在变。我祖父在苏联用穿孔卡片编程;后来变成了机器码;再后来是C语言、Java、Python。

  这是一条不断抽象化的连续体,AI智能体只是这条线上的最新一个点。

  

  如今,Cherny每天早上起床会在手机上启动3-4个编程智能体,到了公司再在终端里开几个。

  任何时候,他都有五到十个智能体在跑任务。

  Cherny总结道,「AI智能体将接管生活中所有繁琐的事——填表、搬运数据、发邮件。这会具有颠覆性,我们必须适应」。

  话又说回来,Anthropic能不能先解决下Claude使用量?

  

  参考资料:

  https://github.com/LeelaChessZero/lc0/pull/2375

  https://wccftech.com/the-claude-code-has-managed-to-port-nvidia-cuda-backend-to-rocm-in-just-30-minutes/

  https://www.wired.com/story/claude-code-success-anthropic-business-model/?utm_brand=wired&utm_social-type=owned&utm_source=twitter&utm_medium=social&utm_campaign=aud-dev

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
张雪峰前女友哭红眼,喊话不要给他泼脏水,曝两人分手原因

张雪峰前女友哭红眼,喊话不要给他泼脏水,曝两人分手原因

茶韵浮生
2026-03-26 20:26:51
和富商离婚后,上海知名主持沦为网红,如今8岁儿子成她唯一依靠

和富商离婚后,上海知名主持沦为网红,如今8岁儿子成她唯一依靠

往史过眼云烟
2026-03-25 14:51:15
全国高速明天大调整!车主集体欢呼:早该这么干了

全国高速明天大调整!车主集体欢呼:早该这么干了

沙雕小琳琳
2026-03-26 02:05:39
A股:刚刚,大消息传来,请做好准备,3月27日周五将迎来新的变化

A股:刚刚,大消息传来,请做好准备,3月27日周五将迎来新的变化

夜深爱杂谈
2026-03-26 20:05:11
受权发布|中华人民共和国国务院令  第833号

受权发布|中华人民共和国国务院令  第833号

新华社
2026-03-26 17:03:04
以牙还牙!欧盟冻结对匈牙利160亿援助,投降俄军助乌军消灭150人

以牙还牙!欧盟冻结对匈牙利160亿援助,投降俄军助乌军消灭150人

史政先锋
2026-03-26 20:22:48
联大通过决议,宣布“最严重反人类罪”

联大通过决议,宣布“最严重反人类罪”

澎湃新闻
2026-03-26 11:03:06
去世还不到48小时,张雪峰过往争议被扒,出轨传闻早已真相大白

去世还不到48小时,张雪峰过往争议被扒,出轨传闻早已真相大白

兰亭墨未干
2026-03-26 22:47:38
把刘涛抱在怀里,有谁注意到他手上的小动作,人品如何一目了然。

把刘涛抱在怀里,有谁注意到他手上的小动作,人品如何一目了然。

TVB的四小花
2026-03-27 01:19:43
跌光2500亿!泡泡玛特,股价崩塌

跌光2500亿!泡泡玛特,股价崩塌

财经锐眼
2026-03-26 18:54:18
突发!以色列彻底失控!

突发!以色列彻底失控!

财经要参
2026-03-26 21:58:11
全线跳水!刚刚,伊朗发动攻击

全线跳水!刚刚,伊朗发动攻击

中国基金报
2026-03-26 16:15:26
越打越出惊喜!以色列传来好消息,美军彻底歇菜:8年无法再开战

越打越出惊喜!以色列传来好消息,美军彻底歇菜:8年无法再开战

知法而形
2026-03-26 17:28:20
引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

家传编辑部
2026-03-26 10:34:27
没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

岁月有情1314
2026-03-26 12:13:10
大陆对全体台胞发出邀请:两岸统一之时,即可从台岛自驾直达北京

大陆对全体台胞发出邀请:两岸统一之时,即可从台岛自驾直达北京

小童历史
2026-03-25 18:20:29
张雪峰灵堂照曝光,门口摆满了花圈,网友看到遗像后心里酸酸的

张雪峰灵堂照曝光,门口摆满了花圈,网友看到遗像后心里酸酸的

180视角
2026-03-26 18:36:11
全球货币支付排名:美元跌至49.25%,欧元涨到22.82%,人民币呢

全球货币支付排名:美元跌至49.25%,欧元涨到22.82%,人民币呢

张嘴说财经
2026-03-26 20:56:17
中国动“真格”了!中方霸气警告:90天内358亿赔偿金必须到位

中国动“真格”了!中方霸气警告:90天内358亿赔偿金必须到位

趣生活
2026-03-26 22:16:24
2026-03-27 03:15:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66720关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
本地
亲子
家居
数码

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

家居要闻

傍海而居 静观蝴蝶海

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

无障碍浏览 进入关怀版