网易首页 > 网易号 > 正文 申请入驻

记录下SGLang开发,优化,debug的技巧之大SKILL时代已来临

0
分享至

来源:市场资讯

(来源:GiantPandaLLM)

0x0. 前言

之前在记录下SGLang 开发,编译和Profile的几个小技巧和记录下SGLang 开发,debug的几个技巧第二弹中,记录了一些 SGLang 开发、debug、profile 的技巧,这篇文章继续来聊一下 Agent(Claude Code/Codex)时期的近况。

0x1. Agent 的冲击

在经历了 Codex + GPT5.4 Extra High 狂蹬 2 周做的事情之后,我觉得之前自己的学习基本失去意义,一些难理解的知识和一些总结的技巧,其实只是大模型在设置合适 context(SKILL)下的 Token 而已。Codex + GPT5.4 已经达到了非常强的能力,这和 2025 年的感觉完全不一样,真正的智能似乎已经出现了,至少在编程开发领域是这样。读者在 Codex 或者 Claude Code 中可以安装 SGLang 提供的一些 SKILLS,完成 kernel 编写、benchmark 和测试编写、kernel 迭代优化、模型编写、模型优化、CUDA Crash 自动 debug、自动二分坏掉的 commit 等等这些之前需要付出大量人力的工作。


大家感兴趣可以去看这些 SKILL。最近我基于 Codex 和这些 SKILL,让 SGLang Diffusion 的 Z-Image 单卡速度提升 40%,Qwen/Qwen-Image-2512 的单卡速度提升 20%+,并挖掘了一个 kernel fuse 的 pattern:https://github.com/sgl-project/sglang/pull/20395。然后如果用一些更适合 kernel 开发的 Agent 框架,例如 https://github.com/TongmingLAIC/AKO4ALL ,可以让已有的一些 kernel 更容易地获得提升,例如:


然后等待40分钟就让整个模型的端到端性能又提升了2个百分点。


这些足以证明当前阶段 Coding Agent 的高超能力。如果你觉得 Agent 还不行,那得思考一下你使用的方式,以及 context 是否给对了。当然,也有一些领域 Agent 还是无法和人类专家对比,但是可怕的是大模型还在进化,gap 只会变小。


0x2. Agent 流程可以优化的地方

  • 对于大模型推理的开发,很多流程是相对固定的,我们就需要抽出通用高效的 SKILL 来帮助 Agent 更好地工作,这是目前最需要做的工作。例如在 https://github.com/sgl-project/sglang/pull/20910 中,就受 Flashinfer 的 API logging 启发,做了一个针对 SGLang CUDA Crash 的 debug skill。有了这个 skill 之后,当碰到模型有 CUDA crash(无论是接口层面还是 kernel 层面)时,都可以更方便高效地用 Codex 去定位到出错的 kernel。如果让人去做这个流程,就会非常繁琐和耗时。因此第一件可以做的事是蒸馏自己,蒸馏以前的开发者,让推理框架开发、优化模型都可以通过 Agent 去转起来。这里有很多工作可以做,可以一边做开发一边总结。

  • 研究更加专业化的知识,让它们成为 Agent 的资料库,得到更好的效果。例如总结人类专家的经验,做一个特殊的 SKILL 挂到 Agent 上,合法开挂。例如你可以挑一个你觉得含金量非常高的 cutlass 系列 blog、triton 系列 blog,或者一个专门的人类代码优化库,把其中的一些优化代码压缩总结成一个 SKILL 挂给 Agent。

  • 流程也非常重要。给一个特定的 kernel 做优化,如果没有合适的流程,可能结果并不会很好,这方面可以参考 https://github.com/TongmingLAIC/AKO4ALL 和 https://github.com/RightNow-AI/autokernel 等等。

例如在 记录下SGLang 开发,debug的几个技巧第二弹 中,提到了一个长期崩溃的问题,我们就可以把整套流程整理成一套 SKILL,来调试这种生产环境中会出现的困难问题。当然,个人感觉程序员的专业价值也会在一个个 SKILL 中被逐渐削弱。

0x3. 警惕

不要让 Agent 挂在那里,然后完全不看它的开发流程,就把最后的结果拿来交付。目前实际使用中,Agent 还是会有一些偏离方向的修改,可能会造成破坏性的后果,需要警惕。


当这张梗图成为现实,世界将会彻底改变(笑)。

0x4. 人的价值

现在我们是否可以分清楚提交的 PR 到底是人类写出来的,还是 AI coding 出来的?人的价值在哪?

这种担心挺正常的,但人的价值不会消失,只是从"一行行手写代码"变成了"定义问题、梳理上下文、判断结果靠不靠谱"。以前厉害的开发者可能是亲手扣 kernel、手动串 benchmark 和 debug;现在更值钱的是能把这些经验沉淀成 SKILL、搭出自动验证闭环、一眼看出 Agent 产出有没有走偏的人。人正在从干活的人变成设计的人、把关的人、提炼的人。蒸馏世界的知识,蒸馏 AI 的输出,最后蒸馏自己。

在推理框架、kernel 优化、模型适配这些复杂场景里,稀缺的早就不只是"会写代码",而是"知道该优化什么、瓶颈大概在哪、怎么设计一个稳定可复用的流程"。Agent 确实能把事情做得飞快,但它需要目标清晰、资料齐全、验证标准过硬。缺了这些,再强的模型也不过是高速生产一堆看着像回事、并不正常work的东西。人工智能,到头来还是得靠"能工智人"(笑)。

综上,个人认为当前这个时间点,成为 Vibe Coding 高手已经成为唯一出路。同时也期待GPT5.4和Opus 4.6到底能进化到什么地步。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发:以军发动袭击

突发:以军发动袭击

第一财经资讯
2026-04-11 10:21:30
巴基斯坦预警机紧急升空!以色列偷袭计划落空,中方战术果然高

巴基斯坦预警机紧急升空!以色列偷袭计划落空,中方战术果然高

十三级台阶
2026-04-11 09:09:36
巴基斯坦大批预警机升空,给以色列上了一课:中方显然背后指点了

巴基斯坦大批预警机升空,给以色列上了一课:中方显然背后指点了

安安说
2026-04-11 11:30:55
湖南祁东沿路插了百余米的白事支架灯笼,上面印“奠” 下面挂长条幅,当地民政局:已全部拆除

湖南祁东沿路插了百余米的白事支架灯笼,上面印“奠” 下面挂长条幅,当地民政局:已全部拆除

大风新闻
2026-04-11 10:41:08
为这场和谈,巴基斯坦押上国运!万人封城不给以色列任何可乘之机

为这场和谈,巴基斯坦押上国运!万人封城不给以色列任何可乘之机

青青子衿
2026-04-11 02:19:32
17人缺席!掘金大胜雷霆11连胜创约基奇时代纪录 瓦兰23+17

17人缺席!掘金大胜雷霆11连胜创约基奇时代纪录 瓦兰23+17

醉卧浮生
2026-04-11 11:11:22
阿夫迪亚35+5开拓者击沉快船升至第8,杨瀚森再登场小卡24+8+5

阿夫迪亚35+5开拓者击沉快船升至第8,杨瀚森再登场小卡24+8+5

湖人崛起
2026-04-11 12:31:08
壮丽归航!阿尔忒弥斯2号宇航员平安回家,人类重返月球时代正式开启

壮丽归航!阿尔忒弥斯2号宇航员平安回家,人类重返月球时代正式开启

大洛杉矶LA
2026-04-11 08:41:21
国家卫健委通报10起科研失信行为

国家卫健委通报10起科研失信行为

界面新闻
2026-04-09 17:01:42
郑丽文想要的,大陆给得很爽快,随行人员有惊喜,蓝营一姐发话了

郑丽文想要的,大陆给得很爽快,随行人员有惊喜,蓝营一姐发话了

共工之锚
2026-04-10 19:34:21
减重30%,成本还更低!中国电动车掀起镁代铝浪潮:问界单车用镁达20公斤级,零跑、长安急寻供应商⋯⋯

减重30%,成本还更低!中国电动车掀起镁代铝浪潮:问界单车用镁达20公斤级,零跑、长安急寻供应商⋯⋯

每日经济新闻
2026-04-10 19:23:16
辱骂全红婵的徐某究竟是谁?一个普通爱好者 竟能拉业内人士进群

辱骂全红婵的徐某究竟是谁?一个普通爱好者 竟能拉业内人士进群

念洲
2026-04-11 09:39:26
网暴全红婵长达3年,只拘10天?港媒:疑有陈芋汐、陈艺文参与

网暴全红婵长达3年,只拘10天?港媒:疑有陈芋汐、陈艺文参与

开成运动会
2026-04-11 11:43:25
你永远想不到,日本对我国的土地渴望到了什么程度

你永远想不到,日本对我国的土地渴望到了什么程度

贱议你读史
2026-04-10 12:07:08
以色列,终成人类公敌!

以色列,终成人类公敌!

燕梳楼频道
2026-04-10 15:02:39
白色路虎车加油后逃单,江西高速交警通报

白色路虎车加油后逃单,江西高速交警通报

环球网资讯
2026-04-11 07:53:11
“赵一鸣”被指918间谍:爱国不是“降智”的挡箭牌

“赵一鸣”被指918间谍:爱国不是“降智”的挡箭牌

虔青
2026-04-10 13:53:06
林志玲 水上浮板

林志玲 水上浮板

动物奇奇怪怪
2026-04-11 11:14:54
红帽撤离中国,一个时代的落幕。

红帽撤离中国,一个时代的落幕。

开源中国
2026-04-10 15:36:24
53条中日航线3月取消全部航班

53条中日航线3月取消全部航班

每日经济新闻
2026-04-10 13:01:04
2026-04-11 14:19:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2832710文章数 6540关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

贵州400余名村民被困在"危山"之下:雨季来了只能等死

头条要闻

贵州400余名村民被困在"危山"之下:雨季来了只能等死

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰 该走的没走,不该走的走了

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

教育
家居
旅游
亲子
军事航空

教育要闻

中小学教师减负8条措施

家居要闻

复古风格 自然简约

旅游要闻

三明宁化推出“入宁游”新政 激活文旅发展新动能

亲子要闻

碳板跑鞋又贵,又有害健康,但为什么小孩哥都这么喜欢?

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

无障碍浏览 进入关怀版