网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

智谱复盘GLM-5「乱码门」：日均数亿次Coding Agent调用

2026-05-01 16:44:01　来源: 侃故事的阿庆

福建举报

0

分享至

智谱发文复盘 GLM-5 系列模型在 Coding Agent 场景下出现乱码、复读和生僻字的问题。3 月起陆续有用户反馈，异常只在高并发、长上下文（平均超 70K token）的 Coding Agent 任务中触发，标准推理环境下无法复现。智谱称其推理系统每天承受数亿次 Coding Agent 调用。

经数周排查，团队定位到两个相互独立的底层竞态 bug。第一个出在 PD 分离架构（把预填充和解码拆到不同节点的部署方式）：解码侧超时中止请求后回收了 KV Cache（缓存已计算的注意力状态，避免重复计算），但预填充侧的 RDMA 写入还没结束，新请求被分配到同一块显存，旧数据覆盖了新数据。修复方法是在回收前加显式同步，确认写入完成才释放。上线后异常率从万分之十几降至万分之三以下。

第二个 bug 出在 HiCache（多级 KV Cache）：从 CPU 内存异步换入缓存时，加载和计算两条流水线之间缺少同步点，计算侧可能在数据尚未加载完毕时就开始读取。修复后该类异常完全消失，补丁已提交 SGLang 社区（PR #22811）。

排查过程中还有一个意外发现：投机采样（先用小模型猜 token 再由大模型验证的加速技术）的接受率指标可以当异常检测信号。乱码时草稿 token 几乎全被拒绝，复读时接受率异常偏高。团队据此做了在线监控：触发阈值就自动中止生成并重试。

在修完 bug 之后，团队还针对瓶颈做了一个优化：LayerSplit KV Cache 分层存储，每张 GPU 只存部分层的 KV Cache 而非全量，通过广播协同计算。在 90% 缓存命中率下，请求长度从 40K 到 120K 区间，吞吐提升 10% 到 132%，上下文越长收益越大。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

DeepSeek用V4重画了坐标系

钛媒体APP 2026-05-01 09:52:15
10 跟贴 10
阿里QoderWake上岗：有身份、有记忆、有红线，先给它一版“职业行为指南“

智东西 2026-04-30 14:41:58
0 跟贴 0

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

机器之心Pro 2026-05-01 19:56:22
3 跟贴 3

卡帕西都整破防了：AI Coding没门槛，可部署环节真嗯啊的难

量子位 2026-03-27 12:12:46
29 跟贴 29
撕开Claude Code真相：让它好用的98.4%，是工程不是AI

新智元 2026-05-01 13:30:20
3 跟贴 3

重塑软件工程：从Vibe Coding走向Spec Coding

钛媒体APP 2026-02-11 09:37:53
0 跟贴 0

大模型最难的AI Infra，用Vibe Coding搞定

机器之心Pro 2026-01-07 15:33:06
0 跟贴 0
广西平陆运河建240米动物通道桥，供豹猫等动物通行

星视频 2026-05-01 11:08:08
128 跟贴 128

GPT-5.6现身后，下一个Claude Sonnet 4.8又曝光了！

新智元 2026-05-01 19:06:33
0 跟贴 0
GPU神话松动，AI真正的战场变了

虎嗅APP 2026-05-01 01:19:11
10 跟贴 10
Vibe coding，撕裂程序员旧世界

钛媒体APP 2026-04-30 14:45:47
13 跟贴 13
清程极智师天麾：告别盲选，如何用AI Ping构建Agent时代的高质量Token流通网络

智东西 2026-04-30 17:48:05
0 跟贴 0
腾讯混元CL-bench续作发布，让大模型读懂你的日常生活

机器之心Pro 2026-05-01 19:53:00
0 跟贴 0
奥特曼预言与现实相差几何？12个顶级模型“创业”一年，仅3个存活

钛媒体APP 2026-04-03 17:11:08
0 跟贴 0
津门虎和青岛海牛比赛有内容，平民外援在中超就为争数据#天津津门虎 #青岛海牛 #云南玉昆 #潘谈中超

Leslie潘伟力 2026-04-29 07:59:31
17 跟贴 17
上海迪士尼回应游客劝阻吸烟被打：园区没有禁烟；被打男子发声：对方已赔钱和解

中国新闻周刊 2026-04-27 14:25:00
15229 跟贴 15229
AI能改10万行代码，却让你走路去洗车！Karpathy戳破「锯齿状智能」

新智元 2026-05-01 17:08:00
0 跟贴 0
Claude Opus 4.7深夜「叛变」！群发20封夺命邮件，开发者凌晨被炸醒

新智元 2026-05-01 19:07:13
2 跟贴 2
铁液做模型

刘姐爱拉呱 2026-04-30 11:43:18
1 跟贴 1
【汽车人】鸿蒙扩张、小艺进化，欢迎来到“智能体”世界

汽车人传媒 2026-04-30 21:22:51
0 跟贴 0
全国人民感谢上海，楼市数据真相

王波说房 2026-05-01 16:33:41
13 跟贴 13
死记硬背困住的不只是学生

晚风也遗憾 2026-05-01 00:31:18
0 跟贴 0
单Agent时代正式结束：一个干不过，就上300个-3

机器之心Pro 2026-04-22 00:08:00
0 跟贴 0
鸡哥移除！炉石补丁后上分卡组推荐！还有限时领卡包！

炉石东少 2026-04-29 14:00:49
0 跟贴 0
张雪回应“820赛道熄火”：车子倾角设定是61度就会熄火，我们判断为摔车

极目新闻 2026-05-01 17:58:29
3406 跟贴 3406
导游称大熊猫“花花”是残疾，旅行社致歉

界面新闻 2026-05-01 07:59:04
9687 跟贴 9687
都是车！第一批离深“大聪明”已堵路上

鲁中晨报 2026-04-30 21:39:23
221 跟贴 221
硬核拆解：GPT-5、Claude和Gemini是如何训练和推理的？

华尔街见闻官方 2026-04-30 11:17:51
0 跟贴 0
游客声称在上海街头"走路也罚款" 上海交管还原真相

上游新闻 2026-05-01 20:01:19
3354 跟贴 3354
28178人！中冠联赛单场观众纪录在江苏常州诞生

江苏新闻 2026-05-01 16:26:00
91 跟贴 91
长坂坡赵云强过巅峰吕布？数据不说谎，战神光环碎了一地！

老表是个手艺人 2026-04-30 17:46:49
1 跟贴 1
美国也搞起"人肉代购" "去墨西哥买中国车"教程疯传

看看新闻Knews 2026-05-01 22:58:33
2530 跟贴 2530
上海医保新政落地！5月起配药这部分费用提高了

看看新闻Knews 2026-05-01 13:24:05
406 跟贴 406
从Token、算力到智能体：数字中国建设峰会上的AI进化论

财联社 2026-05-01 12:26:30
0 跟贴 0
兰州一餐馆悬挂钱学森和袁隆平照片，顾客直呼“这才是真正的明星”，老板回应：因为有他们我们才有饭吃

极目新闻 2026-05-01 20:08:28
1162 跟贴 1162
天柱山景区“摆渡车问题”被点名后，记者实探

极目新闻 2026-05-01 19:46:05
235 跟贴 235
女子陪儿子玩手雷模型，手雷没扔出尴尬了，竟被教练一脚踢飞

搞笑热血青年 2026-05-01 09:24:17
2 跟贴 2
Karpathy：很多App就不该出生,人类护城河只剩理解,CPU将沦为配角

机器之心Pro 2026-05-01 20:44:49
0 跟贴 0
labubu冰箱售价5999元秒没有平台挂出22999元价格

新闻坊 2026-05-01 12:27:36
892 跟贴 892
Switch国行即将永久关闭服务器！不想变砖就做好这些

游民星空 2026-05-01 18:40:14
7 跟贴 7

刘亦菲情商很高，跟佟大为合影，自觉的把肩膀的毛巾给拿下来

刘亦菲情商很高，跟佟大为合影，自觉的把肩膀的毛巾给拿下来

小椰的奶奶

2026-05-02 04:12:03

罗永浩喊话西门子：24小时内给消费者满意答复，否则带摄制组了解情况并全程拍摄；此前网友求助称其所购洗碗机辅材未获批，售后维权无果

罗永浩喊话西门子：24小时内给消费者满意答复，否则带摄制组了解情况并全程拍摄；此前网友求助称其所购洗碗机辅材未获批，售后维权无果

大风新闻

2026-05-01 12:47:15

“富人才不会把女儿养这么胖”，家长晒女儿喝60元矿泉水，被群嘲

“富人才不会把女儿养这么胖”，家长晒女儿喝60元矿泉水，被群嘲

番外行

2026-04-22 14:51:19

iPhone 17卖断货，苹果却愁坏了

iPhone 17卖断货，苹果却愁坏了

字节漫游指南

2026-05-01 05:10:42

特斯拉中国再推促销方案：5月31日前，购买Model 3、Model Y、Model Y L车型5年0息

特斯拉中国再推促销方案：5月31日前，购买Model 3、Model Y、Model Y L车型5年0息

鲁中晨报

2026-04-29 10:48:05

下赛季出任皇马主帅？穆里尼奥：皇马没跟我联系过，我可以保证

下赛季出任皇马主帅？穆里尼奥：皇马没跟我联系过，我可以保证

懂球帝

2026-05-01 20:49:20

眼中有光，谁看了不迷糊？

贵圈真乱

2026-05-01 13:49:56

日本全票通过，对华开危险一枪

福建睿平

2026-05-01 08:04:38

关于吴石将军！国安部最新披露！

关于吴石将军！国安部最新披露！

雍亲王府

2026-05-01 20:00:07

去城里的姑父家拜年，姑姑让我滚，后来她从新闻上看到我任命县长

去城里的姑父家拜年，姑姑让我滚，后来她从新闻上看到我任命县长

千秋文化

2026-04-30 18:46:59

人活着，说到底就三样东西：生理需求居首，真正懂的人没几个

人活着，说到底就三样东西：生理需求居首，真正懂的人没几个

朗威谈星座

2026-05-01 14:28:21

破案！郑智吃红牌原因曝光，恐遭足协重罚

破案！郑智吃红牌原因曝光，恐遭足协重罚

何老师呀

2026-05-01 21:46:50

悲催！杭州一女子嫌国企丈夫没本事，携42万存款离婚，鸡飞蛋打了

悲催！杭州一女子嫌国企丈夫没本事，携42万存款离婚，鸡飞蛋打了

火山詩话

2026-04-27 06:40:09

FBI网络主管：中国黑客雇佣生态"已失控"

FBI网络主管：中国黑客雇佣生态"已失控"

我是一个养虾人

2026-05-01 03:51:50

刘晓庆现身开封万岁山武侠城，头戴鲜花乘花车向游客挥手致意，和“王婆”互动冷淡引争议，景区回应

刘晓庆现身开封万岁山武侠城，头戴鲜花乘花车向游客挥手致意，和“王婆”互动冷淡引争议，景区回应

极目新闻

2026-05-01 14:50:46

女教师“幼态字体”走红，被家长建议停职：还不如我女儿写得好

女教师“幼态字体”走红，被家长建议停职：还不如我女儿写得好

观察鉴娱

2026-04-30 10:52:07

脑有没有萎缩，睡觉就知？提醒：睡觉时出现这4个症状，尽早筛查

脑有没有萎缩，睡觉就知？提醒：睡觉时出现这4个症状，尽早筛查

芹姐说生活

2026-04-22 23:45:31

安徽省纪委监委通报：7名干部同日被查！

安徽省纪委监委通报：7名干部同日被查！

凤凰网安徽

2026-05-01 16:12:03

活塞有望在今夏签下前湖人次轮秀，他是欧洲赛场的顶级侧翼防守者

活塞有望在今夏签下前湖人次轮秀，他是欧洲赛场的顶级侧翼防守者

稻谷与小麦

2026-05-02 01:27:42

母亲和情夫一起10年，父亲默不作声纵容，却在他50岁生日那天反击

母亲和情夫一起10年，父亲默不作声纵容，却在他50岁生日那天反击

白云故事

2025-04-24 10:35:08

侃故事的阿庆

几分钟看完一部影视剧，诙谐幽默的娓娓道来

597文章数 8346关注度

往期回顾全部

科技要闻

DeepSeek发布多模态论文又连夜删除

头条要闻

美国也搞起"人肉代购" "去墨西哥买中国车"教程疯传

头条要闻

美国也搞起"人肉代购" "去墨西哥买中国车"教程疯传

体育要闻

无奈！约基奇：这要在塞尔维亚全队早被炒了

娱乐要闻

马筱梅产后身材恢复超好现身户外直播

财经要闻

GPU神话松动，AI真正的战场变了

汽车要闻

限时9.67万起吉利星越L/星瑞i-HEV智擎混动上市

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

家居

健康

手机

公开课

教育要闻

高考地理概念:地下水

家居要闻

灵动实用生活艺术场

干细胞治烧烫伤面临这些“瓶颈”

手机要闻

曝iPhone18Pro相机史诗级升级，这次你期待吗？

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版