当大模型开始自己改bug、跑测试、甚至拒绝不合理需求——程序员的角色会被压缩成"监工"吗?
一、GLM-5.1的核心升级:从"生成代码"到"完成任务"
![]()
智谱最新发布的GLM-5.1,主打的是Agentic Coding(智能体编程)。不是给你一段代码就结束,而是能理解需求、自主规划、调用工具、验证结果。
实测中,它可以在多轮对话里保持上下文,遇到编译错误会自己查文档修,甚至对模糊需求会反问确认。这已经不是代码补全工具的逻辑了。
二、三个值得关注的细节
第一,工具调用链变长了。GLM-5.1支持单次请求里串行调用多个工具,比如先读配置文件、再查API文档、最后生成代码。中间哪步出错,它会回溯重试。
第二,拒绝能力。面对明显不合理的需求(比如"用Excel实现操作系统"),它会直接说"这超出合理范围",而不是硬编一段废代码。这点比盲目服从的模型更实用。
第三,测试驱动。生成代码后,它会主动写测试用例跑一遍,通过才交付。相当于内置了一个最小化的CI流程。
三、对开发者的真实影响
初级编码工作确实在加速贬值。但GLM-5.1也暴露了新瓶颈:复杂系统的架构设计、跨模块的依赖梳理、业务逻辑的隐性知识——这些它还不行。
更现实的场景是"人机结对":你定方向,它填实现,你审结果。效率提升是确定的,但"完全替代"还早。
一个尴尬的事实是:很多程序员讨厌写测试和文档,而Agent最擅长的恰恰就是这些。未来 team's 里专门"审Agent产出"的岗位,会不会比纯写代码的更吃香?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.