春节前,在AI模型聚合平台OpenRouter匿名上线的大模型Pony,引发许多开发者的热捧,使用它完成了真正能用、能玩、能上线的应用。2月11日晚,这款神秘的模型揭开面纱,智谱正式发布新模型GLM-5。在Coding(代码)与Agent(智能体)能力上,GLM-5擅长复杂系统工程与长程Agent(智能体)任务,取得开源SOTA(当前最高水平)表现,在真实编程场景的使用体感逼近美国Anthropic公司的ClaudeOpus4.5模型。
智谱GLM-5发布后,在全球权威的ArtificialAnalysis榜单中,位居全球前三、开源第一。海淀人工智能企业大模型再次登顶全球开源榜单,显示了区域人工智能产业的创新活力。
展示智能体典型场景
2026年被预测是智能体爆发的一年。学界与业界正逐渐形成共识,认为大模型将从写代码、写前端,进化到写工程、完成大任务,即从“VibeCoding”(“氛围编程”,利用人工智能将自然语言转化为计算机代码)变革为“AgenticEngineering”(智能体工程)。GLM-5正是这一变革的产物。
智谱GLM-5模型展示了几个典型场景。在端到端(一个AI模型从输入到输出的完整过程)应用开发上,GLM-5在匿名上线期间,许多开发者已经使用它制作了多个应用,如横版解谜游戏、智能体交互世界、论文版短视频平台等。记者了解到,这些位于GLM-5案例库的应用已开放下载,或已提交商店审核,展示了GLM-5在复杂系统工程中端到端交付可部署产品的能力。
通用智能体助手场景中,在OpenClaw(一款可以部署在个人电脑上的AI代理)中接入GLM-5,用户可以拥有一个智能的“实习生”,帮助搜索网站、定时整理资讯、发布推文、编程等。智谱推出了AutoGLM版本的智能体OpenClaw,与一款协同办公软件实现一体化配置,短短几分钟即可极速部署专属7×24小时智能助手。GLM-5较强的智能体工具调用能力,使其成为通用智能体助手的理想基座模型。
编程工具ZCode全流程编程场景中,用户只需把需求说清楚,模型会自动拆解任务,多智能体并发完成代码、跑命令、调试、预览和提交等开发全流程。在ZCode上,用户甚至可以用手机远程指挥桌面端智能体,解决以往需要很久的工程任务。值得一提的是,就连编程工具ZCode也是全程由GLM模型参与开发完成。
办公文档直接输出场景中,在Z.ai和智谱清言上,用户可以让GLM-5直接输出产品需求文档、教案、试卷、电子表格、财务报告、流程表、菜单等。GLM-5拥有更强大的复杂系统工程和长程智能体能力,可将文本或素材直接转换为docx、pdf和xlsx文件。
代码能力取得开源模型最高分数
GLM-5在编程能力上实现了对齐美国Anthropic公司的ClaudeOpus4.5,在业内公认的主流基准测试中取得开源模型SOTA(当前最高水平)。在基准测试SWE-bench-Verified和Terminal-Bench2.0中分别获得77.8和56.2的开源模型最高分数,性能超过谷歌公司的模型Gemini3Pro。
智谱相关负责人介绍说,2026年大模型将会从“会写”走到“会做事”,尤其是端到端完成大型任务。GLM-5是一个“系统架构师”,不仅为开发精美的Demo(原型)而生,更为稳定交付生产结果而生。在内部ClaudeCode(终端AI编程助手)评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7(平均增幅超过20%),能够以极少的人工干预自主完成智能体长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近ClaudeOpus4.5。
智能体能力取得多个开源第一
GLM-5在智能体能力上实现开源SOTA(当前最高水平),在多个评测基准中取得开源第一。在联网检索与信息理解、大规模端到端工具调用以及复杂场景下自动代理的工具规划和执行等方面,均取得最高表现。
在衡量模型经营能力的VendingBench2中,GLM-5获得开源模型第一表现。VendingBench2要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5最终账户余额达到4432美元,经营表现接近ClaudeOpus4.5,展现了出色的长期规划和资源管理能力。
智谱相关负责人解释说,这些能力是智能体工程的核心,模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系,成为真正的基座模型。
更大基座提供更强智能
智谱GLM-5模型全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础。
模型参数实现了规模扩展,从355B(B即Billion,意为十亿)(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,更大规模的预训练算力显著提升了模型的通用智能水平。构建了全新的“Slime”框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力。首次集成DeepSeekSparseAttention(稀疏注意力机制),在维持长文本效果无损的同时,大幅降低模型部署成本,提升Token(词元)有效性。
记者了解到,智谱GLM-5模型在代码和智能体上取得突破,国产算力芯片成为重要支撑。智谱相关负责人表示,此前,GLM系列模型受到全球开发者喜爱,在GLMCodingPlan套餐全球爆量后,智谱不得不启动限售措施。本次GLM-5的上线依托众多国产芯片有力保障了线上服务的稳定和高效。
目前GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。
记者 倪恒虎
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.