网易首页 > 网易号 > 正文 申请入驻

智谱GLM-5开源模型全球第一

0
分享至

春节前,在AI模型聚合平台OpenRouter匿名上线的大模型Pony,引发许多开发者的热捧,使用它完成了真正能用、能玩、能上线的应用。2月11日晚,这款神秘的模型揭开面纱,智谱正式发布新模型GLM-5。在Coding(代码)与Agent(智能体)能力上,GLM-5擅长复杂系统工程与长程Agent(智能体)任务,取得开源SOTA(当前最高水平)表现,在真实编程场景的使用体感逼近美国Anthropic公司的ClaudeOpus4.5模型。

智谱GLM-5发布后,在全球权威的ArtificialAnalysis榜单中,位居全球前三、开源第一。海淀人工智能企业大模型再次登顶全球开源榜单,显示了区域人工智能产业的创新活力。

展示智能体典型场景

2026年被预测是智能体爆发的一年。学界与业界正逐渐形成共识,认为大模型将从写代码、写前端,进化到写工程、完成大任务,即从“VibeCoding”(“氛围编程”,利用人工智能将自然语言转化为计算机代码)变革为“AgenticEngineering”(智能体工程)。GLM-5正是这一变革的产物。

智谱GLM-5模型展示了几个典型场景。在端到端(一个AI模型从输入到输出的完整过程)应用开发上,GLM-5在匿名上线期间,许多开发者已经使用它制作了多个应用,如横版解谜游戏、智能体交互世界、论文版短视频平台等。记者了解到,这些位于GLM-5案例库的应用已开放下载,或已提交商店审核,展示了GLM-5在复杂系统工程中端到端交付可部署产品的能力。

通用智能体助手场景中,在OpenClaw(一款可以部署在个人电脑上的AI代理)中接入GLM-5,用户可以拥有一个智能的“实习生”,帮助搜索网站、定时整理资讯、发布推文、编程等。智谱推出了AutoGLM版本的智能体OpenClaw,与一款协同办公软件实现一体化配置,短短几分钟即可极速部署专属7×24小时智能助手。GLM-5较强的智能体工具调用能力,使其成为通用智能体助手的理想基座模型。

编程工具ZCode全流程编程场景中,用户只需把需求说清楚,模型会自动拆解任务,多智能体并发完成代码、跑命令、调试、预览和提交等开发全流程。在ZCode上,用户甚至可以用手机远程指挥桌面端智能体,解决以往需要很久的工程任务。值得一提的是,就连编程工具ZCode也是全程由GLM模型参与开发完成。

办公文档直接输出场景中,在Z.ai和智谱清言上,用户可以让GLM-5直接输出产品需求文档、教案、试卷、电子表格、财务报告、流程表、菜单等。GLM-5拥有更强大的复杂系统工程和长程智能体能力,可将文本或素材直接转换为docx、pdf和xlsx文件。

代码能力取得开源模型最高分数

GLM-5在编程能力上实现了对齐美国Anthropic公司的ClaudeOpus4.5,在业内公认的主流基准测试中取得开源模型SOTA(当前最高水平)。在基准测试SWE-bench-Verified和Terminal-Bench2.0中分别获得77.8和56.2的开源模型最高分数,性能超过谷歌公司的模型Gemini3Pro。

智谱相关负责人介绍说,2026年大模型将会从“会写”走到“会做事”,尤其是端到端完成大型任务。GLM-5是一个“系统架构师”,不仅为开发精美的Demo(原型)而生,更为稳定交付生产结果而生。在内部ClaudeCode(终端AI编程助手)评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7(平均增幅超过20%),能够以极少的人工干预自主完成智能体长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近ClaudeOpus4.5。

智能体能力取得多个开源第一

GLM-5在智能体能力上实现开源SOTA(当前最高水平),在多个评测基准中取得开源第一。在联网检索与信息理解、大规模端到端工具调用以及复杂场景下自动代理的工具规划和执行等方面,均取得最高表现。

在衡量模型经营能力的VendingBench2中,GLM-5获得开源模型第一表现。VendingBench2要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5最终账户余额达到4432美元,经营表现接近ClaudeOpus4.5,展现了出色的长期规划和资源管理能力。

智谱相关负责人解释说,这些能力是智能体工程的核心,模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系,成为真正的基座模型。

更大基座提供更强智能

智谱GLM-5模型全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础。

模型参数实现了规模扩展,从355B(B即Billion,意为十亿)(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,更大规模的预训练算力显著提升了模型的通用智能水平。构建了全新的“Slime”框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力。首次集成DeepSeekSparseAttention(稀疏注意力机制),在维持长文本效果无损的同时,大幅降低模型部署成本,提升Token(词元)有效性。

记者了解到,智谱GLM-5模型在代码和智能体上取得突破,国产算力芯片成为重要支撑。智谱相关负责人表示,此前,GLM系列模型受到全球开发者喜爱,在GLMCodingPlan套餐全球爆量后,智谱不得不启动限售措施。本次GLM-5的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

目前GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

记者 倪恒虎

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1923年,婉容让孙耀庭伺候沐浴,她解开衣衫,孙耀庭:奴才肚子痛

1923年,婉容让孙耀庭伺候沐浴,她解开衣衫,孙耀庭:奴才肚子痛

浩渺青史
2026-02-11 15:12:31
中国最丰满的5位女星,美的各有千秋,她们的身材也太犯规了

中国最丰满的5位女星,美的各有千秋,她们的身材也太犯规了

观察者海风
2026-02-07 14:48:53
谭旭光,履新央企

谭旭光,履新央企

上观新闻
2026-02-13 21:22:04
为泰党宣布联手泰自豪党组阁,力挺阿努廷出任总理

为泰党宣布联手泰自豪党组阁,力挺阿努廷出任总理

时尚的弄潮
2026-02-13 21:56:13
橙子再次被发现!医生发现:高血压患者常吃橙子,或出现4种变化

橙子再次被发现!医生发现:高血压患者常吃橙子,或出现4种变化

小胡军事爱好
2026-02-08 22:34:31
39岁泰国思蕊梵公主自爆已经患癌2年,自己积极乐观,美丽大方

39岁泰国思蕊梵公主自爆已经患癌2年,自己积极乐观,美丽大方

笑傲春秋
2026-01-27 13:58:30
山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了!

山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了!

观察鉴娱
2026-02-01 15:02:49
长沙“互啃”后续:没实锤,婚离了!中年人的体面,真输不起!

长沙“互啃”后续:没实锤,婚离了!中年人的体面,真输不起!

王楔晓
2026-01-08 11:31:21
外交部:中美元首通话中 特朗普总统再次表达了4月访华的愿望

外交部:中美元首通话中 特朗普总统再次表达了4月访华的愿望

财联社
2026-02-12 15:26:07
下套不成反被将一军,共和党拒绝公开听证会,克林顿夫妇不忍了

下套不成反被将一军,共和党拒绝公开听证会,克林顿夫妇不忍了

生活魔术专家
2026-02-14 00:20:31
重磅!投资85亿!湖北首条十车道高速获批!

重磅!投资85亿!湖北首条十车道高速获批!

牛锅巴小钒
2026-02-13 14:23:20
1942年,一位渔夫载着16名日军渡江,到江中心他突然跳进了水中

1942年,一位渔夫载着16名日军渡江,到江中心他突然跳进了水中

浩渺青史
2026-02-10 13:31:21
78岁郑少秋丧女两年至今神隐,汪明荃也难联络,曾给许绍雄送花牌

78岁郑少秋丧女两年至今神隐,汪明荃也难联络,曾给许绍雄送花牌

查尔菲的笔记
2026-02-12 19:25:00
日本的苦日子,还在后面

日本的苦日子,还在后面

六爷阿旦
2026-01-20 17:07:06
不再隐瞒!多年无子的舒淇终于承认:我们不是丁克,是生不出来

不再隐瞒!多年无子的舒淇终于承认:我们不是丁克,是生不出来

不写散文诗
2026-02-12 12:37:04
久久等不到中国贺信,高市用4个字定义对华方针,日本将妥善应对

久久等不到中国贺信,高市用4个字定义对华方针,日本将妥善应对

胡同里有只猫A
2026-02-12 19:22:01
李嘉诚旗下长和最新发布:遭巴拿马政府步步进迫,意图强制接管港口,港口能否继续营运不在公司控制范围内

李嘉诚旗下长和最新发布:遭巴拿马政府步步进迫,意图强制接管港口,港口能否继续营运不在公司控制范围内

每日经济新闻
2026-02-12 19:42:07
i茅台上抢不到,年轻人去山姆囤飞天

i茅台上抢不到,年轻人去山姆囤飞天

19号商研社
2026-02-13 08:04:33
证监会:将继续坚持“追首恶”与“打帮凶”并举 严厉打击此类违法违规行为

证监会:将继续坚持“追首恶”与“打帮凶”并举 严厉打击此类违法违规行为

财联社
2026-02-13 17:02:11
伊朗真正的博弈,不在华盛顿,而在革命卫队内部!

伊朗真正的博弈,不在华盛顿,而在革命卫队内部!

时事话评
2026-02-12 17:47:45
2026-02-14 01:44:50
呼呼历史论
呼呼历史论
分享有趣的历史
480文章数 16312关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

头条要闻

8千元的迷你小马一夜爆火 马主:1天排泄次数达十几次

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

大衣哥女儿风光出嫁,农村婚礼超朴素

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

健康
本地
家居
游戏
艺术

转头就晕的耳石症,能开车上班吗?

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

家居要闻

中古雅韵 乐韵伴日常

癫疯之坐!今年年夜饭批准坐在黄金马桶上吃

艺术要闻

砸25亿,中原第一高楼绿地造,坐标郑州!

无障碍浏览 进入关怀版