网易首页 > 网易号 > 正文 申请入驻

智谱发布新一代基座模型 GLM-4.5:开源、高效、低价,专为智能体而生

0
分享至



SOTA 级「原生智能体」模型。


作者|连冉

编辑|郑玄


7 月 28 日晚间,智谱发布了其新一代旗舰模型 GLM-4.5。

与早期追求参数规模的竞赛不同,GLM-4.5 的发布重点体现在三个方面:明确面向智能体(Agent)应用的设计、通过技术优化实现的高性价比,以及全面拥抱开源和开发者生态的战略布局。

之前在今年 4 月,智谱就发布了「AutoGLM 沉思」——一个能探究开放式问题,并根据结果执行操作的自主智能体。

今天 GLM-4.5 的推出,不仅是智谱自身模型矩阵的一次升级,也从一个侧面反映出 AI 行业发展的趋势性变化:模型的价值正在进一步加速向解决实际问题、降低应用门槛的方向迁移。

01

为「智能体」而生的模型设计

衡量一个大模型的优劣,综合能力基准评测是业内的通行做法。

智谱此次公布了 GLM-4.5 在一系列评测集上的表现。这份评测涵盖了推理、代码、科学、智能体等 12 个不同维度的基准测试,旨在全面评估模型的综合素质。

根据智谱提供的数据,GLM-4.5 在这些测试中的综合得分位列全球参评模型的第三位,在开源模型中排名第一。


图片来源:智谱

优秀的评测成绩是模型能力的基础,但更值得关注的是其背后的设计理念。GLM-4.5 从一开始就将目标锁定在「智能体应用」。智能体要求模型具备任务理解、规划分解、工具调用和执行反馈等一系列复杂能力,这超出了传统聊天机器人的范畴。

智谱将「在不损失原有能力的前提下融合更多通用智能能力」作为其对 AGI 的理解,而 GLM-4.5 正是这一理念的实践。

为了支撑智能体所需的强大而灵活的能力,GLM-4.5 在技术架构上做出了针对性的选择:


  1. 混合专家(MoE)架构

    GLM-4.5 采用了 MoE 架构,总参数量达到 3550 亿,而单次推理中被激活的参数量为 320 亿。这种架构允许模型在保持巨大知识储备和能力上限的同时,能根据具体任务,只调用部分「专家」网络进行计算。其直接好处是在保证高质量输出的前提下,有效控制了推理成本和能耗,为大规模应用部署提供了可行性。

  2. 双模式运行

    模型被设计为两种工作模式——「思考模式」和「非思考模式」。「思考模式」为复杂的推理和工具调用任务设计,允许模型投入更多计算资源进行深度规划;「非思考模式」则服务于需要快速响应的场景。这种设计兼顾了智能体在执行复杂任务时的「深度」与日常交互时的「速度」,是对实际应用场景需求的细致考量。

  3. 针对性数据训练

    模型的训练过程也体现了其应用导向。在 15 万亿 token 的通用数据预训练之后,团队使用了 8 万亿 token 的高质量数据,在代码、推理、智能体等领域进行了针对性训练,并通过强化学习进行能力对齐。这种「通识教育+专业深造」的训练路径,旨在让模型不仅知识渊博,更在特定专业领域具备解决实际问题的能力。


综合来看,GLM-4.5 并非一个泛泛的通用模型,其技术选型和训练策略都清晰地指向了构建高效、可靠的 AI 智能体这一具体目标,这也反映了智谱对大模型下一阶段应用形态的判断。

02

成本、效率与生态的商业逻辑

性能是技术层面的核心,而成本和生态则是决定一项技术能否被市场广泛接纳的关键。GLM-4.5 在此次发布中,展现了清晰的商业逻辑。

首先是参数效率带来的成本优势。

「参数效率」是评估模型训练水平和架构设计的重要指标,即用相对更少的计算资源实现同等或更优的性能。

智谱方面的数据显示,GLM-4.5 的参数量显著低于部分业界同类模型,但在多项基准测试中表现更佳。在代码能力榜单 SWE-bench Verified 上,其性能与参数量的比值处于帕累托前沿,这证明了其较高的训练和推理效率。

更高的效率直接转化为更低的部署和使用成本。此次公布的 API 定价——输入 0.8 元/百万 tokens,输出 2 元/百万 tokens——显著低于当前市场主流闭源模型的定价水平。配合高速版可达 100 tokens/秒的生成速度,GLM-4.5 为开发者提供了一个兼具高性能和低成本的选择。


图片来源:智谱

其次是降低门槛、构建开发者生态的战略意图。

低廉的价格并非目的,而是吸引开发者、繁荣生态的手段。AI 应用的普及,根本上依赖于开发者社区的创造力。

高昂的 API 费用一直是阻碍许多中小型团队和个人开发者进行创新的主要障碍之一。通过大幅降低价格,能够降低 AI 应用的开发门槛,激发更广泛的创新。

在生态构建上,智谱采取了务实的策略。例如,GLM-4.5 的 API 被设计为可以兼容主流的 Claude Code 框架。这一举措使得已经熟悉该框架的开发者能够以极低的成本将工作流迁移至 GLM-4.5,有效减少了技术选型和切换的阻力。

此外,将模型权重在 Hugging Face 和 ModelScope 等平台遵循 MIT License 进行开源,也体现了其开放的姿态。MIT License 对商业使用限制极少,这为企业和个人基于 GLM-4.5 进行二次开发和商业化应用铺平了道路。

通过「高参数效率」实现「低使用成本」,再以「低成本」和「高兼容性」吸引开发者,从而构建起一个活跃的应用生态——这看起来是一条清晰且务实的商业路径。

03

从功能演示到实际应用的距离

但衡量一个模型最终价值的,仍然是它在真实世界中的表现。

智谱此次展示了多个基于 GLM-4.5 原生能力构建的应用案例,如可交互的搜索引擎、社交媒体网站,以及 Flappy Bird 小游戏等。

这些案例证明,GLM-4.5 模型已经具备了相当程度的全栈开发和工具调用能力,能够理解需求并自主生成可运行、可交互的应用程序。

这些演示作为技术能力的验证是成功的,它们展示了 GLM-4.5 在智能体方向上的潜力。不过从功能演示到稳定可靠的生产级应用,仍然存在一段距离。

在智谱自己公布的真实场景对比测试中,这一点也得到了反映。测试结果显示,GLM-4.5 在编程任务中的表现优于其他参评的开源模型,尤其在工具调用的可靠性方面。

但报告也同时指出,与顶尖的闭源模型 Claude-4-Sonnet 相比,GLM-4.5 在提供近似效果的同时,仍存在一定的提升空间。

这种对比是对当前 AI 技术发展的普遍现状的一种反应:顶尖的开源模型正在快速追赶,但在部分能力上与最前沿的闭源模型相比,尚有差距。

智能体在开放环境中的稳定性、对模糊指令的理解能力、以及在遭遇未知情况时的纠错和适应能力,都是决定其真正成为「可靠的工具」的核心挑战。

智谱此次选择公开评测题目和 Agent 轨迹,邀请行业共同验证和改进,也体现了一种积极和开放的态度。

GLM-4.5 的发布,没有将重点放在参数规模的数字上,而是聚焦于智能体这一明确的应用方向,并通过技术优化和商业策略,为开发者社区提供了一个高性价比的基础平台。

大模型行业正进入更加注重实际应用,更加注重成本效益,也更加注重开发者生态建设的阶段。

接下来,GLM-4.5 的市场表现,以及在其之上能诞生出多少创新的 AI 原生应用,将是检验其成功与否的关键。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你如何看待智谱新一代基座模型 GLM-4.5?

小米眼镜项目负责人:小米 AI 眼镜三年内,目标年出货量超五百万。

点赞关注极客公园视频号,

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女友定了个情侣主题酒店!网友:推开这门,一定有一个哭着走出来...

女友定了个情侣主题酒店!网友:推开这门,一定有一个哭着走出来...

经典段子
2026-01-15 22:37:23
加拿大总理刚到北京,又有两国元首计划访华,特朗普突然喊话中国

加拿大总理刚到北京,又有两国元首计划访华,特朗普突然喊话中国

时时有聊
2026-01-15 15:51:07
老外集体“变中国人”?学喝热水穿拖鞋,网友:第一次当中国人,怪紧张的...

老外集体“变中国人”?学喝热水穿拖鞋,网友:第一次当中国人,怪紧张的...

英国那些事儿
2026-01-15 23:32:23
央行:2025年货币金融政策支持实体经济的效果是明显的

央行:2025年货币金融政策支持实体经济的效果是明显的

每日经济新闻
2026-01-15 15:22:17
方静:一路好好走,前央视主持,涉嫌间谍门被抓,已客死他乡9年

方静:一路好好走,前央视主持,涉嫌间谍门被抓,已客死他乡9年

大眼妹妹
2026-01-15 14:48:17
李某勇(男,1998年出生)被执行死刑!

李某勇(男,1998年出生)被执行死刑!

掌中邯郸
2025-10-10 07:10:51
回顾:2012年山东一对新人蜜月被害,破案后新郎父亲说:怎么是你

回顾:2012年山东一对新人蜜月被害,破案后新郎父亲说:怎么是你

历来都很现实
2024-08-10 21:00:11
一个30岁女人的坦白:不说“想你”,才是想你到极致

一个30岁女人的坦白:不说“想你”,才是想你到极致

加油丁小文
2026-01-08 07:43:15
赵露思透明衬衫惹火!吊带下的雪肌蜂腰,这身材太顶了?

赵露思透明衬衫惹火!吊带下的雪肌蜂腰,这身材太顶了?

娱乐领航家
2026-01-12 22:00:03
有以下“表现”,是女人对你有好感,想跟你进一步发展关系

有以下“表现”,是女人对你有好感,想跟你进一步发展关系

莲子说情感
2025-12-30 19:34:04
国家癌症中心张凯:结直肠癌有望成为第二个被人类“消灭”的癌症|每经人物·大健康

国家癌症中心张凯:结直肠癌有望成为第二个被人类“消灭”的癌症|每经人物·大健康

华庭讲美食
2026-01-15 11:30:14
出线仅1天,中国队连收4个喜讯,李昊官宣女友,复仇乌兹别克有望

出线仅1天,中国队连收4个喜讯,李昊官宣女友,复仇乌兹别克有望

大秦壁虎白话体育
2026-01-15 17:24:14
这辈子要完蛋了!27岁女子失业1年抱头痛哭:不知道该咋办了?

这辈子要完蛋了!27岁女子失业1年抱头痛哭:不知道该咋办了?

唐小糖说情感
2025-11-25 08:51:07
大脑最爱的3种菜,冬天多给孩子吃,有助大脑发育,增强记忆力!

大脑最爱的3种菜,冬天多给孩子吃,有助大脑发育,增强记忆力!

阿龙美食记
2026-01-14 10:53:15
学医后才知道,肺癌前最危险的信号,不是咳嗽,而是这几症状!

学医后才知道,肺癌前最危险的信号,不是咳嗽,而是这几症状!

健康之光
2026-01-14 09:04:19
秋后算账来了。美国严查“赴美生子”,当年钻漏洞的代价异常惨痛

秋后算账来了。美国严查“赴美生子”,当年钻漏洞的代价异常惨痛

鹰视狼顾之天下
2025-12-11 13:42:38
挪威正发出警报:特朗普一旦占领格陵兰,普京将占领斯瓦尔巴群岛

挪威正发出警报:特朗普一旦占领格陵兰,普京将占领斯瓦尔巴群岛

南宫一二
2026-01-15 17:10:17
社评:欧洲会妥协吗?全世界都在看

社评:欧洲会妥协吗?全世界都在看

环球网资讯
2026-01-16 00:00:11
钱小豪“毁灭史”,他的故事比你想得更恶劣

钱小豪“毁灭史”,他的故事比你想得更恶劣

比利
2025-12-21 11:26:52
小舅子群里安排过年聚餐,我秒回:房已卖,正和你姐飞马尔代夫

小舅子群里安排过年聚餐,我秒回:房已卖,正和你姐飞马尔代夫

晓艾故事汇
2026-01-10 09:09:29
2026-01-16 02:55:00
极客公园
极客公园
让最棒的创新成为头条
11722文章数 78748关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

头条要闻

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

92岁陶玉玲去世,冯远征曹可凡悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

手机
数码
艺术
健康
公开课

手机要闻

三星手机屏幕防窥设计曝光,Galaxy AI基础功能永久免费

数码要闻

新一代SU7全系搭载小米V6s Plus超级电机,四大升级公布

艺术要闻

300亿!341米!迪拜将建全球首个奔驰品牌城市

血常规3项异常,是身体警报!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版