网易首页 > 网易号 > 正文 申请入驻

“大模型第一股”打响上市前哨战!智谱GLM-4.7 刷新开源编程SOTA,修复代码、终端操作表现超Claude 4.5

0
分享至


作者 | 木子、高允毅

正在冲刺大模型第一股智谱,今天又拿出了诚意满满的新一代大模型GLM-4.7,还给开源了


GLM-4.7主打编程与代理式任务(coding + agentic tasks)的提升,同时在推理能力等方面也有所增强。

众所周知,今年的大模型,已经从卷“会答题”发展成了卷“能干活”。对应的变化,也体现在评测体系上,这些测试覆盖了真实代码修改、终端操作、多工具调用以及长链路任务执行等场景。

智谱也是把 GLM-4.7 一口气送进了 17 项基准测试,和 GPT-5、Claude Sonnet 4.5、Gemini 3.0 Pro、DeepSeek-V3.2、Kimi K2 Thinking 等同台竞技。

然后在一众强劲对手中,GLM-4.7 还在两项 BenchMark 中刷新了公开 SOTA:在AIME 2025(测试高级数学推理能力)中正确率已达 95.7%;在BrowseComp-ZH中分数达 66.6%。


另外,它在SWE-bench-Verified得分 73.8%,在LiveCodeBench V6得分 84.9%,超过 Claude Sonnet 4.5,刷新了两项开源 SOTA


UI 质量飞跃,来看看具体 Case

仅凭 BenchMark 的高分或许还不够有说服力,智谱官方也放出了一系列 Case,来直观展示 GLM-4.7 的实用效果如何

首先,是前端开发

要生成一个普通 HTML 网页,在 GLM-4.7 中基本能一句话搞定,大大减少后期微调时间。

而且比起上一代生成的布局结构更清晰,配色不容易冲突,组件风格也更统一;而且还能覆盖多种风格,从简约、复古到时尚等应有

除了普通 HTML,做一个基于 Web 的交互式体验页面(Interactive Web Experience)也是不在话下。

比如用同一段 Prompt:


给前一代 GLM-4.6,生成效果是这样的:


而给 GLM-4.7 生成的 UI 质量就提升了一大截,比如其动态效果和 3D 交互感都明显增强了。


GLM-4.7 体现出的高级审美能力,还在“艺术作品”的 3D 展示中带来质的飞跃。

它在空间层次、透视关系上处理得很清楚,同时在配色、材质对比、景深和构图上也下了功夫;该亮的地方亮,该收的地方收。

比如要生成一个花园空间,中间是一座装饰华丽的宝塔,周围被盛开的樱花树包围,GLM-4.7 的作品既有体积像素的 3D 感,又美观和谐。


另外,在幻灯片制作上,GLM-4.7 也明显“好看了”

PPT16:9 的适配率从 52% 提升至 91%生成的页面布局更准确、元素比例更舒服,整体观感更接近一份可以直接拿去用的成品。

这样的审美同样体现在海报设计上,排版与配色更加灵活,具备设计感。

同样设计以“巴黎”为主题的海报,GLM-4.7 明显从配色和排版上更胜一筹,懂得突出主题,注意文字比例和位置,图片的镶嵌和配色,而不是死板的罗列排布。

不少网友也对使用效果给出好评,称体验的效果很不错。



也有网友提出,还想看看 GLM-4.7 与最牛编码模型 Opus4.5 之间的比拼。


GLM-4.7 的三种“思考模式”

那么,GLM-4.7 为什么能有这样的进步?

在推理机制上,GLM-4.7 围绕“如何在复杂任务中更稳定地思考与行动”这一核心问题,对模型的思维流程进行了系统性重构。

形成了由“交织式思考(Interleaved Thinking)+ 保留式思考(Preserved Thinking)+ 轮级思考(Turn-level Thinking)”组成的一整套推理机制。

具体而言,交错式思考,指的是 GLM-4.7 在每次响应和工具调用之前都会进行思考。

这其实是自 GLM-4.5 起就引入的基础能力,GLM-4.7 对其进行了强化,使模型在每一次生成回复或调用工具之前,都会先进行内部推理,再决定下一步行动,从而提升指令遵循的准确性和生成质量。

保留式思考,指的是在编码代理场景中,GLM-4.7 能够自动保留多轮对话中的所有思维模块,重用现有推理过程,而不是从头开始重新推导。

这主要用于多回合、长链路任务中,减少了信息丢失和不一致的情况。

最后,轮级思考就是 GLM-4.7 支持对会话内的推理进行逐回合控制,允许在同一会话内按回合决定是否启用推理。

对于简单、低复杂度的请求可以关闭思考以降低延迟和计算成本,而在需要精确决策和稳定执行的任务中再开启完整推理流程。


通过这套“推理组合拳”,GLM-4.7 在复杂任务中的行为表现更加稳定连贯,也更容易控制;这为其在代理式编程和长周期任务执行中提供了关键的技术基础。

智谱冲刺“大模型第一股”

在冲刺“大模型第一股”的前夕,智谱用一次技术密度极高的模型更新,主动把自己推到聚光灯下。

这里再来简单回顾一下智谱的上市细节。

12 月 19 日,港交所官网披露,北京大模型公司智谱已通过聆讯,IPO 招股书同步公开。这意味着,智谱正式迈入上市冲刺的最后阶段。

按招股书口径,公司最新估值为243.77 亿元,中国大模型公司第一次以如此完整的姿态,走到公开市场面前。

从经营数据看,智谱仍处在典型的高速放量阶段。

2022—2024 年,公司收入从 0.6 亿元增长至 3.1 亿元;而真正的拐点出现在 2025 年上半年:2024H1 收入仅 0.4 亿元,2025H1 已跃升至 1.9 亿元,同比增幅超过 300%。

其中,近85% 的收入来自本地化部署,客户覆盖互联网、公共服务、电信和传统企业;MaaS 平台则通过持续降价放大调用规模,2025H1 云端机构客户增至 3061 家,并对本地化部署形成明显引流。

但另一条曲线同样陡峭。招股书显示,智谱的亏损扩张速度远快于收入增长

2022—2024 年及 2025H1,经调整净亏损分别为 0.97 亿元、6.21 亿元、24.66 亿元和 17.52 亿元,几乎全部指向研发投入

同一时期,研发费用从 0.8 亿元升至 22.0 亿元,算力相关支出占比超过 70%。毛利率仍维持在 50% 以上,但在 MaaS 价格战中持续承压。

把时间轴往前拉,这其实是一家成立不到 6 年的公司。智谱成立于 2019 年、脱胎于清华大学知识工程实验室(KEG),是国内最早一批独立大模型公司之一。

GLM 架构起步,它就选择了一条清晰却昂贵的路径:持续把资源押注在模型能力本身。截至 2025 年,其模型已支持约 8000 万台设备、服务超过 1.2 万家机构客户

开源链接:

GitHub:https://github.com/zai-org/GLM-4.5

Hugging Face:huggingface.co/zai-org/GLM-4.7

魔搭社区:https://modelscope.cn/models/ZhipuAI/GLM-4.7

https://z.ai/blog/glm-4.7

https://x.com/Zai_org/status/2003156119087382683

技术人的年度仪式感! 年度盘点与趋势洞察 启动!

《2025 年度盘点与趋势洞察》由 InfoQ 技术编辑组策划。覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。

力求以体系化视角帮助读者理解年度技术演化的底层逻辑、创新方向与落地价值,并为新一年决策提供参考。内容将在 InfoQ 媒体矩阵陆续放出,欢迎大家持续关注。


今日荐文

你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
电磁炮+140垂发!川普官宣"特朗普级战列舰",看图后感叹:太美了

电磁炮+140垂发!川普官宣"特朗普级战列舰",看图后感叹:太美了

离离言几许
2025-12-23 11:14:27
4个月关店11家!昔日超市一哥大润发跌落神坛,到底败在哪?

4个月关店11家!昔日超市一哥大润发跌落神坛,到底败在哪?

普览
2025-12-23 18:51:53
奇葩亲戚朋友的要求有多离谱?网友:这年头还有想吃绝户的

奇葩亲戚朋友的要求有多离谱?网友:这年头还有想吃绝户的

解读热点事件
2025-12-21 00:05:08
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
24GB+1TB!新机曝光:搭载骁龙8 Gen5+2亿潜望长焦!

24GB+1TB!新机曝光:搭载骁龙8 Gen5+2亿潜望长焦!

科技堡垒
2025-12-23 11:31:08
向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

小娱乐悠悠
2025-12-23 14:57:09
又冷又冻的冬天,东北人过得老带派了

又冷又冻的冬天,东北人过得老带派了

新周刊
2025-12-24 09:11:03
南博很可能是背锅的?前院长曾昭燏日记未提1961年鉴定

南博很可能是背锅的?前院长曾昭燏日记未提1961年鉴定

数字财经智库
2025-12-22 12:23:22
恭喜国乒3人!入围2025十大运动员,王楚钦孙颖莎落选,理由如下

恭喜国乒3人!入围2025十大运动员,王楚钦孙颖莎落选,理由如下

运动探索
2025-12-25 09:24:17
火箭真明智!查出静脉血栓,无限期休战,还好交易了他

火箭真明智!查出静脉血栓,无限期休战,还好交易了他

篮球看比赛
2025-12-25 10:54:27
平安夜没有停火,特朗普计划失败,乌克兰的信仰之光不会被扑灭

平安夜没有停火,特朗普计划失败,乌克兰的信仰之光不会被扑灭

山河路口
2025-12-24 13:57:53
陪睡陪玩只是冰山一角!万达蒸发800亿后,王思聪再次传出大丑闻

陪睡陪玩只是冰山一角!万达蒸发800亿后,王思聪再次传出大丑闻

说历史的老牢
2025-12-24 11:43:36
缅北女魔头魏榕:用“珍珠奶茶”折磨女孩,她的恶毒远超你想象

缅北女魔头魏榕:用“珍珠奶茶”折磨女孩,她的恶毒远超你想象

就一点
2025-07-27 13:38:01
《江南春》惊天逆转:国企接盘伪作,神秘买家朱光是谁?

《江南春》惊天逆转:国企接盘伪作,神秘买家朱光是谁?

衔春信
2025-12-25 05:42:47
中国军队回撤时越军为何不追击?越南少将阮德辉回忆:并非不敢打

中国军队回撤时越军为何不追击?越南少将阮德辉回忆:并非不敢打

古书记史
2025-12-22 19:50:50
乒乓球选手不满奖金:世界羽联奖金是24万美元,WTT只有8万

乒乓球选手不满奖金:世界羽联奖金是24万美元,WTT只有8万

懂球帝
2025-12-24 12:26:29
3亿多的荣耀OPPO被偷?京东仓库遭洗劫,内部员工爆料:早有预谋

3亿多的荣耀OPPO被偷?京东仓库遭洗劫,内部员工爆料:早有预谋

乌娱子酱
2025-12-24 14:59:27
胡锡进:《江南春》等几幅流向市场的书画应该归还给庞家

胡锡进:《江南春》等几幅流向市场的书画应该归还给庞家

映射生活的身影
2025-12-24 20:07:27
新任公安局长探访民情,在自家饭店吃饭被“所长小舅子”掀了桌子

新任公安局长探访民情,在自家饭店吃饭被“所长小舅子”掀了桌子

卡西莫多的故事
2025-12-19 11:15:00
你最意外的一笔收入咋来的?网友:扶了个老太太,喜提负二十万

你最意外的一笔收入咋来的?网友:扶了个老太太,喜提负二十万

解读热点事件
2025-12-23 00:05:06
2025-12-25 11:31:01
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1212文章数 107关注度
往期回顾 全部

科技要闻

屠龙少年被"招安"!英伟达平安夜豪掷200亿

头条要闻

媒体:靖国神社强塞韩军人牌位 韩国如何清算是个看点

头条要闻

媒体:靖国神社强塞韩军人牌位 韩国如何清算是个看点

体育要闻

26岁广西球王,在质疑声中成为本土得分王

娱乐要闻

金莎被小19岁男友求婚,成功后拥抱亲吻

财经要闻

美国未来18个月不对中国芯片加额外关税

汽车要闻

预售31.3万元起 全新奥迪Q5L将于1月内上市

态度原创

健康
艺术
数码
公开课
军事航空

这些新疗法,让化疗不再那么痛苦

艺术要闻

何镜堂院士新巨作!砸5亿,江西“头号工程”藏着什么硬核科技?

数码要闻

1799元起!华为MatePad 11.5正式开售 主打护眼学习

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

泽连斯基版“和平计划”透露哪些信息

无障碍浏览 进入关怀版