网易首页 > 网易号 > 正文 申请入驻

智谱大模型引爆论坛!团队分享GLM-4.7走红背后的一切

0
分享至


作者 | 木子,高允毅

前两天,正在冲刺“大模型第一股”的智谱打响了上市前哨战:直接端出并开源了全新大模型 GLM-4.7

这个 GLM-4.7,一举刷新多项 SOTA:它是目前国内最强 Coding 模型、最强国产模型;而且审美和情商都很在线,吸引了大波技术圈和非技术人才(比如设计师)前来围观。

还在 LM Arena 的 WebDev 榜单(大模型真实前端 / Web 应用开发能力测评)里,夺下最强开源模型之位,超过 GPT-5.2 和 Claude-Sonnet-4.5。


另外,还登上了 Hugging Face 模型榜榜一。


北京时间 12 月 24 日,GLM-4.7 背后的智谱 Z.AI 团队首次对其作出公开回应,他们在 Reddit 上开展了一场 AMA(Ask Me Anything,有问必答)活动,直面众网友的犀利问题。


其中,Z.AI 团队集中“现场答疑”的时间就长达 3 小时,吸引超过 800 人次互动;另外他们还会在随后的 48 小时内继续做“事后补答”

整场问答的信息量爆炸,Z.AI 团队主要回复可概括为:

  • 智谱上市信息

  • 会不会单独做专门的编程模型

  • GLM-4.7 的交错式思维,为什么能保持逻辑一致

  • 模型 UI 审美能力是怎么练出来的

  • GLM-5 什么时候来、还有 # 哪些新产品在路上 ……

回应了哪些要点?

GLM-4.7主打编程与代理式任务(coding + agentic tasks)的提升,同时在推理能力等方面也有所增强。

这里就按关键问题分类,先来具体看看智谱 Z.AI 团队对 GLM-4.7 分享了哪些“猛料”。

模型性能

首先,网友们最关心的问题就是模型本身的性能为什么会有如此飞跃?

智谱团队表示,为了把模型打磨到“更能干活”的状态,他们在后训练部分做了不少关键调整。


智谱在 SFT(监督微调)+ RL(强化学习)阶段,采用了更精细的发布配方(release recipe)

  • 先把不同来源的数据按合适比例搭配,再把互相矛盾的数据删掉;

  • 需要重点提升某个短板时,尽量只在局部做小幅调整,避免牵一发动全身;

  • 最后再反复用测评做验收,把提升做得更稳、更全面。

此外,智谱还分享了他们一整套的预训练数据流程


  • 从收集开始,逐层做清洗、去重和质量筛选,把噪声和水分尽量挤掉;

  • 不同领域再上不同规则,代码、数学、科学各自用各自的筛选标准;

  • 更关键的是,哪些数据值得进大训练不是拍脑袋决定,而是先在同架构的小模型上做消融验证,只有能带来稳定正增益的部分才会被纳入。

这套流程下来,大大提升数据的有效性。

还有网友上来就直言不讳:GLM-4.7 的编程能力部分到底擅长做什么,短板在哪


智谱的研发团队直接给了明确答案,它主要提升在真实软件工程、会用终端干活,以及 Vibe Coding 的整体体验上

如果在环境很清楚、结果好验证的情况下,比如在常见项目里找 bug、修 bug,GLM-4.7 的表现最稳。但如果是它不熟的框架、从零做全新功能,可能会因为“见得不够多”而掉链子。

对此,智谱研发团队表示未来,他们会继续提升模型的前端和后端能力,并进一步强化长任务、多步骤场景下的稳定性


而让 GLM-4.7 在复杂任务里“更能想清楚再动手”的关键,背后其实离不开 GLM-4.7 在推理机制上的重大创新,智谱推出了“交织式思考(Interleaved Thinking)+ 保留式思考(Preserved Thinking)+ 轮级思考(Turn-level Thinking)”

其中“交织式思考”,团队把它形容为“改进版思维链”。可以理解为智谱把思维链从“一次性想完再行动”升级为“每一步都先想再做”,无论是对话输出还是工具调用,都会先推理再执行。

而 GLM-4.7 的“保留式思考”,可以保证多步任务不跑偏,把关键中间思路延续到后续步骤,从而提升行动一致性与任务完成度。


还有一个很多人关心的点,就是GLM‑4.7 的落地使用情况。智谱团队表示,他们在Claude Code这一套智能体框架上投入了大量优化与适配。


从实际表现看,GLM‑4.7 的多语言编程能力很突出:除了 Python、JavaScript 这类常见语言外,在一些相对小众的语言、以及更复杂的工程结构与逻辑链路上,也能保持较强的理解和处理能力。

团队同时强调,智能体框架本身对最终效果的影响可能达到约 30%。因此他们围绕智能体的关键环节,比如系统提示词,以及工具调用层级设计,做了更深度的打磨,以提升复杂任务下的稳定性与成功率。

除了编程外,GLM-4.7 最让人印象深刻的还有它在UI 审美上逆袭,不少网友好奇为什么他们前端一下子变“好看”了。


智谱对此做了解释,原来他们有一个专攻“前端技能”的网页开发团队,在数据和训练方法上升级了

他们先收集高质量审美在线的网页案例做训练集,再用一套视觉语言模型(VLM)接进数据流水线,硬把 UI 审美练上去了,直接出成品。

此外,GLM-4.7 在角色扮演方面,也有了更好的沉浸感。

在如何把握“创作自由”和“安全过滤”间,智谱找到了自己的度。不是一刀切地加过滤,而是把“安全”做得更像后台机制,风险要兜住,但前台尽量不打断体验。


未来计划

在模型性能之外,GLM 系列未来往哪走也是网友们的热议话题。

在 GPU 资源紧张的大背景下,有人抛出现实拷问,会不会因为算力和内存成本,卡住模型研发节奏?

智谱的回应相当务实,模型设计关键是训练成本和部署成本如何让模型在有限参数下追求极致性能,并且更便宜,更好部署,一直是智谱在思考的地方。


至于版本节奏方面,团队也给了一个颇有悬念的回答,不排除直接跳过 4.8、4.9,憋一波更大的升级,GLM-5 或在路上


对于 2026 年智谱还会有哪些惊喜,不少网友直接将评论区当成许愿池,有人希望有原生多模态,或者更轻量的版本,或者更强的编程能力。



对此,智谱没有正面展开,只留下一个信号,大招会有,但暂时保密,智谱一直在追求 AGI 的路上

但与此同时,智谱还丢出了个“彩蛋”:一款名叫 “Zcode ”的新 IDE 正在路上

团队透露,他们日常已经在用 Zcode 和 GLM‑4.7 搭配开发,它不只是让模型写代码这么简单,而是能同时开多路智能体并行干活:一边跑数据处理,一边做代码审查,再开一路专门盯调试排错,就像把一个小型 AI 研发小组塞进了开发环境里


目前,Zcode 可以无需梯子,能直接使用 Claude Code 并且一键接 API。


他们还贴心地推荐了配套工具 Zread,主打啃超大代码库,快速理清项目结构和关键链路。简单说就是,Zcode 负责写,Zread 负责读,组合起来更像完整的工程助手。

开源普惠

在开源这条路上,智谱一直备受社区认可。此次,智谱又带来了新的惊喜,曝光了他们的强化学习框架“Slime”

Slime 干的事很明确,让大模型像“刷题”一样不断做任务,系统负责自动“收作业”、给出反馈,再把反馈用于下一轮训练迭代。

换句话说,它把原本零散、强依赖人工经验的强化学习流程,做成一条可持续运转的训练流水线。

尤其在训练写代码这类模型时,Slime 能把“生成—执行—测试—反馈”并行铺开,大幅拉高训练效率,让强化学习不再只是“能跑通实验”,而是可以长期、规模化地跑下去。

更重要的是,这类框架一旦开源,它贡献的不只是某个模型的技巧,而是一套可复用的工程方法“怎么把模型练成能干活的智能体”。对很多团队来说,这比单纯开一个权重更有意义,它直接降低了从零做智能体和强化学习的工程门槛。


也有人担心,随着智谱推进上市,未来会不会因此收紧开源节奏、改变策略。

对此,智谱团队的回应很明确:冲刺 AGI 的方向不会变,开源也不会缺席,两条路都会一直走下去。


最后,还有人现场应聘,智谱团队也给出了他们认为一个大模型工程师的标准,在研究能力之外,他们非常看重“工程技能”,毕竟,能快速、高效的解决问题,才是王道。


审美超绝,

3D 交互感飞跃

前文提到,GLM-4.7 刷新了多项基准测试的 SOTA,除了硬指标,GLM-4.7 的输出审美和“情商”也比上一代有大幅提升。

下面通过智谱官方和 InfoQ 的实测 Case,看看它具体表现如何。

点开智谱 Z.ai 提供的大模型在线使用界面,可以一眼看到对话栏下面的几个功能选项。


首先来试试前端开发功能,我们点开“全栈开发”,然后惊喜地发现,几句话就能让 AI 搓出一局完整的植物大战僵尸

先用一段官方参考 Prompt:

“请基于当前目录准备的素材(下载 https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp3 当作游戏音乐, 下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目录下的各类植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),做一个《植物大战僵尸》游戏。

BGM 一响,熟悉的节奏直接把人拉回当年:草坪铺开、阳光掉落、种下植物,然后僵尸进场,发射豌豆等操作一气呵成,节奏和手感都对得上。


然后我们还能在生成效果的基础上,继续输入自然语言的 Prompt,让其做调整:

“其中向日葵每6秒生成一个Sun.gif,一个Sun.gif有25阳光值;豌豆射手的攻击力太低了,改为原来的2倍;一共有20只僵尸,最后10只僵尸从5条路同时进攻,击败所有僵尸即成功,并显示游戏成功页面”

一局完整的 PVZ 游戏效果如下:

连《植物大战僵尸》这种高交互小游戏都能搓出来,那回到更常规的网页开发场景,GLM-4.7 的表现更是可谓“信手拈来”。

比如,要生成一个普通 HTML 网页,在 GLM-4.7 中基本能一句话搞定,而且比起上一代生成的布局结构更清晰、组件风格也更统一,大大减少后期微调时间。而且还能覆盖多种风格,从简约、复古到时尚等应有尽有。


除此之外,做一个基于 Web 的交互式体验页面(Interactive Web Experience)也是不在话下。

GLM-4.7 做的 UI 完成度很高,动效衔接自然,层级清晰,3D 交互的纵深感和层次感都做得相当到位。


除了前端,GLM-4.7 体现出的高级审美能力,还在“艺术作品”的 3D 展示中带来质的飞跃。

它在空间层次、透视关系上处理得很清楚,同时在配色、材质对比、景深和构图上也下了功夫;该亮的地方亮,该收的地方收。

举个例子,给它这样一段 Prompt:

“设计一个精细打磨的体素风(voxel-art)环境,在充满生机的花园中呈现一座装饰华丽的宝塔。 场景中需要包含丰富多样的植被,尤其是樱花树,并确保整体构图生动、色彩鲜明、具有强烈的视觉冲击力。 你可以使用任意体素或 WebGL 相关库,但请将整个项目以一个完整、可独立运行的 HTML 文件形式交付,我可以直接粘贴并在 Chrome 中打开。”

GLM-4.7 的完成效果让人眼前一亮,既有体积像素的 3D 感,又美观和谐,还自动加入了旋转视图功能。


另外,在幻灯片制作上,GLM-4.7也明显“好看了”。

PPT16:9 的适配率从 52% 提升至 91%生成的页面布局更准确、元素比例更舒服,整体观感更接近一份可以直接拿去用的成品。


这样的审美同样体现在海报设计上,排版与配色更加灵活,具备设计感,基本达到可以直接商用的效果。


同样设计以“巴黎”为主题的海报,GLM-4.7 明显从配色和排版上更胜一筹,懂得突出主题,注意文字比例和位置,图片的镶嵌和配色,而不是死板的罗列排布。


图注:左侧为 GLM-4.7 生成效果,右侧为 GLM-4.6 生成效果

总而言之,智谱现在把看家本打包亮相,团队想交出的不只是一个模型版本,而是一条更清晰的路线,让模型的能力在真实世界里顺利地跑起来、跑得稳。

虽然真正的 AGI 道阻且长,但智谱团队表示:

“我们准备为 AGI 之路做出更实质性的贡献”。

传送门:

https://chat.z.ai/

https://www.reddit.com/r/LocalLLaMA/comments/1ptxm3x/ama\_with\_zai\_the\_lab\_behind\_glm47/

https://z.ai/blog/glm-4.7

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这就是为什么体制内很少发朋友圈的原因

这就是为什么体制内很少发朋友圈的原因

夜深爱杂谈
2026-01-03 21:58:39
警方深夜突查,徐湖平家搜出床单裹国宝,8800万名画竟贱卖6800元

警方深夜突查,徐湖平家搜出床单裹国宝,8800万名画竟贱卖6800元

深析古今
2026-01-03 13:48:46
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
河南南阳一佳人好漂亮, 身高169cm,体重50kg 美的让人移不开眼

河南南阳一佳人好漂亮, 身高169cm,体重50kg 美的让人移不开眼

东方不败然多多
2025-12-25 07:00:37
今冬最冷时间表出炉!1月上旬迎寒潮,今年过年到底冷不冷?

今冬最冷时间表出炉!1月上旬迎寒潮,今年过年到底冷不冷?

复转这些年
2026-01-04 23:52:26
这一次,再多的名和利,也拯救不了副军级职位的阎维文

这一次,再多的名和利,也拯救不了副军级职位的阎维文

阿芒娱乐说
2026-01-02 11:41:22
哈兰德连续3场哑火,恩佐94分钟绝平!曼城1-1切尔西,阿森纳收礼

哈兰德连续3场哑火,恩佐94分钟绝平!曼城1-1切尔西,阿森纳收礼

我的护球最独特
2026-01-05 03:32:29
关于将河南省范县和台前县还给山东省解决范县“飞地”问题的研究

关于将河南省范县和台前县还给山东省解决范县“飞地”问题的研究

笔墨V
2026-01-04 07:02:14
围台演习结束,岛内最新民调出炉,结果令人意外,赖清德被将军

围台演习结束,岛内最新民调出炉,结果令人意外,赖清德被将军

荷兰豆爱健康
2026-01-05 03:36:44
美军或用对付伊拉克的方法,对付中国?一旦开战,卫星肯定不保

美军或用对付伊拉克的方法,对付中国?一旦开战,卫星肯定不保

妙知
2025-12-09 00:16:52
女人退休1年仍在公司食堂用膳,公司突然遇到难处,女人:我来吧

女人退休1年仍在公司食堂用膳,公司突然遇到难处,女人:我来吧

白云故事
2025-08-11 17:05:05
第005期新的澳门最稳内部精准一特资料,六叔公预测最新三中三

第005期新的澳门最稳内部精准一特资料,六叔公预测最新三中三

富汇通金融服务
2026-01-05 01:43:46
美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

心灵短笛
2025-11-14 09:28:10
给2025年最好的10部动作片排个名:《匿杀》第7,《捕风追影》第2

给2025年最好的10部动作片排个名:《匿杀》第7,《捕风追影》第2

皮皮电影
2026-01-04 09:50:59
44岁范冰冰显现老态!新加坡露脸黑了胖了,皮松肉也垮一脸大妈相

44岁范冰冰显现老态!新加坡露脸黑了胖了,皮松肉也垮一脸大妈相

趣文说娱
2026-01-04 16:55:31
晚饭是补蛋白黄金期!医生建议:多吃3款高蛋白晚餐,增强免疫

晚饭是补蛋白黄金期!医生建议:多吃3款高蛋白晚餐,增强免疫

摇感军事
2026-01-02 15:38:29
新加坡炮王船上不行了!赵今麦的手过于粗糙?

新加坡炮王船上不行了!赵今麦的手过于粗糙?

八卦疯叔
2026-01-04 10:59:38
辽宁结束4连败,赛后数据一清二楚 不是外援,他才是赢球最大功臣

辽宁结束4连败,赛后数据一清二楚 不是外援,他才是赢球最大功臣

邹维体育
2026-01-04 21:19:03
俄罗斯“幻梦神婆”预言:血色北极光,十二星,2026 梦碎世界

俄罗斯“幻梦神婆”预言:血色北极光,十二星,2026 梦碎世界

心灵短笛
2025-12-25 11:08:11
西安事变真相:蒋家7侄阵亡护蒋,双方死伤超600,血债被记五十四年

西安事变真相:蒋家7侄阵亡护蒋,双方死伤超600,血债被记五十四年

磊子讲史
2025-12-30 18:03:15
2026-01-05 05:00:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
11902文章数 51680关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

本地
数码
健康
游戏
公开课

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

数码要闻

快科技2025年度评奖:品牌整机篇

这些新疗法,让化疗不再那么痛苦

自走棋火了6年后,我才玩了《王者万象棋》

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版