网易首页 > 网易号 > 正文 申请入驻

智谱IPO敲钟前,连夜把开源编程大模型SOTA了

0
分享至

鱼羊 henry 发自 麦蒿寺
量子位 | 公众号 QbitAI

2025倒计时,新SOTA模型涌现没有放缓迹象。

一夜之间,编程SOTA模型易主,而且上线即开源,依然来自中国大模型公司——

智谱AI,GLM-4.7。



这波更新,技术报告里满眼都是CodingCoding,还是Coding

而能力的提升,带来的最直观效果是:

AIME 25和人类最后考试(HLE)等基准中,GLM-4.7分数超GPT-5.1;

SWE-Bench分数达(73.8%,+5.8%),创开源新高。

官方Demo显示,写个植物大战僵尸不费劲:



总而言之,模型这么一发,双旦的节庆氛围一下到位了(doge)。



官网Chatbot和API均已就位,现在就能在线开玩。

Demo来吧,展示

在前端生成质量上,GLM-4.7展现出明显升级:页面结构更干净、组件层级更清晰。



相比GLM-4.6,更像是现代的Web UI,网友元素中更加美观。





在PPT与视觉物料生成方面,GLM-4.7标题层级明确、元素尺寸更合理。



在复杂几何结构与空间关系的表达上,GLM-4.7模型能够保持较好的结构一致性与细节稳定性。





3D资产的生成质量也有显著提升。





刷新开源SOTA

这次最新的模型主打编程,相较前代GLM-4.6,GLM-4.7在编码能力、交互体验与复杂推理等多个维度实现了系统性升级。



  • 复杂推理能力(Reasoning):全面提升,HLE(含工具)42.8(+12.4 vs GLM-4.6),MMUL-Pro 84.3,GPQA-Diamond 85.7,数学与推理能力更稳更强。
  • 核心编码能力(Code Agent):多语言与终端任务显著增强,SWE-bench Verified 73.8(+5.8)、SWE-bench Multilingual 66.7(+12.9)、Terminal Bench 2.0 41.0(+16.5),支持“先思考、再行动”模式。
  • 工具使用能力(General Agent):工具调用更高效,BrowseComp 52.0(+6.9)、BrowseComp w/ Context Management 67.5(+10.0)、τ²-Bench 87.4(+12.2),网页浏览与工具链管理表现更优。

此外,GLM-4.7在对话、创意写作、角色扮演等场景中同样有提升,系统性增强了编码、推理与工具使用能力。



交错式思考和保留式思考

技术方面,GLM-4.7强化了自GLM-4.5起引入的交错式思考(Interleaved Thinking),并进一步引入了保留式思考(Preserved thinking)和轮级思考(Turn-level Thinking)。

交错式思考

GLM在工具调用之间、收到工具结果之后继续思考。

这让模型能够进行更复杂的分布推理,提升了指令遵从和生成质量:

在决定下一步行动前先解读每次的工具输出,把多次工具调用和推理步骤串联起来,并根据中间结果做出更细粒度的决策。



保留式思考

在编码场景中,GLM-4.7引入了一种新的思考模式:

模型会自动在多回合对话中保留所有思考快,复用已有推理而不是从头重新推理。这减少了信息丢失和不一致性,使得模型更适用于长程、复杂任务。还能在真实任务中节省更多tokens。



轮级思考

轮级思考是一种按轮控制推理计算的能力,即在同一个会话中,每一轮请求都可以独立选择开启/关闭思考。

这使得GLM-4.7具备以下优势:

  • 更灵活的成本/时延控制:对“问个事实/改个措辞”等轻量轮次可关闭思考,追求快速响应;对“复杂规划/多约束推理/代码调试”等重任务轮次可开启思考,提升正确率与稳定性。
  • 更顺滑的多轮体验:思考开关在会话内可随时切换,模型能在不同轮次间保持对话连贯与输出风格一致,让用户感觉“聪明时更聪明、简单时更快”。
  • 更适合Agent/工具调用场景:在需要快速执行的工具轮次可降低推理开销,在需要综合工具结果做决策的轮次再开启深度思考,实现效率与质量的动态平衡。



更多技术详情,智谱官方也附上了详细技术报告。

BTW,智谱这个月还真上了“节日限定优惠”。



每月最低20元即可畅享GLM-4.7,用上Claude Pro套餐3倍用量。



又是一位好价格屠夫呀。



而且GLM-4.7的深夜炸场,也算是已经冲刺IPO上市的智谱,带来的最新技术证明。

目前智谱已经通过了港交所上市聆讯,IPO敲钟仅剩下最后100米。

而GLM-4.7可能也是智谱上市之前,最重要的模型更新了……吧?

[1]https://z.ai/blog/glm-4.7

[2]https://x.com/Zai_org/status/2003156119087382683

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
每体:巴萨拒绝3000万买拉师傅,可能1200-1500万回购比尔希利

每体:巴萨拒绝3000万买拉师傅,可能1200-1500万回购比尔希利

懂球帝
2026-03-26 22:31:51
打压其他球员!除非加入杜锋经纪公司,徐昕是最好的例子

打压其他球员!除非加入杜锋经纪公司,徐昕是最好的例子

篮球大陆
2026-03-26 14:26:19
德黑兰雨夜遭空袭

德黑兰雨夜遭空袭

财联社
2026-03-27 02:02:07
他俩才是最牛岳父母,3个女儿全嫁百亿富豪,一个比一个漂亮厉害

他俩才是最牛岳父母,3个女儿全嫁百亿富豪,一个比一个漂亮厉害

白面书誏
2026-03-26 18:13:05
金融才女朱丽丽:一顿饭百万,八年敛财十四亿终落网

金融才女朱丽丽:一顿饭百万,八年敛财十四亿终落网

大眼妹妹
2026-03-27 01:38:29
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
吵翻热搜!罗永浩邀杨笠上播客被骂,愤怒回怼全网网友

吵翻热搜!罗永浩邀杨笠上播客被骂,愤怒回怼全网网友

雷科技
2026-03-26 14:27:37
美智库:美若出兵拦中国收台,解放军30分钟内能将美军事基地夷平

美智库:美若出兵拦中国收台,解放军30分钟内能将美军事基地夷平

南权先生
2026-03-25 15:28:41
3月26日晚间上市公司重大事项公告

3月26日晚间上市公司重大事项公告

风风顺
2026-03-27 03:15:05
全新塞纳实车曝光!2.4T混动+超250马力

全新塞纳实车曝光!2.4T混动+超250马力

沙雕小琳琳
2026-03-26 01:58:11
2025年湖南省常住人口减少47万人,出生人口连续九年下降

2025年湖南省常住人口减少47万人,出生人口连续九年下降

何亚福
2026-03-26 18:42:00
A股:刚刚,关键信号落地,准备好,3月27日周五将迎来新的变化

A股:刚刚,关键信号落地,准备好,3月27日周五将迎来新的变化

云鹏叙事
2026-03-27 00:00:07
鹅蛋营养价值惊人,发现:常吃鹅蛋的人,不用多久,或有4个改善

鹅蛋营养价值惊人,发现:常吃鹅蛋的人,不用多久,或有4个改善

垚垚分享健康
2026-03-23 17:30:11
浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

独角showing
2025-12-31 21:08:57
乌克兰摧毁俄罗斯最大的基里希炼油厂!俄最大港口持续燃烧

乌克兰摧毁俄罗斯最大的基里希炼油厂!俄最大港口持续燃烧

项鹏飞
2026-03-26 21:13:57
曝张雪峰遗嘱内容,和原配离婚原因被扒,三段感情时间线全曝光!

曝张雪峰遗嘱内容,和原配离婚原因被扒,三段感情时间线全曝光!

古希腊掌管松饼的神
2026-03-26 09:30:58
影视丨何润东涨粉100万,观众开始厌恶了《逐玉》张凌赫为代表的“粉底液将军”审美?

影视丨何润东涨粉100万,观众开始厌恶了《逐玉》张凌赫为代表的“粉底液将军”审美?

忘忧杂话店
2026-03-26 19:22:22
富人的生活能有多夸张?网友:根本找不到心动还门当户对的人

富人的生活能有多夸张?网友:根本找不到心动还门当户对的人

带你感受人间冷暖
2026-03-27 00:05:14
伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

每日经济新闻
2026-03-26 12:20:14
2026-03-27 05:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176425关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
房产
本地
健康
公开课

400万人爱过的女孩,被黄谣网暴180天后

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版