网易首页 > 网易号 > 正文 申请入驻

比R1快8倍,思考深度还翻倍 - 智谱开源了整套六个大模型(附三大平台,支持推理/沉思/基础模型)

0
分享至

量大管饱!

两周前,智谱才发布了Auto沉思,一个能自己上网干活、多轮搜索、输出万字研究报告的 Agent。

而它背后的这一整套完整的模型链,今天全开源了!无限制使用,实在有太多值得讲的了,

  • 支持高自主工具调用+自我验证的 GLM-Z1-Rumination 沉思模型

  • 价格是 Deepseek R1 1/30 的推理模型 GLM-Z1-Air

  • 速度是 DeepSeek R1 八倍的 GLM-Z1-AirX 推理模型

  • 首个 API 免费的推理模型 GLM-Z1-Flash

还有GLM-4、GLM-4-Flash两个基础模型,覆盖3大平台,体验感拉满。

我们就按照推理、沉思、基础模型三大分类来讲,Here we go!

01|推理模型

按照性价比、速度、普适性,智谱一口气上线了三个推理模型:

GLM-Z1-Air、GLM-Z1-AirX、GLM-Z1-Flash

z.ai这个新网页端里可以体验速度最快的GLM-Z1-AirX,

先来写一个经典贪吃蛇测测效果:

帮我生成一个经典的贪吃蛇游戏

提示语很简单,不给额外信息,让模型自己脑补。

Z1-AirX

R1

AirX 一轮直出成功运行,R1 直出的贪吃蛇会因为初始化位置设置在(0,0)导致一开始会 Game Over,在第二轮对话的时间修复了自身碰撞检测逻辑。

横向对比了一下两个模型的效果,AirX 有更好的引导提示,一局结束后可以用空格重启游戏,并且除了得分外,还做了实时长度统计,最后就是蛇的速度比较合理,R1做出来的蛇移动太快,基本上吃不到5个苹果就 GG了。

除了z.ai,我们在bigmodel.Cn里照样可以体验模型,更重要的是可以获取 API Key。

Z1-Air的调用价格是 R1 的1/30,Z1-Flash 更离谱,直接免费调用。

我第一时间就觉得这一刻的到来是为了AI翻译而生,日常受限调用额度,都是普通模型翻译不好再切换到推理模型。

现在不需要了,

直接人手一个!

这里我用到的划词软件是 Bob,跟沉浸式翻译一样都原生支持 GLM 的服务,只需要在 bigmodel 获取模型名字和 api key之后,就可以直接上手了。

GLM-Z1-Air、GLM-Z1-AirX 的大小都是32B,性能媲美671B参数的满血版R1,有较强的数理推理能力。Z1-Air 每百万tokens是0.5元、高速版 AirX 是5元。

同系列还有一个更小的宝藏模型GLM-Z1-9B-0414,在数学、代码、科学、通用问答领域上超过了蒸馏R1出来的DeepSeek-R1-Distill-Qwen-7B/14B

02|沉思模型

与一般推理模型不同,沉思模型GLM-Z1-Rumination通过更多步骤的深度思考来解开放性的复杂 问题。直接上一个例子来看就很清晰了:

我需要一个从4月15日至23日,从北京出发的7天日本行程,预算为2500-5000美元,这是我和我未婚妻的旅行。我们喜欢历史遗迹、隐藏的宝藏和日本文化(剑道、茶道、禅修)。我们想看奈良的鹿,并步行探索城市。我计划在这趟旅行中求婚,需要推荐一个特别的地点。请提供一个详细的行程和一个简单的HTML旅行手册,包含地图、景点描述、必备的日语短语和旅行提示,以便我们在旅途中参考。

这个问题从 Manus 开始到现在已经算是一个经典难题了,是一个跨时间、预算、地点、位置的行程规划。

从GLM-Z1-Rumination思考过程出发,它的整体结构是自主提出 问题->搜索信息->构建分析->完成任务,前后搜索了14次,收集了140个网页,最终输出了一篇5000字左右的旅游攻略。

最后还将整个旅途中要去的地点做成了HTML旅行手册,比起一般的AI搜索,思考20s,给出千字概述,沉思会反复琢磨,每次先思考个5-20s,然后去搜索验证自己的想法后,继续执行计划。

这个行为可太像我写论文的时候了。

03|基础模型

最后来测测看基础模型,

目前我对基础模型的要求是写单个文件的编码能力,够强才可以跟推理模型形成链路。编写多个文件的复杂需求上推理,我可以先做别的,等上十几分钟。但面对需求比较确定的单文件来说,我还是更喜欢直观的来回对话。

这次智谱上线的基座模型提供两个版本:GLM-4-Air-250414GLM-4-Flash-250414,部分 Benchmark 指标已接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。其中GLM-4-Flash-250414也是完全 Free。

所以我用它来写了一个模拟小球运动的程序:

编写一个 Python 脚本,直观地模拟五个不同颜色的球在多个嵌套的旋转六边形中动态弹跳。每个六边形都以不同的速度旋转,创造出好看的图案。除了最外层的六边形外,所有嵌套的六边形都必须有一个随机选择的缺壁,这样球才能在内外六边形之间无缝通过。小球最初从最内侧的六边形开始。通过结合重力、摩擦力和角动量来实现逼真的物理效果,确保小球与旋转墙壁之间的互动自然而令人信服。提供可调节的重力强度、摩擦力大小、旋转速度和六边形尺寸参数,以便于实验模拟的动态效果。特别注意小球与旋转墙之间的碰撞,以确保准确性和真实性。使其最小化

刚好隔壁 GPT4.1 也能用了,干脆来横向对比一下效果:

再来看基础模型 GLM-4-32B 跑出来的效果:

物理规律做的还可以,效果是高于 GPT-4.1-nano 的。

顺带一提,OpenAI在刚刚发布的 GPT4.1 系列模型中评测其函数能力时采用了ComplexFuncBench,这是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。目前GPT4.1得分目前不足 70。

我特意去看了一下,

ComplexFuncBench 主要评测的是大模型在 128K 长上下文下进行多步带约束的函数调用的能力,更贴合真实场景,能有效引导智能体的开发。

最后来做一个可视化网页,纪念一下这次更新,

跟之前的 case 比起来,GLM-4-32B 还追加了在线图标,用 mermaid 画出了完整的模型训练流程,还手搓了个移动端机器学习平台和函数绘图板,也是主打一个量大管饱,测case测到停不下来。

智谱还在C!

我以为的开源年一个月一次开源,

实际的开源年是一个月开源六个模型。。。

当我们还在讨论"开源是否影响商业化"时,

智谱给出了版本正答:

开源不是终点,而是新的起点。

这恰好与今日另一则重磅消息对照上了,

智谱正式启动A股首次公开募股流程,成为首家启动IPO的大模型创业公司。

我们正在见证历史,

每一个开源模型都是通往AGI的铺路石,

而智谱证明了,

大模型的未来,

从来都不是独行者的游戏,

而是开源生态的星辰大海。

@ 作者 / 卡尔 & 阿汤@ 动手学AI知识库 / learnprompt.pro

最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论更多的内容正在不断填坑中……

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
吕良伟老婆原来是她,高材生曾是深圳商会会长,难怪婚姻能够美满

吕良伟老婆原来是她,高材生曾是深圳商会会长,难怪婚姻能够美满

点燃好奇心
2026-02-22 23:45:58
16GB+1TB!新机官宣:3月1日,即将发布上市!

16GB+1TB!新机官宣:3月1日,即将发布上市!

科技堡垒
2026-02-22 12:01:35
美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

蜉蝣说
2025-12-01 11:20:58
全球只有5位领导人被永久保留遗体,他们都是谁

全球只有5位领导人被永久保留遗体,他们都是谁

扶苏聊历史
2026-01-29 16:13:42
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

青烟小先生
2026-01-31 19:10:22
四年烧光几个亿,一家AI医疗倒闭!创始人泣血警告:行业现金流难以持续

四年烧光几个亿,一家AI医疗倒闭!创始人泣血警告:行业现金流难以持续

智药局
2026-02-22 18:15:46
郑州10岁男孩8万压岁钱被父亲偷偷取走,用于再婚开销,男孩无奈起诉,法院:全额返还存款及利息

郑州10岁男孩8万压岁钱被父亲偷偷取走,用于再婚开销,男孩无奈起诉,法院:全额返还存款及利息

极目新闻
2026-02-20 17:01:59
上海将迎大降温,这类致命疾病易高发,春节里医院已有抢救病例……

上海将迎大降温,这类致命疾病易高发,春节里医院已有抢救病例……

上观新闻
2026-02-22 20:49:05
斯诺克最新排名:赵心童10-7夺冠,飙升至第4,希金斯第5!

斯诺克最新排名:赵心童10-7夺冠,飙升至第4,希金斯第5!

老壥说体育
2026-02-23 06:45:56
新一轮楼市风暴,又要开始了!

新一轮楼市风暴,又要开始了!

巢客HOME
2026-02-22 09:50:05
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
固态电池落地+天神之眼5.0全推,这波“王炸”更新背后藏着哪些坑

固态电池落地+天神之眼5.0全推,这波“王炸”更新背后藏着哪些坑

三农老历
2026-02-23 01:21:49
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
俄乌打了三年,打穷了三个国家,富了三个国家,中国也在其中

俄乌打了三年,打穷了三个国家,富了三个国家,中国也在其中

青烟小先生
2026-02-19 19:14:06
曝曾凡博徐昕将落选最终名单,大战在即:郭士强还是信赖自己人

曝曾凡博徐昕将落选最终名单,大战在即:郭士强还是信赖自己人

姜大叔侃球
2026-02-22 17:10:13
镜报:加纳乔与网红洛巴兹在埃及度假数日,住在同一个房间

镜报:加纳乔与网红洛巴兹在埃及度假数日,住在同一个房间

陈意小可爱
2026-02-23 03:26:06
夫妻都夺冠拿2块冬奥金牌,徐梦桃夫妇拿多少奖金?郭晶晶家豪气

夫妻都夺冠拿2块冬奥金牌,徐梦桃夫妇拿多少奖金?郭晶晶家豪气

乐悠悠娱乐
2026-02-21 13:15:00
兰杜奇:球队拼尽了全力但运气太差了,所有不顺都凑到了一起

兰杜奇:球队拼尽了全力但运气太差了,所有不顺都凑到了一起

懂球帝
2026-02-23 07:17:11
我在迪拜工作时,不小心摘下穆斯林女子头纱,她给了我3个选择

我在迪拜工作时,不小心摘下穆斯林女子头纱,她给了我3个选择

千秋文化
2026-01-06 21:28:59
连遭暴击!日本,彻底慌了!

连遭暴击!日本,彻底慌了!

大嘴说天下
2026-02-21 20:40:42
2026-02-23 08:11:00
卡尔的AI沃茨 incentive-icons
卡尔的AI沃茨
前大厂算法工程师,3家科技公司技术总监|致力打造最系统的Al学习体系,让1万人通过Al提高生产力
218文章数 101关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

特朗普彻底炸毛 大骂反对关税六名大法官是"国家耻辱"

头条要闻

特朗普彻底炸毛 大骂反对关税六名大法官是"国家耻辱"

体育要闻

谷爱凌:6次参赛6次夺牌 我对自己非常自豪

娱乐要闻

谷爱凌:真正的强大 敢接纳生命的节奏

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

家居
健康
本地
房产
时尚

家居要闻

本真栖居 爱暖伴流年

转头就晕的耳石症,能开车上班吗?

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

50+女人更适合基础款,掌握3个高段位搭配思路,轻松提升品味

无障碍浏览 进入关怀版