网易首页 > 网易号 > 正文 申请入驻

智谱发布新一代开源 AI 模型 GLM-4-32B-0414 系列

0
分享至

IT之家 4 月 15 日消息,智谱昨日(4 月 14 日)发布博文,宣布推出新一代 GLM-4-32B-0414 系列模型,320 亿参数,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列,且支持非常友好的本地部署特性。

该系列模型共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型。

GLM-4-32B-Base-0414

在预训练阶段,该模型采用 15T 高质量数据,其中包含大量推理类的合成数据,这为后续的强化学习扩展打下了基础。

在后训练阶段,除了针对对话场景进行了人类偏好对齐外,团队还通过拒绝采样和强化学习等技术强化了模型在指令遵循、工程代码、函数调用方面的效果,加强了智能体任务所需的原子能力。

GLM-4-32B-0414 在工程代码、Artifacts 生成、函数调用、搜索问答及报告等方面都取得了不错的效果,部分 Benchmark 甚至可以媲美更大规模的 GPT-4o、DeepSeek-V3-0324(671B)等模型。

GLM-Z1-32B-0414

该模型是具有深度思考能力的推理模型,在 GLM-4-32B-0414 的基础上,通过冷启动和扩展强化学习,以及在数学、代码和逻辑等任务上对模型的进一步训练得到的。

相对于基础模型,GLM-Z1-32B-0414 显著提升了数理能力和解决复杂任务的能力。在训练的过程中,该团队还引入了基于对战排序反馈的通用强化学习,进一步增强了模型的通用能力。

GLM-Z1-Rumination-32B-0414

该模型是具有沉思能力的深度推理模型(对标 Open AI 的 Deep Research)。

沉思模型通过更长时间的深度思考来解决更开放和复杂的问题(例如:撰写两个城市 AI 发展对比情况,以及未来的发展规划),结合搜索工具处理复杂任务,并经过利用多种规则型奖励来指导和扩展端到端强化学习训练得到。

GLM-Z1-9B-0414

这是一个开源 9B 小尺寸模型,在数学推理和通用任务中依然展现出极为优秀的能力,其整体表现已处于同尺寸开源模型中的领先水平。

测试结果

GLM-4 系列在多项基准测试中表现优异。例如,在 IFEval 指令遵循测试中得分 87.6;在 TAU-Bench 任务自动化测试中,零售场景得分 68.7,航空场景得分 51.2;在 SimpleQA 搜索增强问答测试中得分 88.1。

模型IFEvalBFCL-v3 (Overall)BFCL-v3 (MultiTurn)TAU-Bench (Retail)TAU-Bench (Airline)SimpleQAHotpotQAQwen2.5-Max85.650.930.558.322.079.052.8GPT-4o-112081.969.641.062.846.082.863.9DeepSeek-V3-032483.466.235.860.732.482.654.6DeepSeek-R184.357.512.433.037.383.963.1GLM-4-32B-041487.669.641.568.751.288.163.8

代码修复方面,GLM-4 在 SWE-bench 测试中的成功率达 33.8%。采用 MIT 许可的 GLM-4 降低了计算成本,为研究和企业提供了高性能 AI 解决方案。

模型框架SWE-bench VerifiedSWE-bench Verified miniGLM-4-32B-0414Moatless[1]33.838.0GLM-4-32B-0414Agentless[2]30.734.0GLM-4-32B-0414OpenHands[3]27.228.0

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
劳力士中国内地开卖官方二手表

劳力士中国内地开卖官方二手表

第一财经资讯
2026-01-10 22:22:24
可怕!断亲戚率高达63%!断亲现象已成为未来趋势

可怕!断亲戚率高达63%!断亲现象已成为未来趋势

另子维爱读史
2025-12-26 16:11:17
她曾是体操冠军,16岁被姜文带进娱乐圈,风流成性,绯闻多如雪花

她曾是体操冠军,16岁被姜文带进娱乐圈,风流成性,绯闻多如雪花

林雁飞
2026-01-11 14:43:11
1-0!0-0!U23亚洲杯一夜两队被淘汰,卡塔尔回家,日本提前出线

1-0!0-0!U23亚洲杯一夜两队被淘汰,卡塔尔回家,日本提前出线

篮球看比赛
2026-01-11 11:33:54
218票赞成213票反对!美投票结果出炉,特朗普态度变了,美军撤退

218票赞成213票反对!美投票结果出炉,特朗普态度变了,美军撤退

剑道万古似长夜
2026-01-10 11:39:02
田朴珺罕见秀恩爱,带王石剪了个新发型年轻不少!5岁女儿像爸爸

田朴珺罕见秀恩爱,带王石剪了个新发型年轻不少!5岁女儿像爸爸

娱乐团长
2026-01-10 11:48:47
央视又押对宝了!《小城大事》收视破3破纪录,赵丽颖表现成遗憾

央视又押对宝了!《小城大事》收视破3破纪录,赵丽颖表现成遗憾

古希腊掌管月桂的神
2026-01-10 23:00:01
一个人毁一部剧!《小城大事》中最大的败笔,就是这个“戏混子”

一个人毁一部剧!《小城大事》中最大的败笔,就是这个“戏混子”

小娱乐悠悠
2026-01-11 11:52:16
证监会副主席陈华平:从严惩治各类恶性违法行为 增强投资者信任和信心

证监会副主席陈华平:从严惩治各类恶性违法行为 增强投资者信任和信心

财联社
2026-01-11 11:46:42
央视直播1月11日多哈冠军赛,陈幸同对蒯曼,林诗栋战张禹珍

央视直播1月11日多哈冠军赛,陈幸同对蒯曼,林诗栋战张禹珍

乒乓球球
2026-01-11 10:22:45
涉韩国学生命案的中国籍电诈嫌疑人在泰国芭提雅落网

涉韩国学生命案的中国籍电诈嫌疑人在泰国芭提雅落网

曼谷陈大叔
2026-01-11 14:35:23
李在明刚走就要去奈良见高市早苗,中方立下规矩,高市早苗失算了

李在明刚走就要去奈良见高市早苗,中方立下规矩,高市早苗失算了

笑谈历史阿晡
2026-01-11 12:41:10
苹果正式官宣:1月9日,全面官降!

苹果正式官宣:1月9日,全面官降!

科技堡垒
2026-01-09 11:45:41
“这种儿子,直接用钢筋揍!”家长晒农村儿子现状,网友忍无可忍

“这种儿子,直接用钢筋揍!”家长晒农村儿子现状,网友忍无可忍

妍妍教育日记
2026-01-08 20:37:01
闫学晶多个账号被禁止关注

闫学晶多个账号被禁止关注

新民周刊
2026-01-10 14:08:06
44岁张杰近照曝光:体脂低至8%,这肌肉是认真的吗?

44岁张杰近照曝光:体脂低至8%,这肌肉是认真的吗?

健身迷
2026-01-10 09:47:21
俄罗斯赤道特遣队撤回国内,美国捕马撕去莫斯科最后一块遮羞布

俄罗斯赤道特遣队撤回国内,美国捕马撕去莫斯科最后一块遮羞布

史政先锋
2026-01-07 19:38:07
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
218:213!美众议院投票出炉,特朗普松口撤军,美国霸权或将被改写

218:213!美众议院投票出炉,特朗普松口撤军,美国霸权或将被改写

妙知
2026-01-10 19:59:10
年薪50万带公司牛奶回家后续:教孩子更窒息,妻子晒婚照宣示主权

年薪50万带公司牛奶回家后续:教孩子更窒息,妻子晒婚照宣示主权

鋭娱之乐
2026-01-07 08:44:23
2026-01-11 15:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
323958文章数 606878关注度
往期回顾 全部

科技要闻

“我们与美国的差距也许还在拉大”

头条要闻

日本知名女星结婚:酷似高圆圆 曾和林志玲老公交往

头条要闻

日本知名女星结婚:酷似高圆圆 曾和林志玲老公交往

体育要闻

詹皇晒照不满打手没哨 裁判报告最后两分钟无误判

娱乐要闻

网友偶遇贾玲张小斐崇礼滑雪

财经要闻

外卖平台"烧钱抢存量市场"迎来终局?

汽车要闻

2026款宋Pro DM-i长续航补贴后9.98万起

态度原创

房产
教育
旅游
公开课
军事航空

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

教育要闻

从沈阳小学数学考卷风波,看教育命题之殇

旅游要闻

雪韵环翠入画来 山海相映醉游人

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄大使:马杜罗夫妇被控制时身边没人

无障碍浏览 进入关怀版