网易首页 > 网易号 > 正文 申请入驻

大模型迈向“通才”时代?智谱发布GLM-4.5

0
分享至

21世纪经济报道记者 孙燕

大模型正从专用走向通用。

7月28日晚间,智谱发布新一代旗舰模型GLM-4.5,并在Hugging Face与Model Scope平台同步开源。

其综合能力达到开源SOTA级:综合MMLU Pro、AIME 24、MATH 500等12个基准性能测试的平均分来看,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的成绩。

而GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多项标准基准测试中表现得更为出色,是因为GLM模型具有更高的参数效率。

调用价格方面,GLM-4.5系列的定价也远低于主流模型:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens。

值得一提的是,智谱首款SOTA(state of the art,是指在特定任务中目前表现最好的方法或模型)级原生智能体大模型,原生融合了推理、编码和智能体能力。

同样在7月,阿里云发布通义千问AI编程大模型Qwen3-Coder,阶跃星辰发布新一代基础大模型Step 3,均集成了推理、代码生成、智能体等能力。

民生证券研究指出,当前全球多模态AI正在向“多模态通才”转变,专家型模型逐渐走向支持多任务的通才和具备任务级协同能力的通才模式。

此前,智谱已经有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代码大模型CodeGeeX-4,智能体模型AutoGLM等。此次推出的GLM-4.5,首次在单个模型中实现推理、编码和智能体能力原生融合。

此前在7月初,智谱CEO张鹏在智谱开放平台产业生态大会上演示大模型编写PPT、生成小游戏的能力时,也多次强调“原生”这一关键词。“这完全由模型原生生成,没有附加其他功能、第三方软件和工作流。大模型在持续叠加越来越多的能力。”

有业内人士指出,推理能力和智能体能力的融合,会带来规划能力更强的智能体;代码能力和智能体能力本身便高度融合。三种能力的融合,有助于构建一个以模型为主体的智能体。

“如今大模型的能力越来越多样化,有文本类的、推理类的、工具类的,还有专门处理代码任务的,但它们大多都‘偏科’,比如OpenAI的o系列模型最擅长推理,Anthropic的Claude则特别精通代码。”智谱相关负责人向21世纪经济报道记者表示,大模型的下一个范式,一定是把各种能力整合到一起,成为一个‘全优生’,就像人一样,越来越通用,这才是实现AGI的必要条件。

其进一步指出,融合能力最大的意义在于让AI从擅长做一件事变成擅长做多件事,也是让AI越来越通用、越来越像人,能解决人的更多问题。“OpenAI的GPT-5也是这个方向。”

据测试,GLM-4.5在推理、代码和智能体能力上均达到开源模型的最高水平,其中推理能力位列开源模型第二。

尽管同时集成推理、代码、智能体等能力,但阿里Qwen3-Coder侧重于代码任务、阶跃星辰Step 3定位为原生多模态推理模型,智谱GLM-4.5则是专为智能体应用打造的基础模型。

GLM-4.5发布当晚,张鹏在朋友圈表示,“GLM上新!全面进入智能体基座时代!”

智谱对外表示,GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,是为了满足智能体应用的复杂需求。

在智谱演示的模型原生Agent场景中,GLM-4.5做出了能搜索的搜索引擎、能发弹幕的B站、能发博的微博。此外,GLM-4.5系列还能胜任全栈开发任务,编写复杂应用、游戏、交互网页。

在此背后,是模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。

前述业内人士指出,智能体包括以Coding(编码)为核心的智能体、基于UI(用户界面)的视觉识别智能体。GLM-4.5属于前者,比较擅长处理与Coding有关的任务。“如今万物都可Coding,智能体基座最成熟的应用场景还是接入Coding Agent(编码智能体)。”

在Agent Coding场景中,通过Claude Code与Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型进行对比测试,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,但在大部分场景中可以实现平替的效果。

7月29日,Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等均宣布即将接入GLM-4.5。

智谱还预告:Vibe coding模式即将推出。该模式由OpenAI联合创始人Andrej Karpathy提出,其核心思想是通过自然语言提示驱动AI生成代码,从而减少手动编码的需求。这意味着,未来开发者只需用自然语言描述需求,AI即可生成相应的代码。

“AI越来越多地从后台走向前台,早期AI能力是藏在后台的功能模块,比如说理解一句话、调起一个命令、唤醒一个音像,用户对它的感知没有那么明显。到后来,出现了类似于ChatGPT的Copilot伴随式模型,以及智能体应用AI Native的Agent。未来AI会下沉到中间层、底层,像操作系统一样接管所有的硬件、软件、数据,你只需要通过跟ALM(大模型操作系统)进行自然语言层面的交互,它就能帮你调度底层能力,完成更多任务。”张鹏在此前的演讲中畅想道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军如何抓的马杜罗?12架飞机41人,美军给委内瑞拉上了一课

美军如何抓的马杜罗?12架飞机41人,美军给委内瑞拉上了一课

大国知识局
2026-01-04 10:34:17
我那兄弟娶了个洋媳妇,天天哀嚎:搂着俄罗斯老婆睡,堪比抱刺猬

我那兄弟娶了个洋媳妇,天天哀嚎:搂着俄罗斯老婆睡,堪比抱刺猬

前沿天地
2025-12-29 11:22:33
免签后的土耳其,悄悄围猎中国中产

免签后的土耳其,悄悄围猎中国中产

旅界Pro
2026-01-03 09:15:00
落难将军香港求生记:从中将到码头苦力的十年

落难将军香港求生记:从中将到码头苦力的十年

比利
2026-01-04 10:14:15
法国、俄罗斯表态

法国、俄罗斯表态

澎湃新闻
2026-01-04 01:57:05
央视曝光!知名国酒是酒精勾兑,年份包装全造假,电商成重灾区

央视曝光!知名国酒是酒精勾兑,年份包装全造假,电商成重灾区

单手搓核弹
2026-01-05 10:16:10
郑元义任上海市第六人民医院党委书记,马昕任院长

郑元义任上海市第六人民医院党委书记,马昕任院长

上观新闻
2026-01-05 10:20:05
军事行动升级,全球同时接通知,解放军用中英双语,跟日本算总账

军事行动升级,全球同时接通知,解放军用中英双语,跟日本算总账

阿凫爱吐槽
2025-12-21 07:05:58
上海一消费者在米其林餐厅吃出鱼钩,消费六千多全免单餐厅致歉

上海一消费者在米其林餐厅吃出鱼钩,消费六千多全免单餐厅致歉

江西晨报
2026-01-04 16:14:52
威金顿26+7+7广州加时罚球准绝杀天津 林庭谦30+6+6助攻超朱芳雨

威金顿26+7+7广州加时罚球准绝杀天津 林庭谦30+6+6助攻超朱芳雨

醉卧浮生
2026-01-04 21:49:29
郑丽文要开会!江启臣态度急转、卢秀燕未获邀,蓝营大佬要出山?

郑丽文要开会!江启臣态度急转、卢秀燕未获邀,蓝营大佬要出山?

趣文说娱
2026-01-04 18:23:16
林徽因为何反对国徽用康乾线条?她只说了一句:去霍去病墓前看看

林徽因为何反对国徽用康乾线条?她只说了一句:去霍去病墓前看看

丞丞故事汇
2025-12-29 00:38:31
美债惊现世纪大抛售!中国持仓降至新低,美元霸权这次真的悬了?

美债惊现世纪大抛售!中国持仓降至新低,美元霸权这次真的悬了?

生活新鲜市
2026-01-04 15:47:48
李斯:为什么《寻秦记》的李斯最不像演的,带你看历史上的李斯

李斯:为什么《寻秦记》的李斯最不像演的,带你看历史上的李斯

威言晓史
2026-01-05 08:57:27
万科裁员1.3万人

万科裁员1.3万人

地产微资讯
2026-01-03 11:42:30
赵露思直播卖货动作幅度太大露出内裤,遭质疑博流量,太败好感!

赵露思直播卖货动作幅度太大露出内裤,遭质疑博流量,太败好感!

桑葚爱动画
2026-01-02 19:46:41
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
嫁黎明4年败光7亿家产,离婚后再嫁美国富豪,如今胖成大妈不敢认

嫁黎明4年败光7亿家产,离婚后再嫁美国富豪,如今胖成大妈不敢认

白面书誏
2026-01-03 21:31:21
一行多人翻“小鳌太线”失联至今?相关工作人员:还在搜救中

一行多人翻“小鳌太线”失联至今?相关工作人员:还在搜救中

红星新闻
2026-01-04 16:26:15
真不能赖运气欠佳:利物浦2-2富勒姆,斯洛特有何战术可言?

真不能赖运气欠佳:利物浦2-2富勒姆,斯洛特有何战术可言?

里芃芃体育
2026-01-05 10:10:08
2026-01-05 12:03:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
227488文章数 743489关注度
往期回顾 全部

科技要闻

雷军新年首播:确认汽车业务降速

头条要闻

委内瑞拉代总统致信:诚邀美国政府共同制定合作议程

头条要闻

委内瑞拉代总统致信:诚邀美国政府共同制定合作议程

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

黄宗泽夺双料视帝,泪洒颁奖台忆往昔

财经要闻

李迅雷:扩内需要把重心从"投"转向"消"

汽车要闻

不是9S是8X!极氪全新高性能旗舰SUV命名官宣

态度原创

旅游
手机
亲子
家居
军事航空

旅游要闻

乌拉圭记者感叹:中国旅游胜地令人心驰神往

手机要闻

卢伟冰:我有信心,REDMI Turbo 5 Max将是今年2.5K价位最佳选择

亲子要闻

你也被我可爱的脸颊迷倒了吗?奶嘴特工上线了!

家居要闻

白色大理石 奢华现代

军事要闻

马杜罗预计5日在纽约"首次出庭"

无障碍浏览 进入关怀版