网易首页 > 网易号 > 正文 申请入驻

大模型迈向“通才”时代?智谱发布GLM-4.5

0
分享至

21世纪经济报道记者 孙燕

大模型正从专用走向通用。

7月28日晚间,智谱发布新一代旗舰模型GLM-4.5,并在Hugging Face与Model Scope平台同步开源。

其综合能力达到开源SOTA级:综合MMLU Pro、AIME 24、MATH 500等12个基准性能测试的平均分来看,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的成绩。

而GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多项标准基准测试中表现得更为出色,是因为GLM模型具有更高的参数效率。

调用价格方面,GLM-4.5系列的定价也远低于主流模型:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens。

值得一提的是,智谱首款SOTA(state of the art,是指在特定任务中目前表现最好的方法或模型)级原生智能体大模型,原生融合了推理、编码和智能体能力。

同样在7月,阿里云发布通义千问AI编程大模型Qwen3-Coder,阶跃星辰发布新一代基础大模型Step 3,均集成了推理、代码生成、智能体等能力。

民生证券研究指出,当前全球多模态AI正在向“多模态通才”转变,专家型模型逐渐走向支持多任务的通才和具备任务级协同能力的通才模式。

此前,智谱已经有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代码大模型CodeGeeX-4,智能体模型AutoGLM等。此次推出的GLM-4.5,首次在单个模型中实现推理、编码和智能体能力原生融合。

此前在7月初,智谱CEO张鹏在智谱开放平台产业生态大会上演示大模型编写PPT、生成小游戏的能力时,也多次强调“原生”这一关键词。“这完全由模型原生生成,没有附加其他功能、第三方软件和工作流。大模型在持续叠加越来越多的能力。”

有业内人士指出,推理能力和智能体能力的融合,会带来规划能力更强的智能体;代码能力和智能体能力本身便高度融合。三种能力的融合,有助于构建一个以模型为主体的智能体。

“如今大模型的能力越来越多样化,有文本类的、推理类的、工具类的,还有专门处理代码任务的,但它们大多都‘偏科’,比如OpenAI的o系列模型最擅长推理,Anthropic的Claude则特别精通代码。”智谱相关负责人向21世纪经济报道记者表示,大模型的下一个范式,一定是把各种能力整合到一起,成为一个‘全优生’,就像人一样,越来越通用,这才是实现AGI的必要条件。

其进一步指出,融合能力最大的意义在于让AI从擅长做一件事变成擅长做多件事,也是让AI越来越通用、越来越像人,能解决人的更多问题。“OpenAI的GPT-5也是这个方向。”

据测试,GLM-4.5在推理、代码和智能体能力上均达到开源模型的最高水平,其中推理能力位列开源模型第二。

尽管同时集成推理、代码、智能体等能力,但阿里Qwen3-Coder侧重于代码任务、阶跃星辰Step 3定位为原生多模态推理模型,智谱GLM-4.5则是专为智能体应用打造的基础模型。

GLM-4.5发布当晚,张鹏在朋友圈表示,“GLM上新!全面进入智能体基座时代!”

智谱对外表示,GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,是为了满足智能体应用的复杂需求。

在智谱演示的模型原生Agent场景中,GLM-4.5做出了能搜索的搜索引擎、能发弹幕的B站、能发博的微博。此外,GLM-4.5系列还能胜任全栈开发任务,编写复杂应用、游戏、交互网页。

在此背后,是模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。

前述业内人士指出,智能体包括以Coding(编码)为核心的智能体、基于UI(用户界面)的视觉识别智能体。GLM-4.5属于前者,比较擅长处理与Coding有关的任务。“如今万物都可Coding,智能体基座最成熟的应用场景还是接入Coding Agent(编码智能体)。”

在Agent Coding场景中,通过Claude Code与Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型进行对比测试,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,但在大部分场景中可以实现平替的效果。

7月29日,Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等均宣布即将接入GLM-4.5。

智谱还预告:Vibe coding模式即将推出。该模式由OpenAI联合创始人Andrej Karpathy提出,其核心思想是通过自然语言提示驱动AI生成代码,从而减少手动编码的需求。这意味着,未来开发者只需用自然语言描述需求,AI即可生成相应的代码。

“AI越来越多地从后台走向前台,早期AI能力是藏在后台的功能模块,比如说理解一句话、调起一个命令、唤醒一个音像,用户对它的感知没有那么明显。到后来,出现了类似于ChatGPT的Copilot伴随式模型,以及智能体应用AI Native的Agent。未来AI会下沉到中间层、底层,像操作系统一样接管所有的硬件、软件、数据,你只需要通过跟ALM(大模型操作系统)进行自然语言层面的交互,它就能帮你调度底层能力,完成更多任务。”张鹏在此前的演讲中畅想道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄天鹅就鸡蛋角黄素抽检结果发布声明

黄天鹅就鸡蛋角黄素抽检结果发布声明

澎湃新闻
2026-03-25 15:39:05
9020mAh!新机官宣:3月26日,正式发布上市!

9020mAh!新机官宣:3月26日,正式发布上市!

科技堡垒
2026-03-26 11:29:06
历史唯一!9场比赛,仅差51次助攻啊,约基奇又又要创造历史

历史唯一!9场比赛,仅差51次助攻啊,约基奇又又要创造历史

球童无忌
2026-03-25 16:56:03
一夜之间,这两个城市房价上涨了!

一夜之间,这两个城市房价上涨了!

靓仔情感
2026-03-26 13:57:14
举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

举火烧天!杨瀚森接球顺下单臂隔扣班克斯,目前9中9独揽20分

懂球帝
2026-03-26 10:15:02
毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

毛主席有多明智?成立新疆生产建设兵团,七十年后谁都得服

诺言卿史录
2026-03-26 09:06:41
伊朗开始收“买路钱”了:想过霍尔木兹海峡?拿200万美元来

伊朗开始收“买路钱”了:想过霍尔木兹海峡?拿200万美元来

Ck的蜜糖
2026-03-26 16:57:49
湖南省委书记到凤凰,乘坐世界首条磁浮旅游专线

湖南省委书记到凤凰,乘坐世界首条磁浮旅游专线

观察者网
2026-03-25 21:33:09
广东球迷高喊:流氓教练杜锋下课!杜锋回应:感谢现场观众 非常热情

广东球迷高喊:流氓教练杜锋下课!杜锋回应:感谢现场观众 非常热情

晚雾空青
2026-03-26 16:09:03
悲催!丈夫月收入从2万到四五千,从程序员到送快递,女子想离婚

悲催!丈夫月收入从2万到四五千,从程序员到送快递,女子想离婚

火山詩话
2026-03-15 10:23:17
研究所所长猥亵下属后续,女主多张高清照曝光,知情人再爆料

研究所所长猥亵下属后续,女主多张高清照曝光,知情人再爆料

观察鉴娱
2026-03-26 09:25:28
邓超孙俪正式解绑:16年婚姻,各自安好

邓超孙俪正式解绑:16年婚姻,各自安好

二胡的岁月如歌
2026-03-26 14:50:14
正式翻脸:沙特与阿联酋开放军事基地,放任美军暴打伊朗

正式翻脸:沙特与阿联酋开放军事基地,放任美军暴打伊朗

雅儿姐在遛弯
2026-03-26 08:24:39
大瓜!张雪峰女儿只能分得16.5%遗产

大瓜!张雪峰女儿只能分得16.5%遗产

兰亭墨未干
2026-03-26 14:52:45
490亿元的大项目即将开建!!

490亿元的大项目即将开建!!

新浪财经
2026-03-26 11:14:48
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
特朗普帮了中国大忙,中国首次成为全球第一,日本完全被踩在脚下

特朗普帮了中国大忙,中国首次成为全球第一,日本完全被踩在脚下

刘蕳爱下厨
2026-03-25 15:08:52
美以联合空袭伊拉克

美以联合空袭伊拉克

第一财经资讯
2026-03-26 12:56:50
快讯!美国要打大仗了!

快讯!美国要打大仗了!

达文西看世界
2026-03-26 09:29:08
战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

子桑说
2026-03-25 17:27:05
2026-03-26 17:28:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
239761文章数 743880关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
时尚
旅游
数码
健康

教育要闻

2026湖北高职单招工作启动

皮衣+裙,高级到炸

旅游要闻

德阳绵竹:赏花、览文旅精品......沿山旅游“火”起来

数码要闻

1599~2499元,英特尔酷睿Ultra 200S Plus处理器发售

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版