网易首页 > 网易号 > 正文 申请入驻

大模型迈向“通才”时代?智谱发布GLM-4.5

0
分享至

21世纪经济报道记者 孙燕

大模型正从专用走向通用。

7月28日晚间,智谱发布新一代旗舰模型GLM-4.5,并在Hugging Face与Model Scope平台同步开源。

其综合能力达到开源SOTA级:综合MMLU Pro、AIME 24、MATH 500等12个基准性能测试的平均分来看,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的成绩。

而GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多项标准基准测试中表现得更为出色,是因为GLM模型具有更高的参数效率。

调用价格方面,GLM-4.5系列的定价也远低于主流模型:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens。

值得一提的是,智谱首款SOTA(state of the art,是指在特定任务中目前表现最好的方法或模型)级原生智能体大模型,原生融合了推理、编码和智能体能力。

同样在7月,阿里云发布通义千问AI编程大模型Qwen3-Coder,阶跃星辰发布新一代基础大模型Step 3,均集成了推理、代码生成、智能体等能力。

民生证券研究指出,当前全球多模态AI正在向“多模态通才”转变,专家型模型逐渐走向支持多任务的通才和具备任务级协同能力的通才模式。

此前,智谱已经有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代码大模型CodeGeeX-4,智能体模型AutoGLM等。此次推出的GLM-4.5,首次在单个模型中实现推理、编码和智能体能力原生融合。

此前在7月初,智谱CEO张鹏在智谱开放平台产业生态大会上演示大模型编写PPT、生成小游戏的能力时,也多次强调“原生”这一关键词。“这完全由模型原生生成,没有附加其他功能、第三方软件和工作流。大模型在持续叠加越来越多的能力。”

有业内人士指出,推理能力和智能体能力的融合,会带来规划能力更强的智能体;代码能力和智能体能力本身便高度融合。三种能力的融合,有助于构建一个以模型为主体的智能体。

“如今大模型的能力越来越多样化,有文本类的、推理类的、工具类的,还有专门处理代码任务的,但它们大多都‘偏科’,比如OpenAI的o系列模型最擅长推理,Anthropic的Claude则特别精通代码。”智谱相关负责人向21世纪经济报道记者表示,大模型的下一个范式,一定是把各种能力整合到一起,成为一个‘全优生’,就像人一样,越来越通用,这才是实现AGI的必要条件。

其进一步指出,融合能力最大的意义在于让AI从擅长做一件事变成擅长做多件事,也是让AI越来越通用、越来越像人,能解决人的更多问题。“OpenAI的GPT-5也是这个方向。”

据测试,GLM-4.5在推理、代码和智能体能力上均达到开源模型的最高水平,其中推理能力位列开源模型第二。

尽管同时集成推理、代码、智能体等能力,但阿里Qwen3-Coder侧重于代码任务、阶跃星辰Step 3定位为原生多模态推理模型,智谱GLM-4.5则是专为智能体应用打造的基础模型。

GLM-4.5发布当晚,张鹏在朋友圈表示,“GLM上新!全面进入智能体基座时代!”

智谱对外表示,GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,是为了满足智能体应用的复杂需求。

在智谱演示的模型原生Agent场景中,GLM-4.5做出了能搜索的搜索引擎、能发弹幕的B站、能发博的微博。此外,GLM-4.5系列还能胜任全栈开发任务,编写复杂应用、游戏、交互网页。

在此背后,是模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。

前述业内人士指出,智能体包括以Coding(编码)为核心的智能体、基于UI(用户界面)的视觉识别智能体。GLM-4.5属于前者,比较擅长处理与Coding有关的任务。“如今万物都可Coding,智能体基座最成熟的应用场景还是接入Coding Agent(编码智能体)。”

在Agent Coding场景中,通过Claude Code与Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型进行对比测试,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,但在大部分场景中可以实现平替的效果。

7月29日,Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等均宣布即将接入GLM-4.5。

智谱还预告:Vibe coding模式即将推出。该模式由OpenAI联合创始人Andrej Karpathy提出,其核心思想是通过自然语言提示驱动AI生成代码,从而减少手动编码的需求。这意味着,未来开发者只需用自然语言描述需求,AI即可生成相应的代码。

“AI越来越多地从后台走向前台,早期AI能力是藏在后台的功能模块,比如说理解一句话、调起一个命令、唤醒一个音像,用户对它的感知没有那么明显。到后来,出现了类似于ChatGPT的Copilot伴随式模型,以及智能体应用AI Native的Agent。未来AI会下沉到中间层、底层,像操作系统一样接管所有的硬件、软件、数据,你只需要通过跟ALM(大模型操作系统)进行自然语言层面的交互,它就能帮你调度底层能力,完成更多任务。”张鹏在此前的演讲中畅想道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重大破局!伊朗绝杀,特朗普彻底栽了!

重大破局!伊朗绝杀,特朗普彻底栽了!

大嘴说天下
2026-03-06 19:52:10
现场直击:伊朗防空系统拦截美以目标

现场直击:伊朗防空系统拦截美以目标

新华社
2026-03-06 10:54:01
为什么说要得饶人处且饶人?网友:卡里几千万,为了5块钱命没了

为什么说要得饶人处且饶人?网友:卡里几千万,为了5块钱命没了

另子维爱读史
2026-02-25 23:23:26
印度回应美国30天豁免令:印方购买俄石油从不需要得到任何国家许可

印度回应美国30天豁免令:印方购买俄石油从不需要得到任何国家许可

环球网资讯
2026-03-07 17:54:11
文班暴泪,25分逆转,搁谁也要哭,真是太累了

文班暴泪,25分逆转,搁谁也要哭,真是太累了

体育新角度
2026-03-07 16:49:30
特朗普没想到:美伊大战打醒两个国家,一个是越南,一个是菲律宾

特朗普没想到:美伊大战打醒两个国家,一个是越南,一个是菲律宾

虎哥闲聊
2026-03-07 12:23:39
多方计算美“鲁莽战争”成本,美研究中心CSIS:最初100小时花费约37亿美元

多方计算美“鲁莽战争”成本,美研究中心CSIS:最初100小时花费约37亿美元

环球网资讯
2026-03-07 06:27:15
新款日产NV200官方谍照曝光!网友:定价9万必卖爆

新款日产NV200官方谍照曝光!网友:定价9万必卖爆

汽车网评
2026-03-06 22:24:14
痴呆风险直降26%!清华大学:每天摄入50微克这种常见维生素即可

痴呆风险直降26%!清华大学:每天摄入50微克这种常见维生素即可

时光派健康抗衰
2026-03-05 11:00:03
3-0!铁人18分钟缴械!泰山轻松拿捏 争冠格局没打破,小谢涨球了

3-0!铁人18分钟缴械!泰山轻松拿捏 争冠格局没打破,小谢涨球了

刀锋体育
2026-03-07 18:11:28
国际油价冲“100大关”!下周国内油价或现年内最大涨幅,本周化工股掀涨停潮

国际油价冲“100大关”!下周国内油价或现年内最大涨幅,本周化工股掀涨停潮

红星资本局
2026-03-07 18:09:12
首秀15+11+7+20!塔图姆回来了!东部彻底变天了!

首秀15+11+7+20!塔图姆回来了!东部彻底变天了!

贵圈真乱
2026-03-07 10:55:02
全国人大代表霍启刚:希望在中小学推广冰雪课程,每学年不少于8课时

全国人大代表霍启刚:希望在中小学推广冰雪课程,每学年不少于8课时

红星新闻
2026-03-06 17:00:13
普京的意思已经很清楚了,俄罗斯绝不可能出手救伊朗

普京的意思已经很清楚了,俄罗斯绝不可能出手救伊朗

时光琉影8
2026-03-06 17:16:03
为什么要往大城市跑 小县城哪不好 网友讲实际案例 真是人各有志

为什么要往大城市跑 小县城哪不好 网友讲实际案例 真是人各有志

侃神评故事
2026-03-07 11:30:03
妖、魔、鬼、怪、精,到底有什么区别?

妖、魔、鬼、怪、精,到底有什么区别?

历史地理大发现
2026-02-27 23:49:41
美退伍军人听证会现场大喊: “没人愿意为以色列而战” 被按倒拖走

美退伍军人听证会现场大喊: “没人愿意为以色列而战” 被按倒拖走

闪电新闻
2026-03-05 19:42:22
身价高达67亿+!网友在相亲软件刷到宇树王兴兴 要求女友标准曝光:平台回应

身价高达67亿+!网友在相亲软件刷到宇树王兴兴 要求女友标准曝光:平台回应

快科技
2026-03-07 09:26:09
买超新欢邵晴怀孕,小三熬成正宫!张嘉倪的逆袭,才是最狠的报复

买超新欢邵晴怀孕,小三熬成正宫!张嘉倪的逆袭,才是最狠的报复

乐悠悠娱乐
2026-03-07 12:28:40
鲁山舅舅与亡姐结婚后续:女孩发布新消息,平顶山市对案件接手

鲁山舅舅与亡姐结婚后续:女孩发布新消息,平顶山市对案件接手

观察鉴娱
2026-03-06 09:32:02
2026-03-07 18:36:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
236438文章数 743793关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

中国货船"铁娘子"号通过霍尔木兹海峡 大量船舶仍滞留

头条要闻

中国货船"铁娘子"号通过霍尔木兹海峡 大量船舶仍滞留

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

周杰伦田馥甄的“JH恋” 被扒得底朝天

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

艺术
亲子
本地
房产
军事航空

艺术要闻

米芾失传的34幅真迹,在岳飞孙子家中发现!

亲子要闻

萌娃锐评老爸身高,老爸:这小嘴太毒了

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

军事要闻

美第三个航母打击群据称准备部署至中东

无障碍浏览 进入关怀版