网易首页 > 网易号 > 正文 申请入驻

大模型迈向“通才”时代?智谱发布GLM-4.5

0
分享至

21世纪经济报道记者 孙燕

大模型正从专用走向通用。

7月28日晚间,智谱发布新一代旗舰模型GLM-4.5,并在Hugging Face与Model Scope平台同步开源。

其综合能力达到开源SOTA级:综合MMLU Pro、AIME 24、MATH 500等12个基准性能测试的平均分来看,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的成绩。

而GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多项标准基准测试中表现得更为出色,是因为GLM模型具有更高的参数效率。

调用价格方面,GLM-4.5系列的定价也远低于主流模型:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens。

值得一提的是,智谱首款SOTA(state of the art,是指在特定任务中目前表现最好的方法或模型)级原生智能体大模型,原生融合了推理、编码和智能体能力。

同样在7月,阿里云发布通义千问AI编程大模型Qwen3-Coder,阶跃星辰发布新一代基础大模型Step 3,均集成了推理、代码生成、智能体等能力。

民生证券研究指出,当前全球多模态AI正在向“多模态通才”转变,专家型模型逐渐走向支持多任务的通才和具备任务级协同能力的通才模式。

此前,智谱已经有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代码大模型CodeGeeX-4,智能体模型AutoGLM等。此次推出的GLM-4.5,首次在单个模型中实现推理、编码和智能体能力原生融合。

此前在7月初,智谱CEO张鹏在智谱开放平台产业生态大会上演示大模型编写PPT、生成小游戏的能力时,也多次强调“原生”这一关键词。“这完全由模型原生生成,没有附加其他功能、第三方软件和工作流。大模型在持续叠加越来越多的能力。”

有业内人士指出,推理能力和智能体能力的融合,会带来规划能力更强的智能体;代码能力和智能体能力本身便高度融合。三种能力的融合,有助于构建一个以模型为主体的智能体。

“如今大模型的能力越来越多样化,有文本类的、推理类的、工具类的,还有专门处理代码任务的,但它们大多都‘偏科’,比如OpenAI的o系列模型最擅长推理,Anthropic的Claude则特别精通代码。”智谱相关负责人向21世纪经济报道记者表示,大模型的下一个范式,一定是把各种能力整合到一起,成为一个‘全优生’,就像人一样,越来越通用,这才是实现AGI的必要条件。

其进一步指出,融合能力最大的意义在于让AI从擅长做一件事变成擅长做多件事,也是让AI越来越通用、越来越像人,能解决人的更多问题。“OpenAI的GPT-5也是这个方向。”

据测试,GLM-4.5在推理、代码和智能体能力上均达到开源模型的最高水平,其中推理能力位列开源模型第二。

尽管同时集成推理、代码、智能体等能力,但阿里Qwen3-Coder侧重于代码任务、阶跃星辰Step 3定位为原生多模态推理模型,智谱GLM-4.5则是专为智能体应用打造的基础模型。

GLM-4.5发布当晚,张鹏在朋友圈表示,“GLM上新!全面进入智能体基座时代!”

智谱对外表示,GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,是为了满足智能体应用的复杂需求。

在智谱演示的模型原生Agent场景中,GLM-4.5做出了能搜索的搜索引擎、能发弹幕的B站、能发博的微博。此外,GLM-4.5系列还能胜任全栈开发任务,编写复杂应用、游戏、交互网页。

在此背后,是模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。

前述业内人士指出,智能体包括以Coding(编码)为核心的智能体、基于UI(用户界面)的视觉识别智能体。GLM-4.5属于前者,比较擅长处理与Coding有关的任务。“如今万物都可Coding,智能体基座最成熟的应用场景还是接入Coding Agent(编码智能体)。”

在Agent Coding场景中,通过Claude Code与Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型进行对比测试,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,但在大部分场景中可以实现平替的效果。

7月29日,Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等均宣布即将接入GLM-4.5。

智谱还预告:Vibe coding模式即将推出。该模式由OpenAI联合创始人Andrej Karpathy提出,其核心思想是通过自然语言提示驱动AI生成代码,从而减少手动编码的需求。这意味着,未来开发者只需用自然语言描述需求,AI即可生成相应的代码。

“AI越来越多地从后台走向前台,早期AI能力是藏在后台的功能模块,比如说理解一句话、调起一个命令、唤醒一个音像,用户对它的感知没有那么明显。到后来,出现了类似于ChatGPT的Copilot伴随式模型,以及智能体应用AI Native的Agent。未来AI会下沉到中间层、底层,像操作系统一样接管所有的硬件、软件、数据,你只需要通过跟ALM(大模型操作系统)进行自然语言层面的交互,它就能帮你调度底层能力,完成更多任务。”张鹏在此前的演讲中畅想道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
震惊!小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络

震惊!小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络

火山詩话
2026-05-09 16:02:57
炸裂!熊孩子刮花6张PS5光盘 家长仅200元打发了事

炸裂!熊孩子刮花6张PS5光盘 家长仅200元打发了事

游民星空
2026-05-10 17:44:13
遗憾官宣!陈赫直播透露:李晨加盟五哈彻底受阻,多次协调无果

遗憾官宣!陈赫直播透露:李晨加盟五哈彻底受阻,多次协调无果

一盅情怀
2026-05-10 17:29:06
突传死讯!香港知名演员老公在家中离世,坐在轮椅上没了呼吸

突传死讯!香港知名演员老公在家中离世,坐在轮椅上没了呼吸

一盅情怀
2026-05-10 12:46:52
一季度全国结婚登记169.7万对

一季度全国结婚登记169.7万对

第一财经资讯
2026-05-10 10:17:17
牛来了,175股一季度业绩增幅超过5倍,哪只股能成妖股

牛来了,175股一季度业绩增幅超过5倍,哪只股能成妖股

慧眼看世界哈哈
2026-05-10 17:06:32
5月10日起iPhone 16迎来史上最低价 京东下单只要3899元

5月10日起iPhone 16迎来史上最低价 京东下单只要3899元

金融界
2026-05-10 17:49:37
日媒:摆脱制裁开始反攻,华为海外恢复至七成,失去的正拿回来

日媒:摆脱制裁开始反攻,华为海外恢复至七成,失去的正拿回来

王新喜
2026-05-10 14:21:40
正等待开火命令!周一开盘或将掀起惊天风浪

正等待开火命令!周一开盘或将掀起惊天风浪

魏家东
2026-05-10 14:09:12
46岁女星自曝"私处整形":只因觉得"不对称"

46岁女星自曝"私处整形":只因觉得"不对称"

追星雷达站
2026-05-09 10:36:38
昆仑万维董事长方汉:豆包手机没有渠道,出生第一天就注定失败

昆仑万维董事长方汉:豆包手机没有渠道,出生第一天就注定失败

IT之家
2026-05-10 21:38:29
悲催!网传深圳一工厂停业,无提前告知、无协商沟通,派律师送达

悲催!网传深圳一工厂停业,无提前告知、无协商沟通,派律师送达

火山詩话
2026-05-10 18:29:35
入户调查全面铺开,挨家挨户上门登记,到底查什么?一文讲清楚

入户调查全面铺开,挨家挨户上门登记,到底查什么?一文讲清楚

健身狂人
2026-05-10 15:17:47
他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

兴趣知识
2026-05-08 00:23:54
中纪委连发禁令:机关事业单位职工注意,这7种饭局一参加就出局

中纪委连发禁令:机关事业单位职工注意,这7种饭局一参加就出局

细说职场
2026-05-10 09:55:02
孙颖莎独得2分!中国女团逆转日本,世乒赛团体赛七连冠

孙颖莎独得2分!中国女团逆转日本,世乒赛团体赛七连冠

澎湃新闻
2026-05-10 21:38:28
伊朗对美国方案的回应聚焦“结束战争与海上安全”

伊朗对美国方案的回应聚焦“结束战争与海上安全”

新华社
2026-05-10 23:08:04
10日深夜世乒赛:王皓意外变阵,梁靖崑首战张本智和,林诗栋三单

10日深夜世乒赛:王皓意外变阵,梁靖崑首战张本智和,林诗栋三单

侃球熊弟
2026-05-10 22:17:17
快讯!特朗普下周的访华名单,真是给人看笑了!

快讯!特朗普下周的访华名单,真是给人看笑了!

达文西看世界
2026-05-10 09:50:48
世乒赛女团落幕:孙颖莎拿2分,国乒翻盘日本夺冠,马琳现场落泪

世乒赛女团落幕:孙颖莎拿2分,国乒翻盘日本夺冠,马琳现场落泪

侃球熊弟
2026-05-10 21:06:23
2026-05-10 23:56:49
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
247018文章数 744226关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

亲子
旅游
时尚
游戏
军事航空

亲子要闻

“顺”还是“剖”?从成为母亲的选择说起

旅游要闻

重庆新增一夜景打卡点!磁器口步行街看大学生“脑洞”建筑

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

《明末》官号复活!连发多条动态 网友感叹担忧

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版