网易首页 > 网易号 > 正文 申请入驻

GLM-4.5大模型杀出重围,“领跑者”智谱走上台前

0
分享至

当业界探讨智能体功能、开发环境时,近日北京智谱华章科技股份有限公司(以下简称"智谱")低调发布新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破。OpenAI"跳票"多次的GPT-5也强调融合,并在6月底将智谱列入全球竞争对手,没想到智谱率先登场,GLM-4.5的综合得分位列全球第三、国产第一。

在资本市场,智谱也是"沉默的领跑者",4月已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的"大模型六小虎"。根据辅导备案报告,8月智谱将进入正式辅导期第二阶段,在这期间,这家脱胎于清华的大模型公司还密集收获多地国资的战略投资。从实验室到产业,智谱走出了中国通向AGI(通用人工智能)的另一条路径。

全球第三,国产第一

最近的开源浪潮中,智谱的GLM-4.5发布仅2小时,就被X平台推荐上了首页,发布12小时后,它已经位列国际开源社区Hugging-Face榜单全球第二,创增速纪录。

在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。

GLM-4.5采用混合专家(MoE)架构,GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿,有用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式。在包含推理、代码、智能体的综合能力测评中,GLM-4.5达到开源SOTA(即"当前最佳技术"或"最前沿水平"),在真实代码智能体的人工对比评测中,实测国内最佳。

真实场景表现比榜单更重要。在真实场景Agentic Coding(Agentic Coding)中,52个编程开发任务,涵盖六大开发领域的测试中,GLM-4.5与Claude Code、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行对比测试,结果显示,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,在大部分场景中可以实现平替的效果。

在成本角度,GLM-4.5的API调用价格输入0.8元/百万tokens、输出2元/百万tokens;高速版最高100tokens/秒。综合成本和、参数和表现,外界给GLM-4.5以"成本更低、性能更优"的评价。

专为智能体

"效果确实不错的",体验GLM-4.5后,某大模型六小虎的一位技术专家向北京商报记者反馈,他特别提到效果是指"使用这个模型开发Agent(智能体)"。这也是GLM-4.5的特点。

据了解,GLM-4.5模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的"谷歌"网站、可以发弹幕的"B站",甚至直接上线一个完整的"Flappy Bird"小游戏。

简单来说,GLM-4.5的最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个"全优生"。

巧合的一点是,6月智谱曾被OpenAI"点名",将其定义为全球竞争对手。对于类似GLM-4.5的融合式模型,OpenAI也早有提及。

2024年1月,OpenAI CEO山姆·奥特曼曾在接受媒体采访时提到,他现在的首要任务是推出可能被称为GPT-5的新模型,并称GPT-5将能够比现有模型做更多的事情。2025年2月13日,他宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。此后,OpenAI高管曾透露7月是GPT-5目标推出时间,后来山姆·奥特曼将这个时间推迟到8月初。

成为"全优生"

这一切让外界不禁好奇,智谱与OpenAI有哪些异同?针对这个问题,智谱CEO张鹏在接受媒体采访时表示,相似之处在于双方都在各自国家较早地开始训练大模型。双方都努力探索不同方向的能力边界。

"大家都不知道人工智能的边界到底在哪里。OpenAI在2023年后探索了很多方向,比如o系列模型。我们也在探索各种各样的模型,例如我们此次发布的首个原生融合模型,就代表行业一个新的发展方向。"他进一步说,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个"全优生",就像人一样,拥有越来越通用的能力。

抛开技术,在外界眼中智谱的学术背景在一众同行中更突出。"智谱作为脱胎于清华的大模型公司,其核心优势主要体现在技术积累和产学研结合方面。"科方得智库研究负责人张新原向北京商报记者表示,"获得多地国资战略投资也显示出智谱在资源整合和政策支持方面的优势。"

北京社科院副研究员王鹏也提到了智谱的股东,"它的股东背景多元,这样可以让智谱同时获得应用场景、政务资源、国际市场等支持"。

作为正在上市路上的大模型创业公司,恰逢风头正盛的具身智能也正奔赴资本市场,会否受到影响?王鹏告诉北京商报记者,"具身智能聚焦机器人、物理世界交互,智谱专注通用大模型与智能体,两者在应用场景、技术栈、客户群体差异显著,直接竞争较少。具身智能目前处于概念验证阶段,商业化路径尚不清晰,而智谱商业模式相对成熟"。

北京商报记者 魏蔚

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长得漂亮却坏事做尽,3次入狱,被摘除4处器官的她,如今过得怎样

长得漂亮却坏事做尽,3次入狱,被摘除4处器官的她,如今过得怎样

银河史记
2026-01-23 15:36:04
“彩电一哥”康佳崩了!巨亏126亿,发生了什么?

“彩电一哥”康佳崩了!巨亏126亿,发生了什么?

说财猫
2026-02-02 20:37:08
Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

Word再见!华为和WPS联手攻克难题:一句话生成PPT、PDF/Excel大文件秒开

快科技
2026-02-02 11:06:09
江苏杨某军,没批文让老板垫1个亿,硬是把52个老小区给翻新了。

江苏杨某军,没批文让老板垫1个亿,硬是把52个老小区给翻新了。

林子说事
2026-02-01 09:40:29
大国掐架,李嘉诚这次认栽了

大国掐架,李嘉诚这次认栽了

法经社
2026-02-02 09:03:22
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

杨仔述
2026-01-31 18:16:31
13岁女生确诊胃癌晚期,医生:她吸了13年爸爸的二手烟,肚子里布满了大大小小的肿瘤,没有任何治愈机会

13岁女生确诊胃癌晚期,医生:她吸了13年爸爸的二手烟,肚子里布满了大大小小的肿瘤,没有任何治愈机会

观威海
2026-01-31 10:06:12
雷军:第一代小米SU7已停售 个别车商为了蹭流量又哭又闹 欢迎大家帮我们举报

雷军:第一代小米SU7已停售 个别车商为了蹭流量又哭又闹 欢迎大家帮我们举报

快科技
2026-02-02 12:42:07
没有任何悬念了,字母哥下家肯定在以下三支球队中产生!

没有任何悬念了,字母哥下家肯定在以下三支球队中产生!

君子一剑似水流年
2026-02-02 07:30:30
原来世界上真的有长得很标准的东西!网友:白色的云越看越红!

原来世界上真的有长得很标准的东西!网友:白色的云越看越红!

夜深爱杂谈
2026-02-02 18:29:01
香港豪门名媛搭高铁只能坐行李箱,获四亿分手费,游山玩水太潇洒

香港豪门名媛搭高铁只能坐行李箱,获四亿分手费,游山玩水太潇洒

裕丰娱间说
2026-02-02 11:44:20
简直不敢相信,莫言竟将日本侵华战争比作“兄弟争夺家产”

简直不敢相信,莫言竟将日本侵华战争比作“兄弟争夺家产”

雪中风车
2026-01-18 17:08:39
恩师袁惟仁离世! Ella崩溃爆哭:再也无法见面了

恩师袁惟仁离世! Ella崩溃爆哭:再也无法见面了

ETtoday星光云
2026-02-02 18:33:38
敢不敢打?我军重大人事变故后菲律宾南海演习,更像是一种试探

敢不敢打?我军重大人事变故后菲律宾南海演习,更像是一种试探

悦心知足
2026-02-01 00:50:48
美橄榄球明星的隐私部位尺寸,被模特前妻公开讨论,怒而对簿公堂

美橄榄球明星的隐私部位尺寸,被模特前妻公开讨论,怒而对簿公堂

失宠的小野猪
2026-01-09 14:29:24
养老金好消息!明年上涨稳了?高于6000不涨,低于3000多涨可行吗

养老金好消息!明年上涨稳了?高于6000不涨,低于3000多涨可行吗

另子维爱读史
2026-02-01 21:21:11
飙至16℃!河南高温起飞后暴跌10℃!春节期间有雨雪吗?

飙至16℃!河南高温起飞后暴跌10℃!春节期间有雨雪吗?

大象新闻
2026-02-02 06:53:26
整容成瘾、抛妻娶粉?“消失”的宋小宝,终究为曾经的荒唐买了单

整容成瘾、抛妻娶粉?“消失”的宋小宝,终究为曾经的荒唐买了单

小椰的奶奶
2026-02-03 01:20:26
消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

IT之家
2026-02-02 22:30:59
广东队史首次输宁波,内线问题暴露无疑,萨林杰必须换掉

广东队史首次输宁波,内线问题暴露无疑,萨林杰必须换掉

孤影来客
2026-02-03 01:52:41
2026-02-03 03:00:49
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
273507文章数 299951关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

本地
手机
时尚
亲子
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

手机要闻

消息称三星Galaxy S27 Ultra将搭载更安全的Polar ID面部识别技术

裤子+靴子:今年冬天最经典搭配,松弛又时髦!

亲子要闻

萌娃哄生气的妈妈,人小鬼大逗得妈妈生不起气来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版