网易首页 > 网易号 > 正文 申请入驻

GLM-4.5大模型杀出重围,“领跑者”智谱走上台前

0
分享至

当业界探讨智能体功能、开发环境时,近日北京智谱华章科技股份有限公司(以下简称"智谱")低调发布新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破。OpenAI"跳票"多次的GPT-5也强调融合,并在6月底将智谱列入全球竞争对手,没想到智谱率先登场,GLM-4.5的综合得分位列全球第三、国产第一。

在资本市场,智谱也是"沉默的领跑者",4月已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的"大模型六小虎"。根据辅导备案报告,8月智谱将进入正式辅导期第二阶段,在这期间,这家脱胎于清华的大模型公司还密集收获多地国资的战略投资。从实验室到产业,智谱走出了中国通向AGI(通用人工智能)的另一条路径。

全球第三,国产第一

最近的开源浪潮中,智谱的GLM-4.5发布仅2小时,就被X平台推荐上了首页,发布12小时后,它已经位列国际开源社区Hugging-Face榜单全球第二,创增速纪录。

在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。

GLM-4.5采用混合专家(MoE)架构,GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿,有用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式。在包含推理、代码、智能体的综合能力测评中,GLM-4.5达到开源SOTA(即"当前最佳技术"或"最前沿水平"),在真实代码智能体的人工对比评测中,实测国内最佳。

真实场景表现比榜单更重要。在真实场景Agentic Coding(Agentic Coding)中,52个编程开发任务,涵盖六大开发领域的测试中,GLM-4.5与Claude Code、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行对比测试,结果显示,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,在大部分场景中可以实现平替的效果。

在成本角度,GLM-4.5的API调用价格输入0.8元/百万tokens、输出2元/百万tokens;高速版最高100tokens/秒。综合成本和、参数和表现,外界给GLM-4.5以"成本更低、性能更优"的评价。

专为智能体

"效果确实不错的",体验GLM-4.5后,某大模型六小虎的一位技术专家向北京商报记者反馈,他特别提到效果是指"使用这个模型开发Agent(智能体)"。这也是GLM-4.5的特点。

据了解,GLM-4.5模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的"谷歌"网站、可以发弹幕的"B站",甚至直接上线一个完整的"Flappy Bird"小游戏。

简单来说,GLM-4.5的最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个"全优生"。

巧合的一点是,6月智谱曾被OpenAI"点名",将其定义为全球竞争对手。对于类似GLM-4.5的融合式模型,OpenAI也早有提及。

2024年1月,OpenAI CEO山姆·奥特曼曾在接受媒体采访时提到,他现在的首要任务是推出可能被称为GPT-5的新模型,并称GPT-5将能够比现有模型做更多的事情。2025年2月13日,他宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。此后,OpenAI高管曾透露7月是GPT-5目标推出时间,后来山姆·奥特曼将这个时间推迟到8月初。

成为"全优生"

这一切让外界不禁好奇,智谱与OpenAI有哪些异同?针对这个问题,智谱CEO张鹏在接受媒体采访时表示,相似之处在于双方都在各自国家较早地开始训练大模型。双方都努力探索不同方向的能力边界。

"大家都不知道人工智能的边界到底在哪里。OpenAI在2023年后探索了很多方向,比如o系列模型。我们也在探索各种各样的模型,例如我们此次发布的首个原生融合模型,就代表行业一个新的发展方向。"他进一步说,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个"全优生",就像人一样,拥有越来越通用的能力。

抛开技术,在外界眼中智谱的学术背景在一众同行中更突出。"智谱作为脱胎于清华的大模型公司,其核心优势主要体现在技术积累和产学研结合方面。"科方得智库研究负责人张新原向北京商报记者表示,"获得多地国资战略投资也显示出智谱在资源整合和政策支持方面的优势。"

北京社科院副研究员王鹏也提到了智谱的股东,"它的股东背景多元,这样可以让智谱同时获得应用场景、政务资源、国际市场等支持"。

作为正在上市路上的大模型创业公司,恰逢风头正盛的具身智能也正奔赴资本市场,会否受到影响?王鹏告诉北京商报记者,"具身智能聚焦机器人、物理世界交互,智谱专注通用大模型与智能体,两者在应用场景、技术栈、客户群体差异显著,直接竞争较少。具身智能目前处于概念验证阶段,商业化路径尚不清晰,而智谱商业模式相对成熟"。

北京商报记者 魏蔚

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
神秘“华人”爆料,某岛上钱色交易不值一提,深层次的秘密才可怕

神秘“华人”爆料,某岛上钱色交易不值一提,深层次的秘密才可怕

林林故事揭秘
2024-12-25 12:24:41
女子退货寄奔驰钥匙后续:一把钥匙6千元,因为冷才把衣服一直穿

女子退货寄奔驰钥匙后续:一把钥匙6千元,因为冷才把衣服一直穿

苗苗情感说
2026-02-01 05:35:01
半天票房28万,预计亏损1000万,谢苗巨星梦要碎了

半天票房28万,预计亏损1000万,谢苗巨星梦要碎了

影视高原说
2026-01-30 13:04:35
加拿大怒了:美国怂恿能源大省闹独立

加拿大怒了:美国怂恿能源大省闹独立

上观新闻
2026-01-30 14:49:05
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

华庭讲美食
2026-01-19 14:27:13
复旦大学研究发现:长命百岁的关键是吃肉

复旦大学研究发现:长命百岁的关键是吃肉

科海识贝sci
2026-01-22 17:35:10
我卖了22年楼,今天说句实话:2026年,别再问房价了

我卖了22年楼,今天说句实话:2026年,别再问房价了

李博世财经
2026-01-31 17:07:50
80岁拾荒老太被富二代砸烂三轮车,她淡定拨通号码:儿子帮我个忙

80岁拾荒老太被富二代砸烂三轮车,她淡定拨通号码:儿子帮我个忙

白云故事
2026-01-30 11:40:09
穆帅:抽到皇马等于抽到欧冠里的“王者”,库尔图瓦很有风度

穆帅:抽到皇马等于抽到欧冠里的“王者”,库尔图瓦很有风度

懂球帝
2026-02-01 00:21:40
为什么我说800V,是“最没用”的配置?

为什么我说800V,是“最没用”的配置?

少数派报告Report
2026-01-31 11:23:53
马斯克官宣3月首飞!5家中国企业成核心供应链主力

马斯克官宣3月首飞!5家中国企业成核心供应链主力

元爸体育
2026-02-01 09:51:17
3少妇卖淫:叫声太大邻居不堪忍受,现场画面流出,肮脏细节披露

3少妇卖淫:叫声太大邻居不堪忍受,现场画面流出,肮脏细节披露

博士观察
2026-01-31 23:11:22
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
女子嫁云南果商,吃车厘子得给钱,偷拉一车水果回娘家,婆婆炸了

女子嫁云南果商,吃车厘子得给钱,偷拉一车水果回娘家,婆婆炸了

离离言几许
2026-01-30 21:33:54
姚振华实名举报江苏官员,再次证明了一件事

姚振华实名举报江苏官员,再次证明了一件事

作家加野
2026-02-01 10:56:14
曝美联储主席提名人卷入爱泼斯坦案 目前白宫及沃什方面暂未置评

曝美联储主席提名人卷入爱泼斯坦案 目前白宫及沃什方面暂未置评

财联社
2026-01-31 15:50:59
联合国撑不过今年7月?古特雷斯正式通告全球,就等美国的答复

联合国撑不过今年7月?古特雷斯正式通告全球,就等美国的答复

娱乐的宅急便
2026-02-01 10:29:19
吴文忻肝脏肿瘤恶化到晚期,2个女儿含泪替妈妈祈福求助

吴文忻肝脏肿瘤恶化到晚期,2个女儿含泪替妈妈祈福求助

素素娱乐
2026-01-31 10:14:58
1988年授衔前,赵南起被匿名举报为“韩国间谍”,为何仍被授上将

1988年授衔前,赵南起被匿名举报为“韩国间谍”,为何仍被授上将

墨说古今
2026-01-18 22:56:11
小鹏年会给优秀员工发黄金工牌

小鹏年会给优秀员工发黄金工牌

三言科技
2026-01-30 14:23:08
2026-02-01 13:03:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
273323文章数 299948关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

金价大跳水后 男子斥资20多万元抄底买入200克

头条要闻

金价大跳水后 男子斥资20多万元抄底买入200克

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

游戏
艺术
亲子
时尚
家居

《金庸群侠传》首爆贺岁PV(含战斗演示)

艺术要闻

草书中的“秋风萧瑟”:书法该走专精还是博取之路?

亲子要闻

过年发压岁钱,别卡年龄卡成长,发错真影响孩子

早春绝美cp:九分裤+运动鞋

家居要闻

蓝调空舍 自由与个性

无障碍浏览 进入关怀版