网易首页 > 网易号 > 正文 申请入驻

今夜,国产AI最强一击!智谱发布GLM-4.5,新一代模型狙击OpenAI

0
分享至

新智元报道

编辑:定慧 犀牛

【新智元导读】智谱新一代旗舰「融合大模型」GLM-4.5,集成推理、代码与智能体能力,实现原生智能体模式。该模型具备极高性价比与生成速度,支持全栈Agent开发、网页创作、PPT生成等多功能,实际表现惊艳。

GPT-5还没影子,但国产这边一个「融合大模型」已经炸出来了!

智谱「悄悄的」发布了最新的旗舰版本模型GLM-4.5,这是一个全新的「融合大模型」,主打Agent Foundation Model

相较于其他模型竞相「卷参数、刷榜单」,GLM-4.5这次选择了不一样的路线——不跟风,不内卷,而是直接「狙击GPT-5」

GLM-4.5融合ARC(Agentic/Reasoning/Coding)能力,将推理、编程与Agent能力原生整合,走向更通用、更高效的AI形态。

体验地址:https://chat.z.ai/

都说GPT-5也要融合o系列、GPT系列和Agent能力,但是奥特曼一直跳票,没想到被我们「领先了」。

值得一提的是,OpenAI还在6月25日公开叫板智谱,在一篇名为《Chinese Progress at the Front》的文章中,OpenAI将智谱(而不是DeepSeeek)列入全球竞争对手,出乎所有人意料。

这也说明智谱已经可以威胁到OpenAI的发展。

既然已经公开叫板,智谱不再低调了,这个最新模型就要干翻o3!

最近,有人爆料GPT-5在WebDev Arena上有个匿名为「龙虾」的测试版。说是测试后效果惊人,用同样的提示词左边是GPT-5生成的页面,右边是Grok 4版本,看起来确实GPT-5生成的页面更「炫酷」。

但是用GLM-4.5实测后,我们发现这个「融合模型」强得离谱,同样的提示词,随手「二连抽」的效果都是SSR级别

这个效果还是可以交互的页面,画面表现能力和复杂程度已经远超Grok 4,和GPT-5都不相上下。

提示词:Create a stunning, interactive animation of a neural network or brain-like graph structure—use artistic colors, smooth transitions, and beautiful visuals. The page should feel alive, immersive, and impressive, with no buttons—just scrolling or continuous animation. Make it breathtaking.

在GLM-4.5上我们做了各种测试,然后就一发不可收拾了,这两天已经玩嗨了!

GLM-4.5不仅能整活做网站,还能一键生成PPT,还新增「Full-Stack全栈功能」可以实现在线Agent,而且完成任务的源代码还能直接下载!

对于开发者来说,仅需两行代码就可以将GLM-4.5丝滑接入到现在最火的代码工具Claude Code中。

从此可以放弃又贵又不稳定的Claude api,体验到性能强劲、很便宜的GLM-4.5。

而且!智谱这次发布GLM-4.5下足了本钱,「智谱疯狂星期一,V我50,即可包月无限量调用API」!先到先得!

它每次生成的效果都远超预期!

而且非常的快,能明显感受到任务吐「token」的速度遥遥领先。

尤其是这个模型给人的感觉就好像是打通了任督二脉,一下子融合了「智能体、推理和代码能力」的所有能力。

就好像只用一个模型,就同时拥有了Cladue Code+Manus+Reasoning Model的所有能力。

再也不用像OpenAI的ChatGPT,每次还要选择使用哪个模式。

这才像未来AI该有的样子,AI就应该像钢铁侠「贾维斯」一样,只需Chat!

使用GLM-4.5最直接的感受就是,太强了!

在模拟飞行器从地球飞往火星的过程,完全按照太空力学中的「霍曼转移轨道」(Hohmann transfer orbit)来构建。

要知道这个Prompt当时很多网友实测Gemini 2.5、Claude和Grok时都没有实现。

这个页面用到了模型最新的Full-Stack全栈能力,完全就是一个在线Agent,这才是真正的Vibe Coding!

为综合衡量模型的通用能力,智谱选择了最具有代表性的12个评测基准,包括MMLU Pro、AIME24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCL v3和BrowseComp。

综合平均分,GLM-4.5取得了全球模型第三、国产模型第一,开源模型第一

融合「更多」能力,实现最佳性能

GLM-4.5为何选择将「融合」作为主攻的方向?

所有大模型的目标都是为了实现AGI,但是关于如何定义AGI,学界还没有达成统一。

从第一性原理出发,一个模型能够在不影响原有能力的情况下,融合更多的通用智能能力一定是一个方向。

GLM-4.5就是对此理念的首次完整呈现。

GLM-4.5首次在单个模型中实现了推理、代码、Agentic等多能力原生融合

  • GLM-4.5在Agentic Coding盲测中实现国内最佳

  • GLM-4.5在推理、代码、智能体综合能力方面(平均分)刷新开源SOTA

GLM-4.5采用混合专家(MoE)架构,包括

  • GLM-4.5:总参数量355B、激活参数量32B

  • GLM-4.5-Air:总参数量106B、激活参数量12B

GLM-4.5支持thinking(推理增强)与non-thinking(通用生成)两种工作模式,兼顾推理能力与通用响应效率。

GLM-4.5的参数量为DeepSeek-R1的1/2、Kimi-K2的1/3,但在多项标准基准测试中表现得更为出色。

这得益于GLM模型更高的参数效率。

GLM-4.5-Air以106B总参数/12B激活参数实现了重要突破,在Artificial Analysis等推理基准上超越Gemini 2.5 Flash、Qwen3-235B、Claude 4 Opus等大模型,性能位列国产前三。

在SWE-Bench Verified等图谱中,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。

速度和性价比,国内SOTA

GLM-4.5系列也在调用成本和生成效率上实现突破:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens远低于主流模型定价。

同时,高速版本实测生成速度超过100tokens/秒,支持低延迟、高并发的实际部署需求。

不过现在的新模型评测跑分也就看个热闹,真正还得要实测见真章!

就拿上面「模拟飞行器从地球飞往火星,并且完全遵循现实世界物理规律」来测试,大部分只写前端代码的模型几乎都很难一次搞定。

我们先让GLM-4.5先不要考虑真实物理参数,而是演示完整的运动路径。

GLM-4.5一下子就理解了!

GLM-4.5画出了飞行器飞往火星的演示过程,并且还提供了两种视角。

一种是全局视角。

另一种是「第一视角」,你可以跟随飞行器从地球飞往火星。

GLM-4.5还贴心的在飞行器后面「画了」一个喷火的尾焰,不要太绝!

但是,这依然只是展示,如果想要让飞行器完全按照真实飞行来构建呢?

这里就需要选择Full-Stack!

通过Full-Stack,GLM-4.5就能构建一个完整的应用。

同样的提示词,使用全栈功能后,最终的效果要比单纯的写一段前端网页代码要Solid太多。

这个比例基本也符合我们对于广袤宇宙的认识,一艘飞行器孤独地前往火星。

选中全栈功能,你甚至可以获得这个项目所有源代码!这不就是相当于一个Cursor了吗?!

关键在于,这些都是免费开源的!

丝滑接入Claude Code

GLM-4.5的代码能力如此之强,你还可以通过一个兼容Anthropic API的端点将其与Claude Code集成

只需要两行代码,就能用GLM-4.5来驱动你的Claude Code了。

方法也十分简单。

首先,申请一个智谱开放平台API Key。

地址:https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys

安装Claude Code后,运行以下两行代码即可。

exportANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic 
exportANTHROPIC_AUTH_TOKEN="your bigmodel API keys"

看到这个界面后,就可以使用啦。

我们用最常见的贪吃蛇游戏来测试一下以GLM-4.5为核心的Claude Code效果如何。

中间经过一次对话调整后,GLM-4.5成功生成一个相当炸裂的、完全符合提示要求的游戏!

游戏不仅画面精美、计分准确,得分后还会有一个十分自然的动画效果,非常惊艳。

AI PPT:打工人的最佳「伴侣」

此次GLM-4.5还有一个功能也惊艳到了我们。

就是这个AI PPT(AI Sliders)功能!

实际测试后,真的和别的Agent制作PPT的感受完全不同!

下面这个是默认的例子,你可以看到整个PPT的配色和风格并不是像其他Agent的单一母版背景。

并且制作好的PPT也可以一键发布,分享给任何人。

PPT生成后可一键发布

在测试中,只上传了一张图片,就能让GLM-4.5「看图说话」,比如这张很抽象的把「奥特曼+龙虾+GPT-5」放一起封面。

最终生成PPT演示

GLM-4.5能够准确的把握到图片中信息,并且还调用了搜索引擎完善了内容。

不论是「整活」测试代码能力,还是「正经」的完成PPT制作,GLM-4.5都远超预期。

使用下来最大的感受,「如丝般顺滑」,每一个任务都几乎没有卡壳,也不用多次抽卡,几乎每个任务都能有效完成。

并且由于GLM-4.5在模型中融合ARC能力(Agentic / Reasoning / Coding),几乎任何问题都可以在「当前聊天框」里解决。

比如我可以让GLM-4.5帮我临时制作一个生辰八字计算器。

在ARC和Full-Stack能力的加持下,日常需求直接就可以转化为产品,不仅自己可用,而且可以分享出去。

大模型的「军备竞赛」发展至今,光是听说的模型已经两只手都数不过来了,ChatGPT、Gemini、Claude、Qwen、DeepSeek、GLM、Kimi…

OpenAI的ChatGPT更是给模型起了多个名字:GPT-4.1、GPT-4.5、o1-pro、o3、o3-pro、o4-mini。。。简直让人无从下手。

但是很多模型都忘记了AI原本是要「服务于人」的初衷,变成了刷榜比赛,比如Meta的Llama 4的滑铁卢就因为刷榜丑闻而起。

这次,智谱GLM4.5和OpenAI GPT-5「心照不宣」的都决定采用「融合大模型」路线。

放弃刷榜和无聊的命名游戏,回归到真正追求AGI的初心。

就像智谱所说,真实体验永远比刷榜更重要。

目前,GLM-4.5的API已上线开放平台BigModel.cn,可以一键兼容Claude Code框架。 也可以上智谱清言(chatglm.cn)和Z.ai免费体验满血版。

国内用户:

https://docs.bigmodel.cn/cn/guide/develop/claude

海外用户:

https://docs.z.ai/scenario-example/develop-tools/claude

体验地址:

https://chat.z.ai/

https://chatglm.cn

Github仓库:

https://github.com/zai-org/GLM-4.5

模型仓库:

HuggingFace:

https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b

ModelScope:

https://modelscope.cn/collections/GLM-45-b8693e2a08984f

同时,智谱还公布了实测的52道题目及Agent轨迹,供业界验证。

Agent轨迹:

https://huggingface.co/datasets/zai-org/CC-Bench-trajectories

参考资料:

https://chatglm.cn/

https://chat.z.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国拒绝“漫天要价”的背后:不是中国离不开世界杯,是世界杯更需要中国

中国拒绝“漫天要价”的背后:不是中国离不开世界杯,是世界杯更需要中国

中国网
2026-05-07 17:51:22
欧冠决赛巴黎优势拉满,阿森纳靠什么赢?

欧冠决赛巴黎优势拉满,阿森纳靠什么赢?

体坛周报
2026-05-07 12:41:16
钱赚够了名声没了,英皇风波再升级!荒唐一幕出现,霍震霆也遭殃

钱赚够了名声没了,英皇风波再升级!荒唐一幕出现,霍震霆也遭殃

青杉依旧啊啊
2026-05-07 09:41:09
保姆纵火案真相揭露,藏僧通灵朱小贞,林生斌竟然只是颗棋子

保姆纵火案真相揭露,藏僧通灵朱小贞,林生斌竟然只是颗棋子

纸鸢奇谭
2025-01-12 22:07:14
伊朗外交部发言人:最高领袖穆杰塔巴全面掌控局势

伊朗外交部发言人:最高领袖穆杰塔巴全面掌控局势

财联社
2026-05-08 03:03:43
赖清德窜访团集体向非洲王室蹲跪献礼,台网友讽刺其“出访”靠“偷渡”,“参见”靠“下跪”

赖清德窜访团集体向非洲王室蹲跪献礼,台网友讽刺其“出访”靠“偷渡”,“参见”靠“下跪”

极目新闻
2026-05-07 07:33:33
加速糖尿病恶化的原因:喝酒排第4,排第1的,很多人还在天天做

加速糖尿病恶化的原因:喝酒排第4,排第1的,很多人还在天天做

医学科普汇
2026-05-07 22:35:04
29项全球第一!比亚迪大唐预售订单突破10万台

29项全球第一!比亚迪大唐预售订单突破10万台

快科技
2026-05-07 20:56:31
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

二胡的岁月如歌
2026-04-14 18:43:51
台版张凌赫走红了!网友:坏消息已婚,好消息是他有双胞胎弟弟

台版张凌赫走红了!网友:坏消息已婚,好消息是他有双胞胎弟弟

钩子的爱好
2026-05-07 06:06:09
未来三年,只干半导体材料!错过等于十年前没买茅台!非危言耸听

未来三年,只干半导体材料!错过等于十年前没买茅台!非危言耸听

王二哥老搞笑
2026-05-04 08:50:19
现在不光是美国,所有国家都想知道,中国军事力量到了什么水平?

现在不光是美国,所有国家都想知道,中国军事力量到了什么水平?

国际大表妹
2026-05-07 12:39:16
恩里克霸气发声:欧洲已无球队强于巴黎,我们要实现卫冕壮举

恩里克霸气发声:欧洲已无球队强于巴黎,我们要实现卫冕壮举

星耀国际足坛
2026-05-07 09:20:11
特朗普对美伊达成协议再表乐观,同时威胁轰炸

特朗普对美伊达成协议再表乐观,同时威胁轰炸

澎湃新闻
2026-05-07 01:44:13
小米“昆仑”出鞘,撕开豪华SUV的最后一道防线

小米“昆仑”出鞘,撕开豪华SUV的最后一道防线

SmartHey
2026-05-06 13:50:35
千年难遇的美人,太漂亮了,没有一点毛病,太完美了

千年难遇的美人,太漂亮了,没有一点毛病,太完美了

情感大头说说
2026-04-24 12:46:24
中印泰马集体说不 !国际足联紧急访华,央视死守底线 赞助商急了

中印泰马集体说不 !国际足联紧急访华,央视死守底线 赞助商急了

影像温度
2026-05-07 10:26:34
铁了心打垮中国?最大威胁现身!这次不是美国,普京却笑到了最后

铁了心打垮中国?最大威胁现身!这次不是美国,普京却笑到了最后

阿七说史
2026-03-13 15:56:51
中国女子命丧西班牙街头,当场惨烈割喉,凶手正脸曝光,恐难伏法

中国女子命丧西班牙街头,当场惨烈割喉,凶手正脸曝光,恐难伏法

青杉依旧啊啊
2026-05-08 01:55:02
全球手机销量排行出炉,第一名居然不是 iPhone 17 Pro!

全球手机销量排行出炉,第一名居然不是 iPhone 17 Pro!

XCiOS俱乐部
2026-05-06 19:41:29
2026-05-08 04:44:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15153文章数 66847关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

家居
亲子
教育
公开课
军事航空

家居要闻

破茧成蝶 土味精装房爆改

亲子要闻

只祝她“母亲节快乐”是不够的

教育要闻

二模很重要!2026临沂二模、青岛二模语文、数学试题及答案!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:美伊"很可能"达成协议

无障碍浏览 进入关怀版