网易首页 > 网易号 > 正文 申请入驻

体验完智谱刚刚发布的 GLM-5,我终于明白它为什么让硅谷猜破了头

0
分享至


关于那个神秘的「Pony Alpha」模型的传言,已经在互联网发酵了一周。

有人说它是 Claude 5 的马甲,有人说它是某大厂的秘密武器。就在刚刚,靴子落地,谜底揭晓:这个代号「Pony Alpha」的新模型,正是智谱 AI 的春节大招——GLM-5。


▲智谱公众号截图

而且,它直接开源了。

如果说 2025 年是 AI 学会写代码的一年,那么 2026 年开年,正如特斯拉前 AI 总监 Andrej Karpathy 所预言,我们或许即将进入「智能体工程」(Agentic Engineering)时代。

只不过,比起 GPT-5.3-Codex、Claude Opus 4.6,头一个把这件事做成开源基础设施的,是国产模型 GLM-5。

附体验地址:

  • Z.ai:https://chat.z.ai
  • 智谱清言APP/网页版:https://chatglm.cn
骗过硅谷的 Pony Alpha,竟然是智谱 GLM-5 的马甲

现在的 AI 写个贪吃蛇或者俄罗斯方块,早就不是什么新鲜事了。要测,就得测点刁钻的。

我们给 GLM-5 抛出了一个极其具体的物理模拟需求:

「创建一个交互式的 HTML、CSS 和 JavaScript 卫星系统模拟程序,该程序应模拟卫星向地面接收器发送信号的过程。模拟程序应显示一颗卫星绕地球运行,并周期性地发送信号,这些信号会被多个地面接收器接收。


它没有立刻给出代码,而是稍微「停顿」了一下(模拟思考过程),最终按照我的需求生成了一个 HTML 网页。屏幕上,卫星不仅仅在转圈,信号传输甚至带有符合多普勒效应视觉隐喻的波纹扩散动画。

它理解了「模拟」二字背后的物理规律,而不仅仅是理解了「画图」这个动作。

接着,我们加大了难度。

X 上有个叫 @scaling01 的用户,给出了一个极高的评价:「Pony-Alpha 要么是 AGI,要么就是把我的 SVG 题目库给背下来了。」


为了验证这一点,我们测试了一个极其抽象的 Python 任务:「可视化展示单行道中交通信号灯的工作原理,车辆以随机速率进入。」

不到 3 分钟,一个动态的交通流模拟图出现了。


逻辑可以说是严丝合缝:绿灯放行、红灯排队,车辆加速减速的随机性也模拟得很到位。不过,这个界面的审美……怎么说呢,确实有点「简陋」。

甚至有网友 @anurudhsharmaa 用它一行提示词生成了一个有审美的网站。


而网友 @zakarinoo7 生成了一个全功能的媒体播放器——支持 MP4/MP3 解码、播放列表管理,甚至连深色模式的 UI 都写好了,编译完只有 15MB。


这一幕看得我心痒难耐。于是,我也再次通过 Claude Code ,让 GLM-5 给我打造打一个火柴人开放世界游戏。

它没有急着写代码,它做了一个非常「人类」的动作,那就从技术栈、核心玩法、再到世界风格方面入手,逐步对接我的需求。


并且在它「施工」的过程中,我还能像个挑剔的甲方一样,开始在原来的需求上得寸进尺,随时插入新的想法:


  • 光跑图太无聊了,得有经济系统,地上随机刷金币
  • 加点动作元素吧,按 J 键射箭,按 K 键近战攻击
  • 捡到的东西放哪?再给我加个背包 UI,按 I 键唤出
  • 路边的火柴人不能是摆设,我要能和 NPC 对话

等到最终运行的时候,效果简直可以用「尽善尽美」来形容:


既然号称是系统架构师,在 GLM-5 上架官网后,我也顺手让其打造了一个 Mac 系统。


虽然整体有些粗糙,但经典的屏幕背景,顶部状态栏的时间同步显示,底部 Dock 栏的图标排列都给「画」出来了。而且这上面的每一个应用,竟然真的都能打开。

适配半个芯片圈,这才是 GLM-5 的「大杀招」

基准测试结果显示,GLM-5 在 Coding 与 Agent 能力上,取得开源 SOTA 表现。

数据不会撒谎,在 SWE-bench-Verified 和 Terminal Bench 2.0 这两个公认最难的编程榜单中,GLM-5 分别拿下了 77.8 和 56.2 的高分,在真实编程场景的体感上,已经无限逼近 Claude Opus 4.5。


GLM-5 凭什么能做到这一点?翻看官方报告,在一堆参数背后,我们找到了几个关键点:MoE 架构和异步强化学习(Asynchronous RL)。

744B 的总参数量,激活参数只有 40B,这让它足够聪明又足够轻量。但真正的杀手锏是智谱构建的全新「Slime」框架。

简单打个比方: 以前的模型训练像是在「考试」,做对一道题给一个分,模型为了拿高分拼命背题; GLM-5 的训练则像是「实习」,它在一个名为 Slime 的环境里,通过完成一个个完整的长程项目,在不断的反馈和交互中学习。

此外,它还首次集成了 DeepSeek Sparse Attention(稀疏注意力机制)。这意味着在处理动辄几十万行代码的上下文时,它不仅不会「迷路」,还能大幅降低部署成本。

但最让我感慨的,是官方公告底部那串长长的致谢名单。国产大模型已经可以在国产芯片集群上,实现高吞吐、低延迟的稳定运行了。

华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光……


▲ 有种可汗大点兵的即视感

这几乎是中国半导体行业的「半壁江山」,这意味着,GLM-5 的开源不仅仅是软件层面的胜利,它标志着国产 AI 生态——从底层的芯片算力,到中间的框架,再到上层的模型逐渐跑通了一个完整的闭环。

而随着 GLM-5 的开源,以及它与 Claude Code、OpenCode 等主流工具的打通,我们或许正站在软件工程 2.0 的门槛上。

特斯拉前 AI 总监 Andrej Karpathy 预言的「智能体工程」时代,比想象中来得更快。在未来,你可能不需要再逐行砌砖。你只需要定义系统,定义审美,定义什么是「好玩」和「有用」。

然后,看着 GLM-5 这样的大模型像包工头一样,指挥着底层的算力把高楼大厦盖起来。

传统的「码农」时代,可能真的要结束了。

但别慌,这不代表人类没用了。相反,当 AI 包办了实现的繁琐,你的审美、你的判断力、以及你提出一个好问题的能力,将成为人类最后的、也是最坚固的护城河。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人生赢家!麦基虽在海外打球,仍能每月从独行侠领取18万美元薪水

人生赢家!麦基虽在海外打球,仍能每月从独行侠领取18万美元薪水

宝哥精彩赛事
2026-02-12 15:14:56
Coco直播自曝经济不好,谢贤没给她2000万分手费,遗憾没能结婚

Coco直播自曝经济不好,谢贤没给她2000万分手费,遗憾没能结婚

离离言几许
2026-02-11 12:44:06
官方:2026足协杯决赛将在苏州奥体中心体育场举行

官方:2026足协杯决赛将在苏州奥体中心体育场举行

懂球帝
2026-02-12 17:07:02
日媒:高市早苗要在2月18日辞职,其支持率年轻群体中竟高达92%?

日媒:高市早苗要在2月18日辞职,其支持率年轻群体中竟高达92%?

小陆搞笑日常
2026-02-12 18:23:33
名人堂最终候选名单公布!格里芬小斯入选 德安东尼里弗斯也在列

名人堂最终候选名单公布!格里芬小斯入选 德安东尼里弗斯也在列

罗说NBA
2026-02-12 08:19:45
廉子文谈犯规被取消成绩:对手下来打了我一下,我跟他说了对不起

廉子文谈犯规被取消成绩:对手下来打了我一下,我跟他说了对不起

澎湃新闻
2026-02-12 10:01:45
爱泼斯坦文件曝光,迈克尔·杰克逊被重新审视!

爱泼斯坦文件曝光,迈克尔·杰克逊被重新审视!

达文西看世界
2026-02-09 21:36:38
天然“化栓王”被发现!隔天吃一点,血管干净了,血栓绕道走

天然“化栓王”被发现!隔天吃一点,血管干净了,血栓绕道走

江江食研社
2026-02-04 07:30:11
岩山科技,业绩猛增2000%!

岩山科技,业绩猛增2000%!

牛锅巴小钒
2026-02-11 08:23:24
勇士惨败马刺!三首发齐发挥却空砍,波杰主导败局,三将狂铁!

勇士惨败马刺!三首发齐发挥却空砍,波杰主导败局,三将狂铁!

篮球资讯达人
2026-02-12 13:51:45
重罚+剥夺选秀权!快船违规现关键证据,伦纳德天价合同或无效

重罚+剥夺选秀权!快船违规现关键证据,伦纳德天价合同或无效

奕辰说球
2026-02-12 11:37:14
年轻有为:全国第一个90后准副厅!

年轻有为:全国第一个90后准副厅!

微微热评
2026-02-10 11:31:16
日本股市创历史新高,可持续性存疑

日本股市创历史新高,可持续性存疑

金融界
2026-02-12 08:27:12
109-133!开拓者完败森林狼,兰德尔41+7,杨瀚森NBA生涯有新突破

109-133!开拓者完败森林狼,兰德尔41+7,杨瀚森NBA生涯有新突破

球场没跑道
2026-02-12 11:38:46
43岁男保姆哭诉:大妈每月给我10000工资,却让我每天做这样的事

43岁男保姆哭诉:大妈每月给我10000工资,却让我每天做这样的事

孢木情感
2026-01-29 20:23:21
彭于晏称不能接受凌晨4点开工,因为要睡8个小时:谁晚上8点睡觉?

彭于晏称不能接受凌晨4点开工,因为要睡8个小时:谁晚上8点睡觉?

红星新闻
2026-02-11 22:23:24
750万发:俄罗斯炮弹产能大涨!频繁掉炸弹,俄博主要求百姓克制

750万发:俄罗斯炮弹产能大涨!频繁掉炸弹,俄博主要求百姓克制

鹰眼Defence
2026-02-12 17:22:05
静默访华,美日节奏突然错拍,中方连个回应都懒得给。

静默访华,美日节奏突然错拍,中方连个回应都懒得给。

蓝色海边
2026-02-12 18:36:18
上海宝冶集团被暂停全军采购资格

上海宝冶集团被暂停全军采购资格

地产微资讯
2026-02-12 16:12:33
李四川请辞拼新北市长,蓝营“小鸡”振奋,黄国昌也回应了

李四川请辞拼新北市长,蓝营“小鸡”振奋,黄国昌也回应了

海峡导报社
2026-02-11 17:46:24
2026-02-12 19:51:00
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
38432文章数 2600890关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

女子返乡"打顺风车却打到大货车"视频爆火 当事人发声

头条要闻

女子返乡"打顺风车却打到大货车"视频爆火 当事人发声

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

体操运动员坠楼涉事教练被立案调查

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

房产
旅游
健康
亲子
游戏

房产要闻

999元开线上免税店?海南爆出免税大骗局,多人已被抓!

旅游要闻

灯已亮起,双廊等你

转头就晕的耳石症,能开车上班吗?

亲子要闻

2026年水解奶粉选购指南:平衡防敏需求与宝宝成长的科学之选

《大镖客2》活过来了!新mod解锁隐藏动态世界细节

无障碍浏览 进入关怀版