晚点独家丨智谱上市，唐杰内部信要求全面回归基础模型研究|算法|总书记|glm|唐廷枢|大模型

分享至

真正决定下一阶段格局的，还是更底层的两件事——模型架构与学习范式。同时，应用侧可能会出现一个清晰的方向：AI 替代不同工种/任务的爆发年。

文丨申远

编辑丨宋玮

晚点独家获悉，1 月 8 日智谱上市当天，清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信，宣布很快将推出新一代模型 GLM-5。

唐杰说，今天是 “智谱生命中激动人心的一天”。他没有直接回应大模型公司的商业模式争议或给出智谱 2026 年商业化目标，但强调，真正 “有人用”，能帮到更多的人的理论、技术或产品才是智谱在追逐 AGI 路上的重要成就。

DeepSeek 给中国大模型企业带来冲击，许多人认为，DeepSeek 现象级成功首先冲击了智谱的生态位，它们有几乎同样的学术科研团队属性，而智谱在大模型开源生态中同样贡献良多。

内部信表示，智谱 2025 年如期完成了年初定下的战略，即 4 月发一个 “稳住阵脚” 的模型、年中发一个 “上牌桌” 的模型（成为 one of the best）、年底发一个 Top 1 的模型。

这种全面回归基础模型研究的战略是智谱对 DeepSeek 冲击的回应。12 月 23 日，智谱基座模型 GLM-4.7 上线并开源，Artificial Analysis（AA 智能指数）显示，GLM-4.7 排名国产第一，和 Claude 4.5 Sonnet 并列全球第六。

除了 GLM-5 的发布，内部信还介绍了 2026 年智谱聚焦的三个技术方向，包括全新的模型架构设计，更通用的 RL（强化学习）范式以及对模型持续学习与自主进化的探索。它们均围绕基础模型能力提升展开。

随着基础模型能力提升，Agent 和领域大模型最终都将与基础模型结合，甚至，AI 也不一定意味着需要创建新的应用。“大模型的应用也要回到第一性原理。”唐杰在去年的一条微博上说，2026 将是 AI 替代不同工种的爆发年。

2025 年智谱还经历了较大范围组织调整，限缩 To C、产研和视频生成团队规模，包括 AutoGLM 在内的成果则陆续开源。

自 ChatGPT 发布以来，AI 快速发展的三年多，“行业并没有什么共识，大家只是往前走而已。” 唐杰在一次内部交流中说到。

以下是唐杰公开信全文，智谱授权晚点独家发布。

用“咖啡”的精神做 AGI

在香港科技大学做短期访问时，和杨强教授在实验室一楼的咖啡厅偶然碰到。我说这几天咖啡喝的太多，感觉有点上瘾，需要戒一戒了。

杨老师说：“为什么要戒呢？上瘾也不一定是坏事呀，如果我们做研究能像喝咖啡一样上瘾，又何愁研究做不好呢？”。

是啊，“上瘾”便是人生的精彩所在，无论是研究，还是其它事，只要专注、努力，就一定能做好。

“让机器像人一样思考”是智谱自始至终的愿景和理想，也是智谱人持之以恒奋斗的唯一目标。

2018年底，在人脑认知的双系统理论的启发下，我们设计了一个拥有快思考+慢思考的机器“认知”系统。2019年我们正式成立智谱，开始尝试探索AGI，实现“让机器像人一样思考”的宏伟愿景。

这里的最大挑战可能是直到今天也没有人包括我们自己能够给出一个准确的AGI定义以及如何实现AGI的技术路径，也许这正是探索AGI的魅力所在。

我们处在历史上一个从未有过的非凡时刻，一个技术再一次颠覆式地改变世界的时刻。大模型不仅是通用人工智能的关键底座，更有望成为驱动生产力变革的核心引擎。

回顾一路走来的历程，我们能走到今天的一个重要原因是，我们始终坚持做让用户真正用得上的AI技术。只有真正有人用的理论、技术或产品才能最终成为AGI之路上的重要成就。当然，不是所有的创新都能成功，我们也有很多有风险的项目都以败告终，但这也往往教会了我们从失败中汲取力量，这让智谱变得更强大，对AGI的理解也更深刻。更重要的是，这让我们注重实用的同时，不再只盯着短期收益：帮助用户、帮助国家、帮助全球科技进步成为智谱的长期目标。

2020年，我们推出了自己的大模型算法架构GLM，并开始尝试训练100亿参数的基座模型，模型很成功，得到包括美团在内的很多企业试用，这是一个很大胆的尝试，因为当年还是BERT模型横行的小模型时代。但当时的成功距离我们梦想中的AGI还遥不可及。部分原因是模型的知识量还不够大，而另一部分原因则是模型还不会像人一样推理思考。

2021到2022年，大模型发展并不顺利，大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划，也不认为这可能是个非常大的技术变革机会，或者害怕失败。我们还是决定赌一把，用更多数据训练一个1300亿参数的大模型。

这个决策很难，因为还不能影响公司总体发展节奏。为此我们成立了两个专门的小型创新团队，一个负责模型训练，这就是后来公司的GLM三剑客；另一个则独立负责MaaS平台建设，当时这两个小团队可能互相都不知道对方的存在。2022年中，GLM-130B训出来了，其中很多精细的设计引起了全球关注；同时MaaS平台上线，也就是现在的bigmodel.cn，有了第一批真正的API用户。随后，我们正式在公司成立了AI院，专注下一代大模型研发；成立MaaS平台部，负责对外提供大模型API服务。有时候，我们需要找到有足够大胆梦想的人（甚至专门投入更多精力去找这样的人），一个大胆宏伟的目标也许决定了一半的成功。

2023年，我和国内一个顶尖的创业前辈（其实他比我小不少）聊AI可能对未来的改变，我们一致认为AI会颠覆搜索、颠覆浏览器，会给每个人带来一个全新的AI助手；甚至有了这个AI助手后，我们也不再需要应用商店，反之我们可能需要为AI打造一个“API商店”，可能这个API商店的底层逻辑就是颠覆现有的操作系统；随后，也许更重大的颠覆是计算机本身，因为届时我们可能不是需要一个给人用的计算机了，而是适合AI的计算机。

这个变革发生的意义将是无穷的，因为它将彻底重塑计算机底层逻辑，挑战计算机界用了80年的奠基石——冯诺伊曼体系。聊到这里的时候，我们不约而同觉得我们对AI的投入还太少了，还不够All-in。

现实也是残酷的，All-in不仅需要坚定的信念，也需要极其强大的资金、团队支持，更需要精准的预判。2023到2024年是全球大模型的爆发年，大厂纷纷“All-in”大模型，国内也掀起创业高潮，百模大战、各种AI助手层出不穷。

我们那时候可能也有失误，有技术的也有商业的。现在复盘，可能原因是我们自己在追逐AGI的路上有迷失的时候，会被眼前的短期收益、短期热闹所迷惑。AGI是个技术变革，技术是平权的，是公开透明的，是要让所有人都能用的上并从中获益。

随后DeepSeek的出现警醒了我们，文锋2023年创业的时候和我聊过，当时我并没有意识到他对AGI如此执着，感谢他带给我很多不一样的思考。选择对AGI技术的执着追求，不断探索AGI的上界，同时精准的未来预判成为下一步智谱需要不断改进和升华的地方。这两年让我们经历很多，更重要的是“强化学习”了我们对AGI、对公司治理和商业竞争的认知。

过去一年，我们其实做了一次比较系统的"强化"。我们喊出了“定力”与“成就”的口号，要求大家保持定力，不骄不躁，不妄自菲薄，成就智谱每个人手上的事，成就自己。

年初的时候，一切都那么难，模型效果达不到预期，全国上下价格战，杀出重围需要找到一个精准的突破口。

我们坚守了阵地，终于找到Coding作为突破口。

如果说4月份GLM-4.1的发布像是象征性的试探，那7月底的GLM-4.5的发布几乎更是一场决战，所有技术、平台、业务团队捏一把汗，日日夜夜加班，我们终于迎来一场久逢的胜利，接着GLM-4.6和GLM-4.7让我们模型能力方面和那些国际顶尖模型并驾齐驱。我们的GLM-4.7 在包括AA、竞技场等多项评测中获得开源模型、国产模型的SOTA，来自用户侧的模型Coding和Agent真实体感也非常好，全球184个国家的15万开发者朋友使用GLM Coding Plan，GLM-4.7发布后MaaS平台ARR年化收入超过5亿（其中海外收入超过2亿），从2000万到5亿（25倍）仅用了10个月。

总体来说，在模型侧我们如期完成了年初定下的4月发一个“稳住阵脚”的模型、年中发一个“上牌桌”的模型（即成为 one of the best）、年底发一个Top 1的模型的整体战略。这为我们后续继续冲刺AGI技术高地打下重要根基。

我们的「主权AI」也迎来全新进展：马来西亚国家级MaaS平台基于Z.ai开源模型构建，GLM成为马来的国民级模型。主权AI出海是我参加了总书记座谈会后被总书记的“中国AI要走出国门”感召，但说实话我也不知道应该怎么做，我们的国际团队敢拼敢打敢成事，完成中国大模型出海从无到有的一个里程碑。业务方面，我们敢于竞争，再次完成了年度超一倍的营收增长目标。

在种种困难和机遇并存的情况下，今天，我们以一种几乎不可能的姿势成为了全球大模型第一股，这表明了市场对我们技术与商业价值的认可。“Make impossible possible”—— 还记得我们曾经说过的吗？

这一年来，蜕变最大的可能是不是智谱，而是一群一线的年轻人，他们把很多看起来不可能的事，真的做成了。

2026年，公司的目标是成为国际领跑的大模型企业。过去一年大家讨论大模型，很多在聊应用、聊生态。

真正决定下一阶段格局的，还是更底层的两件事——模型架构与学习范式。同时，应用侧可能会出现一个清晰的方向：AI替代不同工种/任务的爆发年。

基于这一判断，我们在 2026 年将聚焦于：

GLM-5。很快GLM-5将跟大家见面，通过进一步的Scaling和很多全新技术改进，相信GLM-5会带给大家很多新奇体验，让AI帮大家完成更多真实任务。
全新的模型架构设计。已经广泛使用近10年的Transformer架构已经显露出一些不足，包括超长上下文的计算开销、记忆机制、更新机制等。这些都需要探索全新的模型架构，发现新的Scaling范式，通过芯片-算法协同设计等技术提高计算效率。
具有更强泛化能力的RL。当前主流的RLVR范式虽然在数学和代码领域取得了成功，但其依赖人工构造可验证环境的局限性也日益凸显。今年需要探索更通用的RL范式，支持AI不仅能在人类指令下完成特定任务，更要能理解并执行跨越数小时甚至数天的长时程任务。
最具挑战性的探索，是开启通往持续学习与自主进化的道路。当前所有主流的AI模型，其智能在部署后基本上是静态的。它们通过一次性的、耗资巨大的训练过程获得知识，然后在应用中逐渐过时。这与人脑能够从与世界的持续交互中不断学习、进化的方式截然不同。我们需要对下一代学习范式——在线学习（Online Learning）或持续学习（Continual Learning）进行前瞻性布局。

我们不是一家传统公司，我们也不打算成为其中之一。我们希望成为一家一切皆有可能发生的AI原生公司：打造不断提升智能上界的下一代模型，研发AI为核心的产品服务用户。我们要让AI成为每个人最得力的助手，帮助我们完成任务。我们认为还需要利用AI参与治理公司降本增效、做到更公平。

随着时间的推移，一个公司往往会习惯于做同样的事情，做渐进式的改进，这会限制我们的创新力。但在AI时代，一切都是变革式的，我们需要有点“不舒服”才能保持创新力，才能提出革命性的想法推动下一个大的增长领域。

因此，我们在智谱内部设立了一个全新部门X-Lab，这个部门将致力于用开放的方式把更多年轻人聚集，做前沿性探索，包括全新的模型架构、新的认知范式、还将孵化新项目，不局限于软件或是硬件。同时，我们也会扩大对外投资，不仅仅是战略联合已有的被投企业，也要开辟新的版图，让整个行业贯通起来，让整个生态一起繁荣。在X-Lab，每个人的使命就是做完全颠覆式的创新，最终回归到AGI的主线。

今天是智谱生命中激动人心的一天，是智谱历史上一个重要的里程碑，更是智谱一个全新时代的开启。我很喜欢Z.ai这个品牌，Z是字母表中的最后一个，代表终极境地，我们希望在AGI的探索历程上能走到智能的终极境地，这是我们努力的目标。我们非常兴奋：

有一个雄心勃勃、改变世界的事业
着眼长远利益、放眼未来
更加专注，探索 AGI 的本质
用 AI 赋能伟大的企业家和公司的蓬勃发展
用更精准的预判抓住企业发展机遇
最终，希望我们能够为人类社会带来不一样的 AI，切实推动人类福祉的进步。

这是一个无与伦比的开心时刻，这种开心不是一时的多巴胺，而是探索 AGI 之路上积累起来的内啡肽，让我们更加专注，脚踏实地，持续前行！

唐杰

2026.1.8

题图来源：《沙丘 2》

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.