网易首页 > 网易号 > 正文 申请入驻

智谱上市,CSO唐杰发全员信要求全面回归基础模型研究

0
分享至

今天上午,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股 116.20 港元(现汇率约合 104.5 元人民币),开盘报 120 港元 / 股,市值突破 528 亿港元。

据“晚点LatePost”获取的清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰内部信,智谱很快将推出新一代模型 GLM-5。

唐杰在信中提到,今天是“智谱生命中激动人心的一天”。智谱 2025 年如期完成了年初定下的战略,即 4 月发一个“稳住阵脚”的模型、年中发一个“上牌桌”的模型(成为 one of the best)、年底发一个 Top 1 的模型。

内部信还介绍了智谱今年将聚焦的三个技术方向:全新的模型架构设计,更通用的 RL(强化学习)范式以及对模型持续学习与自主进化的探索,这三个方向均围绕基础模型能力提升展开。

唐杰透露,智谱内部设立了一个全新部门 X-Lab,将致力于用开放的方式把更多年轻人聚集起来做前沿性探索,包括全新的模型架构、新的认知范式、还将孵化新项目,不局限于软件或是硬件。

“同时,我们也会扩大对外投资,不仅仅是战略联合已有的被投企业,也要开辟新的版图,让整个行业贯通起来,让整个生态一起繁荣。在 X-Lab,每个人的使命就是做完全颠覆式的创新,最终回归到 AGI 的主线。”

以下是唐杰内部信全文:

用“咖啡”的精神做 AGI

在香港科技大学做短期访问时,和杨强教授在实验室一楼的咖啡厅偶然碰到。我说这几天咖啡喝的太多,感觉有点上瘾,需要戒一戒了。

杨老师说:“为什么要戒呢?上瘾也不一定是坏事呀,如果我们做研究能像喝咖啡一样上瘾,又何愁研究做不好呢?”。

是啊,“上瘾”便是人生的精彩所在,无论是研究,还是其它事,只要专注、努力,就一定能做好。

“让机器像人一样思考”是智谱自始至终的愿景和理想,也是智谱人持之以恒奋斗的唯一目标。

2018年底,在人脑认知的双系统理论的启发下,我们设计了一个拥有快思考+慢思考的机器“认知”系统。2019年我们正式成立智谱,开始尝试探索AGI,实现“让机器像人一样思考”的宏伟愿景。

这里的最大挑战可能是直到今天也没有人包括我们自己能够给出一个准确的AGI定义以及如何实现AGI的技术路径,也许这正是探索AGI的魅力所在。

我们处在历史上一个从未有过的非凡时刻,一个技术再一次颠覆式地改变世界的时刻。大模型不仅是通用人工智能的关键底座,更有望成为驱动生产力变革的核心引擎。

回顾一路走来的历程,我们能走到今天的一个重要原因是,我们始终坚持做让用户真正用得上的AI技术。只有真正有人用的理论、技术或产品才能最终成为AGI之路上的重要成就。当然,不是所有的创新都能成功,我们也有很多有风险的项目都以败告终,但这也往往教会了我们从失败中汲取力量,这让智谱变得更强大,对AGI的理解也更深刻。

更重要的是,这让我们注重实用的同时,不再只盯着短期收益:帮助用户、帮助国家、帮助全球科技进步成为智谱的长期目标。

2020年,我们推出了自己的大模型算法架构GLM,并开始尝试训练100亿参数的基座模型,模型很成功,得到包括美团在内的很多企业试用,这是一个很大胆的尝试,因为当年还是BERT模型横行的小模型时代。但当时的成功距离我们梦想中的AGI还遥不可及。部分原因是模型的知识量还不够大,而另一部分原因则是模型还不会像人一样推理思考。

2021到2022年,大模型发展并不顺利,大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划,也不认为这可能是个非常大的技术变革机会,或者害怕失败。我们还是决定赌一把,用更多数据训练一个1300亿参数的大模型。

这个决策很难,因为还不能影响公司总体发展节奏。为此我们成立了两个专门的小型创新团队,一个负责模型训练,这就是后来公司的GLM三剑客;另一个则独立负责MaaS平台建设,当时这两个小团队可能互相都不知道对方的存在。

2022年中,GLM-130B训出来了,其中很多精细的设计引起了全球关注;同时MaaS平台上线,也就是现在的bigmodel.cn,有了第一批真正的API用户。随后,我们正式在公司成立了AI院,专注下一代大模型研发;成立MaaS平台部,负责对外提供大模型API服务。有时候,我们需要找到有足够大胆梦想的人(甚至专门投入更多精力去找这样的人),一个大胆宏伟的目标也许决定了一半的成功。

2023年,我和国内一个顶尖的创业前辈(其实他比我小不少)聊AI可能对未来的改变,我们一致认为AI会颠覆搜索、颠覆浏览器,会给每个人带来一个全新的AI助手;甚至有了这个AI助手后,我们也不再需要应用商店,反之我们可能需要为AI打造一个“API商店”,可能这个API商店的底层逻辑就是颠覆现有的操作系统;随后,也许更重大的颠覆是计算机本身,因为届时我们可能不是需要一个给人用的计算机了,而是适合AI的计算机。

这个变革发生的意义将是无穷的,因为它将彻底重塑计算机底层逻辑,挑战计算机界用了80年的奠基石——冯诺伊曼体系。聊到这里的时候,我们不约而同觉得我们对AI的投入还太少了,还不够All-in。

现实也是残酷的,All-in不仅需要坚定的信念,也需要极其强大的资金、团队支持,更需要精准的预判。2023到2024年是全球大模型的爆发年,大厂纷纷“All-in”大模型,国内也掀起创业高潮,百模大战、各种AI助手层出不穷。

我们那时候可能也有失误,有技术的也有商业的。现在复盘,可能原因是我们自己在追逐AGI的路上有迷失的时候,会被眼前的短期收益、短期热闹所迷惑。AGI是个技术变革,技术是平权的,是公开透明的,是要让所有人都能用的上并从中获益。

随后DeepSeek的出现警醒了我们,文锋2023年创业的时候和我聊过,当时我并没有意识到他对AGI如此执着,感谢他带给我很多不一样的思考。选择对AGI技术的执着追求,不断探索AGI的上界,同时精准的未来预判成为下一步智谱需要不断改进和升华的地方。这两年让我们经历很多,更重要的是“强化学习”了我们对AGI、对公司治理和商业竞争的认知。

过去一年,我们其实做了一次比较系统的"强化"。我们喊出了“定力”与“成就”的口号,要求大家保持定力,不骄不躁,不妄自菲薄,成就智谱每个人手上的事,成就自己。

年初的时候,一切都那么难,模型效果达不到预期,全国上下价格战,杀出重围需要找到一个精准的突破口。

我们坚守了阵地,终于找到Coding作为突破口。

如果说4月份GLM-4.1的发布像是象征性的试探,那7月底的GLM-4.5的发布几乎更是一场决战,所有技术、平台、业务团队捏一把汗,日日夜夜加班,我们终于迎来一场久逢的胜利,接着GLM-4.6和GLM-4.7让我们模型能力方面和那些国际顶尖模型并驾齐驱。

我们的GLM-4.7 在包括AA、竞技场等多项评测中获得开源模型、国产模型的SOTA,来自用户侧的模型Coding和Agent真实体感也非常好,全球184个国家的15万开发者朋友使用GLM Coding Plan,GLM-4.7发布后MaaS平台ARR年化收入超过5亿(其中海外收入超过2亿),从2000万到5亿(25倍)仅用了10个月。

总体来说,在模型侧我们如期完成了年初定下的4月发一个“稳住阵脚”的模型、年中发一个“上牌桌”的模型(即成为 one of the best)、年底发一个Top 1的模型的整体战略。这为我们后续继续冲刺AGI技术高地打下重要根基。

我们的「主权AI」也迎来全新进展:马来西亚国家级MaaS平台基于Z.ai开源模型构建,GLM成为马来的国民级模型。主权AI出海是我参加了总书记座谈会后被总书记的“中国AI要走出国门”感召,但说实话我也不知道应该怎么做,我们的国际团队敢拼敢打敢成事,完成中国大模型出海从无到有的一个里程碑。业务方面,我们敢于竞争,再次完成了年度超一倍的营收增长目标。

在种种困难和机遇并存的情况下,今天,我们以一种几乎不可能的姿势成为了全球大模型第一股,这表明了市场对我们技术与商业价值的认可。“Make impossible possible”—— 还记得我们曾经说过的吗?

这一年来,蜕变最大的可能是不是智谱,而是一群一线的年轻人,他们把很多看起来不可能的事,真的做成了。

2026年,公司的目标是成为国际领跑的大模型企业。过去一年大家讨论大模型,很多在聊应用、聊生态。

真正决定下一阶段格局的,还是更底层的两件事——模型架构与学习范式。同时,应用侧可能会出现一个清晰的方向:AI替代不同工种/任务的爆发年。

基于这一判断,我们在 2026 年将聚焦于:

GLM-5。很快GLM-5将跟大家见面,通过进一步的Scaling和很多全新技术改进,相信GLM-5会带给大家很多新奇体验,让AI帮大家完成更多真实任务。全新的模型架构设计。已经广泛使用近10年的Transformer架构已经显露出一些不足,包括超长上下文的计算开销、记忆机制、更新机制等。

这些都需要探索全新的模型架构,发现新的Scaling范式,通过芯片-算法协同设计等技术提高计算效率。具有更强泛化能力的RL。当前主流的RLVR范式虽然在数学和代码领域取得了成功,但其依赖人工构造可验证环境的局限性也日益凸显。

今年需要探索更通用的RL范式,支持AI不仅能在人类指令下完成特定任务,更要能理解并执行跨越数小时甚至数天的长时程任务。最具挑战性的探索,是开启通往持续学习与自主进化的道路。当前所有主流的AI模型,其智能在部署后基本上是静态的。

它们通过一次性的、耗资巨大的训练过程获得知识,然后在应用中逐渐过时。这与人脑能够从与世界的持续交互中不断学习、进化的方式截然不同。我们需要对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。

我们不是一家传统公司,我们也不打算成为其中之一。我们希望成为一家一切皆有可能发生的AI原生公司:打造不断提升智能上界的下一代模型,研发AI为核心的产品服务用户。我们要让AI成为每个人最得力的助手,帮助我们完成任务。我们认为还需要利用AI参与治理公司降本增效、做到更公平。

随着时间的推移,一个公司往往会习惯于做同样的事情,做渐进式的改进,这会限制我们的创新力。但在AI时代,一切都是变革式的,我们需要有点“不舒服”才能保持创新力,才能提出革命性的想法推动下一个大的增长领域。

因此,我们在智谱内部设立了一个全新部门X-Lab,这个部门将致力于用开放的方式把更多年轻人聚集,做前沿性探索,包括全新的模型架构、新的认知范式、还将孵化新项目,不局限于软件或是硬件。

同时,我们也会扩大对外投资,不仅仅是战略联合已有的被投企业,也要开辟新的版图,让整个行业贯通起来,让整个生态一起繁荣。在X-Lab,每个人的使命就是做完全颠覆式的创新,最终回归到AGI的主线。

今天是智谱生命中激动人心的一天,是智谱历史上一个重要的里程碑,更是智谱一个全新时代的开启。我很喜欢Z.ai这个品牌,Z是字母表中的最后一个,代表终极境地,我们希望在AGI的探索历程上能走到智能的终极境地,这是我们努力的目标。我们非常兴奋:

- 有一个雄心勃勃、改变世界的事业

- 着眼长远利益、放眼未来

- 更加专注,探索 AGI 的本质

- 用 AI 赋能伟大的企业家和公司的蓬勃发展

- 用更精准的预判抓住企业发展机遇

- 最终,希望我们能够为人类社会带来不一样的 AI,切实推动人类福祉的进步。

这是一个无与伦比的开心时刻,这种开心不是一时的多巴胺,而是探索 AGI 之路上积累起来的内啡肽,让我们更加专注,脚踏实地,持续前行!

唐杰

2026.1.8

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京一女子在超市6次盗窃车厘子,被警方刑拘;其在单位做法务、收入高,一斤车厘子价格才30元

北京一女子在超市6次盗窃车厘子,被警方刑拘;其在单位做法务、收入高,一斤车厘子价格才30元

大风新闻
2026-01-15 11:59:04
突发!又一位院士从中国工程院院士名单中撤下!

突发!又一位院士从中国工程院院士名单中撤下!

高分子科学前沿
2026-01-15 21:44:19
谢贤前女友大曝恋爱私隐!三年不碰她,却每天给她做“四哥菜芯”

谢贤前女友大曝恋爱私隐!三年不碰她,却每天给她做“四哥菜芯”

阿纂看事
2026-01-09 10:19:00
特战部队进驻台北!赖清德当局开始慌了,下令加强防斩首演练

特战部队进驻台北!赖清德当局开始慌了,下令加强防斩首演练

温读史
2026-01-14 10:23:23
辽宁最冷-38℃!?入冬以来最低温,沈阳即将进入冷冷冷……

辽宁最冷-38℃!?入冬以来最低温,沈阳即将进入冷冷冷……

沈阳生活圈i
2026-01-15 16:37:19
什么信号?权重股再现巨额压单!顶级游资账户或被暂停交易,AI大牛股停牌

什么信号?权重股再现巨额压单!顶级游资账户或被暂停交易,AI大牛股停牌

金石随笔
2026-01-15 00:12:14
美通告全球,中方大抛美债,特朗普终于动手了,八国央行向美宣战

美通告全球,中方大抛美债,特朗普终于动手了,八国央行向美宣战

乐天闲聊
2026-01-15 11:54:57
丈母娘逼我还大舅哥110万外债,拒绝后离婚,3 年后再见他们愣住

丈母娘逼我还大舅哥110万外债,拒绝后离婚,3 年后再见他们愣住

磊子讲史
2025-12-26 15:15:04
秋瓷炫:我这辈子最正确的决定,就是39岁高龄为中国籍小丈夫生子

秋瓷炫:我这辈子最正确的决定,就是39岁高龄为中国籍小丈夫生子

八斗小先生
2026-01-15 09:59:08
纪实:南京杀妻案吉星鹏被判处死刑,临刑前全身抽搐流泪不止

纪实:南京杀妻案吉星鹏被判处死刑,临刑前全身抽搐流泪不止

谈史论天地
2026-01-14 12:55:03
潮汕出了个“乔布斯”,干出年入120亿小电驴!拟2026年赴港上市

潮汕出了个“乔布斯”,干出年入120亿小电驴!拟2026年赴港上市

文史旺旺旺
2026-01-03 19:08:03
广州幼儿园 “关停潮” 蔓延!又有40多所扛不下去了

广州幼儿园 “关停潮” 蔓延!又有40多所扛不下去了

风向观察
2026-01-15 21:39:09
狠人做出来的事,叫人瞠目结舌!网友:都是犟种 自己犟自己的那种

狠人做出来的事,叫人瞠目结舌!网友:都是犟种 自己犟自己的那种

另子维爱读史
2026-01-15 20:18:26
72%烟草倒挂逼哭零售户!宁可不订也不赔钱,市场根基正在烂根

72%烟草倒挂逼哭零售户!宁可不订也不赔钱,市场根基正在烂根

老特有话说
2026-01-07 00:40:03
中戏院长主动投案!闫学晶儿子学籍疑云反转?背后牵扯不简单?

中戏院长主动投案!闫学晶儿子学籍疑云反转?背后牵扯不简单?

复转这些年
2026-01-14 18:39:16
参议院准许川普继续打委、为打伊铺平道路,或同时动格陵兰或先动

参议院准许川普继续打委、为打伊铺平道路,或同时动格陵兰或先动

邵旭峰域
2026-01-15 12:22:50
曼联再见!8000万“标王”同意转投国米!钦点签葡国脚+新凯塞多

曼联再见!8000万“标王”同意转投国米!钦点签葡国脚+新凯塞多

头狼追球
2026-01-15 11:30:45
研究发现:高血压的人若经常喝白酒,不用多长时间,或有5变化

研究发现:高血压的人若经常喝白酒,不用多长时间,或有5变化

蜉蝣说
2026-01-15 11:02:52
央视通报,棋圣聂卫平去世!患直肠癌晚期12年,曾是邓小平座上宾

央视通报,棋圣聂卫平去世!患直肠癌晚期12年,曾是邓小平座上宾

李健政观察
2026-01-15 12:05:55
59岁女子成功诞下4斤4两男婴,产妇:因大女儿长期定居国外,夫妻俩感到寂寞,57岁开始备孕

59岁女子成功诞下4斤4两男婴,产妇:因大女儿长期定居国外,夫妻俩感到寂寞,57岁开始备孕

观威海
2026-01-13 15:34:07
2026-01-15 22:52:49
DoNews网站 incentive-icons
DoNews网站
不局限于对互联网行业的追踪与探索,更要向未来、向未知的方向迈进。
57文章数 3关注度
往期回顾 全部

财经要闻

央行再次结构性降息0.25个百分点

头条要闻

车主称4S店只卖套餐不给单换:刹车油线下价是线上3倍

头条要闻

车主称4S店只卖套餐不给单换:刹车油线下价是线上3倍

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

科技要闻

阿里最狠的一次“自我革命”

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

亲子
游戏
本地
教育
公开课

亲子要闻

艾登在学校遇到烦恼,同学说他不是中国人不乐意了,杰森支了一招

苦等三年!《泰拉瑞亚》更新 这次是真"最后"一次?

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

教育要闻

学习节奏乱了,怎么补都白搭

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版