网易首页 > 网易号 > 正文 申请入驻

智谱唐杰深夜谈了下“长周期任务”

0
分享至



智谱股价暴涨之后,唐杰深夜在X上发了一条很长的思考。

这件事我建议大家不要只当成“创始人出来讲观点”,放在资本市场里看,它更像一次没有PPT的战略路演。

前一天,智谱股价暴涨36.9%,收在1150港元,创下历史新高。从1月8日116.20港元发行价算起,四个多月涨了900%。这时候创始人出来谈AI产业下一步,市场一定会听。

唐杰讲的核心词,叫Long-Horizon Tasks,长周期任务。

听起来有点学术,但翻译一下:AI不能只会回答问题了,它得开始替人把事办完。

过去两年,我们看大模型,基本都在看“智商”。谁回答更准,谁写代码更快,谁上下文更长,谁榜单分数更高。这个阶段,AI像一个聪明助理,你问一句,它答一句;你给一个任务,它做一小步。

但长周期任务不是这个逻辑,它要求AI在几个小时、几天,甚至更长时间里,持续推进一个复杂目标。它要自己拆任务,自己查资料,自己调用工具,自己试错,自己判断结果对不对。中间遇到问题,还要知道换路线,而不是卡在那里等人救。

这就不是“会聊天”的AI了,这是开始像一个“承包商”的AI。助手需要你告诉它每一步怎么干,承包商只需要你告诉它最后要什么结果。这个差别非常大。前者提高效率,后者改变组织成本。

这也是我觉得唐杰这条推文真正有价值的地方,它不是在讲一个新概念,而是在告诉市场:AI行业的估值锚可能要变了。

以前模型公司讲故事,讲的是参数、榜单、API调用、模型能力。现在市场已经有点听累了。因为模型越来越多,发布会越来越密,大家都在说自己更强,但投资者会问一句很现实的话:然后呢?能不能赚钱?能不能进企业流程?能不能替客户省钱?能不能形成订单?

长周期任务给了一个新的答案,如果一个模型真的能连续工作8小时,稳定执行上千步操作,不需要人工盯着,它冲击的就不只是程序员效率,而是整个执行层。

程序员、数据分析师、法务助理、投研助理、运营执行、客服质检,这些岗位的共同点是什么?不是每个人都在做顶级创造,很多工作都是把任务推进到结果。

查资料,整理文件,读代码,跑测试,改报告,复盘数据,验证方案,跟进流程。

过去这些事情需要一层一层人来做。以后可能变成:人给目标,AI跑流程,人最后审核。

这才是真正让企业愿意付钱的地方,企业不一定愿意为“AI回答得很漂亮”付高价,但一定愿意为“AI帮我少招一组人、少花一半时间、少走一堆流程”付钱,这就是从工具订阅,走向执行替代。

唐杰举了一个很好的例子:漏洞挖掘。找漏洞不是简单写几行代码。你要读大量代码,理解系统架构,搭测试环境,构造攻击输入,验证漏洞有效性,最后还要写报告。这个过程没有标准答案,失败很多,路径很多,很吃经验。

如果AI能在这种高度不确定、对抗性强的任务里跑起来,那普通企业里的很多流程,其实更容易被覆盖。因为大部分企业任务没有黑客攻防那么复杂。很多只是流程长、资料多、系统散、人力贵。

这就是AI最可能先产生商业化穿透力的地方,所以智谱为什么这时候被市场重新定价?关键也在这里。

智谱以前的市场标签比较尴尬,它不像Kimi那样靠C端爆款产品出圈,也不像阿里、百度、腾讯那样有云、搜索、社交、广告、办公这些大入口。智谱更像一家技术底子很扎实的大模型公司,模型能力不错,开源生态也有,但资本市场要给它一个特别高的估值,需要一个更清楚的故事。

长周期任务就是这个故事,它给智谱提供了一个新的定位:不是单纯的国产大模型追赶者,而是企业执行系统的候选玩家。

如果只拼通用基座模型,中国公司很容易被放在“追赶OpenAI和Claude”的框架里。投资者会天然觉得你在后面追,估值也会被压一头。

但长周期任务不一样,它不是只看模型有多聪明,还看工程化能力、工具调用、企业场景、权限管理、私有化部署、行业适配、客户交付。这些事情,反而是中国AI公司可以拼速度、拼执行、拼场景密度的地方。

智谱GLM-5.1的数据也很会讲故事,按照材料里说的,GLM-5.1能持续独立作业8小时,单次任务稳定执行1200到1700步操作,不需要人工监控。在SWE-Bench Pro上达到58.4%,超过GPT-5.4的57.7%和Claude Opus 4.6的57.3%。

你说这是不是意味着智谱全面超过OpenAI和Anthropic?当然不能这么简单下结论,但资本市场不一定要你全面超过,它要的是边际变化。

只要在一个新方向上,大家还没彻底拉开差距,智谱就有机会重新讲故事。以前是你追我赶,现在是在一个新赛道上抢右侧确认。

长周期任务就是这种赛道,它现在还没有绝对王者。OpenAI在做,Anthropic在做,国内大模型公司也在做。谁先把它包装成企业可采购、可部署、可监管的产品,谁就可能拿到新一轮估值溢价。

这背后还有一个更大的变化:AI可能正在吞掉APP,唐杰提到LLM OS,我觉得这是这条推文里最激进、也最有想象力的部分。

过去几十年,我们用软件,都是打开一个APP,然后在它规定好的界面里点按钮。写邮件就开邮件软件,做表格就开Excel,做项目就开项目管理工具。用户要知道自己用什么工具,文件在哪,按钮在哪,流程怎么走。

但Agent时代的逻辑不一样,你不再说“打开哪个软件”,你只说“我要什么结果”,比如你说,帮我整理一下这个项目这周的进度,发给张三。系统自己去找文档、读聊天记录、调项目管理工具、写邮件、确认收件人、选择发送时间。你不需要管文件在哪,也不需要管用哪个软件。

这就是从APP时代,走向任务时代,如果这个趋势成立,软件行业会被重新洗牌。过去谁掌握入口,谁掌握用户时间。未来谁掌握任务入口,谁掌握企业流程。办公软件、协同平台、云厂商、开发工具、行业软件、大模型公司,都会开始抢这个位置。

智谱的机会,是用长周期任务切进这个入口,但风险也非常大。

因为AI一旦开始长时间自主执行,它就不再只是说错一句话那么简单。它可能删文件,发错邮件,改错代码,调用错接口,误判业务风险。回答错了可以重新问,执行错了可能直接造成损失。

这也是为什么企业不会轻易把核心流程交给AI。

企业要的不只是强模型,还要权限系统、审计系统、回滚机制、风控机制。AI每一步做了什么,为什么这么做,出了问题怎么追责,都要讲清楚。

否则,越强越危险,这会成为长周期Agent最大的估值折扣。

资本市场会喜欢“AI替代执行层”的故事,因为它对应利润弹性、人力成本下降、效率提升。但资本市场也会担心安全事故、监管压力和责任边界。一旦出现大的失控案例,整个板块都会被杀估值。

所以唐杰这条路,最难的不是把模型做强,而是把模型变成企业敢用的系统。

智谱如果能做到这一点,估值逻辑就不一样了。

它不再只是卖API,不只是卖私有化模型,也不只是给企业做解决方案。它可以往更高一层走,变成企业任务执行系统的基础设施。

那时候,智谱讲的就不是“国产大模型”,而是“AI执行层”。

这个故事比单纯模型故事更值钱。

因为模型层很卷,价格会被打下来,推理成本也会不断下降。企业真正愿意付溢价的,是结果,是可靠性,是和业务流程绑定之后的迁移成本。

谁能把AI嵌进企业核心流程,谁就有订单能见度。谁能让企业少花钱、多办事,谁就有利润弹性。谁能在安全和监管上让客户放心,谁就能拿到长期估值。

当然,现在还不能直接说智谱已经跑出来了。

股价四个月涨900%,这里面肯定有情绪,也有资金博弈。市场正在给国产AI重新定价,但一部分预期已经打进去了。接下来真正考验智谱的,不是唐杰的观点够不够漂亮,而是三件事能不能兑现。

第一,GLM-5.1的长周期能力能不能在真实企业场景里稳定跑。

实验室里跑8小时,和企业系统里跑8小时,不是一个难度。真实环境有脏数据、旧接口、权限限制、突发错误、模糊需求。模型能不能扛住,才是关键。

第二,智谱能不能把长周期任务打包成产品。

企业不会自己从零搭Agent系统。它需要工具箱,需要模板,需要行业方案,需要安全机制。智谱要卖的不能只是“模型能力”,而是可直接部署的任务系统。

第三,客户愿不愿意为结果交付付高价。

AI公司最怕只有热度,没有付费;只有试点,没有规模化。长周期任务听起来很有价值,但最后要变成收入、毛利和现金流,才会真正支撑市值。

所以我的判断是,唐杰这条深夜推文,对中国AI产业的意义很大,但它不是终点,是一个新坐标。

它告诉我们,AI竞争正在从“谁更会聊天”,进入“谁更能办事”。

以前模型像知识型员工,负责回答问题。以后模型像执行型团队,负责把事做完。这个变化一旦成立,中国AI产业的机会就不只是追赶海外模型,而是用工程化、场景化、行业化,去抢企业执行层的重构红利。

这条线很大,也很危险。

兑现了,就是资产重估。
兑现不了,就是概念退潮。

智谱现在站在一个很关键的位置上。它不是最大的大厂,也不是最热的C端应用,但它抓住了一个很可能改变AI定价逻辑的词:长周期任务。

资本市场最喜欢的不是热闹,是真正的估值切换。

唐杰这条推文最大的价值,就是把智谱从“模型能力竞争”里往外拽了一步,推到“结果交付竞争”这张桌子上。

接下来要看的,就是智谱能不能把这句话变成订单,把订单变成收入,把收入变成市场愿意持续定价的长期逻辑。

如果能,中国AI的下一轮主线,可能就不再是大模型排行榜。

而是:谁先让AI替企业把事情干完。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
问界回应M9台州事故:起火系物理冲击,非车辆自身原因导致

问界回应M9台州事故:起火系物理冲击,非车辆自身原因导致

识礁Farsight
2026-06-03 12:27:03
换了5台车才明白:家用车最没用的,就是车企吹爆的这6个“配置”

换了5台车才明白:家用车最没用的,就是车企吹爆的这6个“配置”

周哥一影视
2026-06-01 13:33:05
25岁女生斥巨资县城开全女酒吧,还和网友对赌多久倒闭

25岁女生斥巨资县城开全女酒吧,还和网友对赌多久倒闭

映射生活的身影
2026-06-03 08:35:49
买了34层一套房 收房时得知只建到32层;开发商仲裁代理人:“当时是计划建设到34层,但盖到32层就不让盖了”

买了34层一套房 收房时得知只建到32层;开发商仲裁代理人:“当时是计划建设到34层,但盖到32层就不让盖了”

大风新闻
2026-06-03 08:06:11
日本首富重登亚洲首富宝座 身家超过1000亿美元大关

日本首富重登亚洲首富宝座 身家超过1000亿美元大关

财联社
2026-06-03 00:07:33
日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

互联鱼
2026-06-02 19:32:57
张学友的嘴,是开了光的预言家…

张学友的嘴,是开了光的预言家…

慧翔百科
2026-06-03 08:46:01
多人“跪”在街头紧急报警!重要提醒

多人“跪”在街头紧急报警!重要提醒

日照日报
2026-06-01 13:00:19
女子称凌晨入睡后银行卡多次被转账损失约42万,自己未做任何操作 银行:其手机被操控,需等警方调查

女子称凌晨入睡后银行卡多次被转账损失约42万,自己未做任何操作 银行:其手机被操控,需等警方调查

红星新闻
2026-06-03 13:18:18
谁说只有华为乾崑选车企?奕境与华为乾崑是互相选择

谁说只有华为乾崑选车企?奕境与华为乾崑是互相选择

新出行
2026-06-01 14:36:43
Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

懂球帝
2026-06-03 09:53:28
潮汕火锅免单后续:4人身份被扒,是“惯犯”!被坑老板委屈哭诉

潮汕火锅免单后续:4人身份被扒,是“惯犯”!被坑老板委屈哭诉

火山詩话
2026-06-03 07:06:57
教育部:严禁炒作“高考状元”“升学率”,纠治奢华录取通知书

教育部:严禁炒作“高考状元”“升学率”,纠治奢华录取通知书

界面新闻
2026-06-03 14:05:30
炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

就一点
2026-06-02 15:45:51
伊朗革命卫队称袭击美国第五舰队总部

伊朗革命卫队称袭击美国第五舰队总部

界面新闻
2026-06-03 07:52:50
百姓躺平摆烂,食税群体怎么办?

百姓躺平摆烂,食税群体怎么办?

律法刑道
2026-06-03 09:30:48
“宿迁阿斗”,国补都扶不起京东?

“宿迁阿斗”,国补都扶不起京东?

七使2022
2026-06-02 16:21:50
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

番外行
2026-06-02 14:19:47
价值60万宝马X5托运途中被烧毁 物流公司称“最多赔2400元”

价值60万宝马X5托运途中被烧毁 物流公司称“最多赔2400元”

闪电新闻
2026-06-02 08:56:12
气得普京甩出一句“夷为平地”,立陶宛所有能耐,都用来招惹中俄

气得普京甩出一句“夷为平地”,立陶宛所有能耐,都用来招惹中俄

流史岁月
2026-06-02 18:10:03
2026-06-03 14:56:49
财报信号站 incentive-icons
财报信号站
专注科技公司财报与AI战略的信号捕捉
522文章数 31917关注度
往期回顾 全部

财经要闻

左手通胀右手衰退,欧美当下的困局

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

亲子
数码
教育
手机
军事航空

亲子要闻

孩子长高选什么赖氨酸好?2026推荐度高的氨基丁品牌测评,科学激活发育潜能

数码要闻

搞内容创作需配多大内存?Puget实测16/32/64GB性能差异

教育要闻

教育部:“阳光志愿”信息服务系统将优化升级

手机要闻

谷歌扩大Quick Share与AirDrop互传适配范围 覆盖更多安卓机型

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版