姚顺雨、唐杰、林俊旸、杨强同台发声：中国大模型集体迈向“做事时代”|唐廷枢

姚顺雨、唐杰、林俊旸、杨强同台发声：中国大模型集体迈向“做事时代”

2026-01-11 15:49:45　来源: 读创

广东举报

分享至

深圳商报·读创客户端首席记者袁静娴/文记者蔡玉兰/视频

1月10日，在清华大学基础模型北京市重点实验室与智谱AI联合发起的AGI-Next 前沿峰会上，中国大模型领域几条最具代表性的技术路线，少有地在同一张桌前完成了一次“对齐”。

这不仅是一场技术交流，更像一次阶段性共识的形成。

台上，既有刚刚带领智谱完成港股IPO、从学术走向产业深水区的清华教授唐杰，也有从OpenAI回国、首次以腾讯AI首席科学家身份公开亮相的姚顺雨，有长期主导阿里通义千问技术演进的林俊旸，以及在联邦学习与持续学习领域深耕多年的杨强教授。

他们的背景不同、路径各异，却在同一个问题上形成了清晰共振：大模型的主战场，正在从“更会聊天”，转向“真正做事”，并进一步迈向具备自主学习能力的智能体系统。

唐杰：Chat范式正收敛，下一步是让模型在真实环境中“把事做成”

作为中国最早系统性推动大模型落地的学者之一，唐杰在演讲中回顾了过去数年大模型能力的演进路径——从知识记忆、基础推理，到代码生成与复杂任务执行。

他直言，当前大模型在“会不会聊天”这个问题上，差距正在迅速缩小。

“继续在Chat能力上内卷，很可能只是做到性能接近，剩下更多是工程问题。”

在这一判断下，智谱将研发重心转向Thinking、Coding与Agent的深度融合。唐杰指出，真正的挑战不在于模型是否“懂”，而在于是否能在真实环境中稳定、可靠地完成复杂任务。

他以“用一句话生成一个完整可运行的游戏”为例说明，模型需要完成的不只是代码生成，而是包括任务拆解、状态维护、错误修复在内的多步执行过程。这要求模型具备长程规划能力与持续执行能力。

为此，智谱在训练中引入了可验证强化学习（RLVR）思路，将模型置于真实的编程环境、Web环境中，通过结果是否可运行、是否通过测试来形成反馈闭环。

“Benchmark 成绩并不等于用户体验。”唐杰强调，能不能一次跑通，才是决定模型价值的关键。

在更长远的技术判断中，他提出未来模型系统将不再是单一Transformer，而是由多模块构成的复杂智能体系统，包括快速反应的“系统一”、深度推理的“系统二”，以及支撑长期演化的自学习模块。

林俊旸：通用智能不只是模型，而是一个能自主使用工具的Generalist Agent

阿里通义千问技术负责人林俊旸，则从系统架构的角度，对通用智能的形态给出了更为明确的定义。

在他看来，通用人工智能的关键，不在于模型是否“什么都知道”，而在于是否具备自主使用工具、与环境持续交互的能力。这也是Qwen从“Generalist Model” 迈向“Generalist Agent” 的核心动因。

围绕这一目标，通义千问在多个方向同步推进：在文本与推理层面，通过Qwen3系列强化复杂reasoning能力；在编程与Agent方向，模型开始贴近真实软件工程流程，而非只在竞赛型问题中表现；在多模态方面，则着力解决“视觉增强但语言能力退化”的长期难题。

林俊旸特别强调，多模态能力不应是简单拼接，而应进入同一个“认知中枢”。“如果模型真的要形成自我认知，上下文理解必须足够长。”他透露，Qwen已在探索百万级甚至更长上下文窗口，以支撑跨任务、跨时间的连续理解与决策。

在训练范式上，他判断，未来的主线不再是静态标注数据，而是带环境反馈的多轮强化学习。模型需要在真实任务中不断试错、修正，才能真正进入生产工具链。

杨强：工业界跑得很快，但智能的“上界问题”仍需回答

作为联邦学习的重要奠基者，杨强教授在峰会上从基础研究角度，对当前大模型热潮进行了冷静审视。他指出，工业界的进展令人振奋，但学术界需要重新聚焦一些尚未被系统回答的关键问题：在有限算力与数据条件下，智能的理论上界在哪里？训练、推理与记忆应如何最优分配？持续学习如何避免误差累积？

他特别提到“持续学习”的挑战。与一次性训练不同，模型在长期运行中会不断引入噪音，如果缺乏有效的清理与校正机制，系统性能反而可能退化。“人类通过睡眠来整合和清理信息，智能系统也需要类似机制。”杨强指出。

在他看来，如何让模型在长期运行中保持稳定与可信，将是决定其走向真实世界的重要前提，这同样需要学术界与工业界的深度协作。

姚顺雨回国首秀，AI“下半场”如何真正落地？

如果说主题演讲回答的是“技术该往哪里走”，那么圆桌论坛讨论的，则是“这些方向，是否真的能跑通”。而在这一环节，姚顺雨的亮相成为了最大焦点。他于2025年12月正式加入腾讯，担任首席AI科学家，此次AGI-Next峰会是其回国后的首次公开发声。

姚顺雨指出，当前AI产业已经明显进入分化阶段。在他看来，toC与toB场景的差异正在被低估。“在消费端，模型能力的提升，用户体感正在变弱；但在企业端，尤其是编程、数据分析、自动化流程中，智能水平几乎直接等价于生产力。”他说。

这一判断也引发了圆桌嘉宾的进一步讨论。多位与会者认为，在toB场景中，模型并不是“锦上添花”，而是正在重构工作方式本身——从写代码、做分析，到规划任务、分配步骤。

其次，围绕“Chat是否已经到头”这一问题，圆桌上并非完全一致。

唐杰指出，Chat能力仍是基础，但单纯以对话为中心的产品形态，已经难以承载更复杂的任务需求。真正的挑战，在于模型能否在真实环境中持续执行任务，并处理失败。

林俊旸则补充认为，Agent并不是“去Chat化”，而是在Chat之上，引入工具调用、长期记忆与环境反馈，让模型具备行动能力。

姚顺雨对此表示认同，并进一步指出，Agent的难点并不在演示，而在稳定性。“当系统开始自动做事，失败成本会迅速放大，这也是为什么在toB场景中，模型的可靠性会被无限放大。”

在模型与应用的关系上，圆桌讨论也呈现出更具现实感的判断。姚顺雨指出，在消费级应用中，模型与产品的深度耦合，仍然是提升体验的重要方式；但在企业级市场，模型与应用分层，反而可能释放更大的创新空间。

“企业真正需要的，不是一个万能模型，而是能嵌入现有流程、理解业务上下文的智能系统。”

这一观点，也与现场嘉宾对“Context重要性”的讨论形成呼应。多位与会者认为，真实业务场景本身，正在成为比模型规模更重要的竞争要素。

作为曾在OpenAI长期工作的研究人员，姚顺雨也从更宏观的角度分享了他对全球AI竞争格局的观察。他认为，当前全球AI竞争，已不仅是模型能力之争，更是人才、工程体系与长期投入能力的综合博弈。年轻一代研究者的流动，正在重塑太平洋两岸的创新结构。

他的回国，被多位与会者视为一个标志性事件——不仅意味着个人选择的变化，也反映出中国在基础模型、推理框架等领域，正逐步形成更完整的技术土壤。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

姚顺雨、唐杰、林俊旸、杨强同台发声：中国大模型集体迈向“做事时代”

反垄断大棒，为何砸向了携程

贺娇龙意外坠马头部重伤离世 最后一条朋友圈与马有关

贺娇龙意外坠马头部重伤离世 最后一条朋友圈与马有关

你是个好球员，我们就拿你交易吧

网红彭十六偷税被封杀 曾成功转型明星

携程被立案调查，最高或被罚超50亿

曝Model Y或降到20万以内！

态度原创

心之所向 现代建构之美

我们不对你好，谁对你好～

热销17亿后！天正·三亚湾壹号，被爆违建！

缙云丨余道勇：时光在天星沟交汇

血常规3项异常，是身体警报！

贺娇龙意外坠马头部重伤离世最后一条朋友圈与马有关

贺娇龙意外坠马头部重伤离世最后一条朋友圈与马有关

网红彭十六偷税被封杀曾成功转型明星

心之所向现代建构之美