深圳商报·读创客户端首席记者 袁静娴/文 记者 蔡玉兰/视频
1月10日,在清华大学基础模型北京市重点实验室与智谱AI联合发起的AGI-Next 前沿峰会上,中国大模型领域几条最具代表性的技术路线,少有地在同一张桌前完成了一次“对齐”。
这不仅是一场技术交流,更像一次阶段性共识的形成。
台上,既有刚刚带领智谱完成港股IPO、从学术走向产业深水区的清华教授唐杰,也有从OpenAI回国、首次以腾讯AI首席科学家身份公开亮相的姚顺雨,有长期主导阿里通义千问技术演进的林俊旸,以及在联邦学习与持续学习领域深耕多年的杨强教授。
他们的背景不同、路径各异,却在同一个问题上形成了清晰共振:大模型的主战场,正在从“更会聊天”,转向“真正做事”,并进一步迈向具备自主学习能力的智能体系统。
唐杰:Chat范式正收敛,下一步是让模型在真实环境中“把事做成”
作为中国最早系统性推动大模型落地的学者之一,唐杰在演讲中回顾了过去数年大模型能力的演进路径——从知识记忆、基础推理,到代码生成与复杂任务执行。
他直言,当前大模型在“会不会聊天”这个问题上,差距正在迅速缩小。
“继续在Chat能力上内卷,很可能只是做到性能接近,剩下更多是工程问题。”
在这一判断下,智谱将研发重心转向Thinking、Coding与Agent的深度融合。唐杰指出,真正的挑战不在于模型是否“懂”,而在于是否能在真实环境中稳定、可靠地完成复杂任务。
他以“用一句话生成一个完整可运行的游戏”为例说明,模型需要完成的不只是代码生成,而是包括任务拆解、状态维护、错误修复在内的多步执行过程。这要求模型具备长程规划能力与持续执行能力。
为此,智谱在训练中引入了可验证强化学习(RLVR)思路,将模型置于真实的编程环境、Web环境中,通过结果是否可运行、是否通过测试来形成反馈闭环。
“Benchmark 成绩并不等于用户体验。”唐杰强调,能不能一次跑通,才是决定模型价值的关键。
在更长远的技术判断中,他提出未来模型系统将不再是单一Transformer,而是由多模块构成的复杂智能体系统,包括快速反应的“系统一”、深度推理的“系统二”,以及支撑长期演化的自学习模块。
林俊旸:通用智能不只是模型,而是一个能自主使用工具的Generalist Agent
阿里通义千问技术负责人林俊旸,则从系统架构的角度,对通用智能的形态给出了更为明确的定义。
在他看来,通用人工智能的关键,不在于模型是否“什么都知道”,而在于是否具备自主使用工具、与环境持续交互的能力。这也是Qwen从“Generalist Model” 迈向“Generalist Agent” 的核心动因。
围绕这一目标,通义千问在多个方向同步推进:在文本与推理层面,通过Qwen3系列强化复杂reasoning能力;在编程与Agent方向,模型开始贴近真实软件工程流程,而非只在竞赛型问题中表现;在多模态方面,则着力解决“视觉增强但语言能力退化”的长期难题。
林俊旸特别强调,多模态能力不应是简单拼接,而应进入同一个“认知中枢”。“如果模型真的要形成自我认知,上下文理解必须足够长。”他透露,Qwen已在探索百万级甚至更长上下文窗口,以支撑跨任务、跨时间的连续理解与决策。
在训练范式上,他判断,未来的主线不再是静态标注数据,而是带环境反馈的多轮强化学习。模型需要在真实任务中不断试错、修正,才能真正进入生产工具链。
杨强:工业界跑得很快,但智能的“上界问题”仍需回答
作为联邦学习的重要奠基者,杨强教授在峰会上从基础研究角度,对当前大模型热潮进行了冷静审视。他指出,工业界的进展令人振奋,但学术界需要重新聚焦一些尚未被系统回答的关键问题:在有限算力与数据条件下,智能的理论上界在哪里?训练、推理与记忆应如何最优分配?持续学习如何避免误差累积?
他特别提到“持续学习”的挑战。与一次性训练不同,模型在长期运行中会不断引入噪音,如果缺乏有效的清理与校正机制,系统性能反而可能退化。“人类通过睡眠来整合和清理信息,智能系统也需要类似机制。”杨强指出。
在他看来,如何让模型在长期运行中保持稳定与可信,将是决定其走向真实世界的重要前提,这同样需要学术界与工业界的深度协作。
姚顺雨回国首秀,AI“下半场”如何真正落地?
如果说主题演讲回答的是“技术该往哪里走”,那么圆桌论坛讨论的,则是“这些方向,是否真的能跑通”。而在这一环节,姚顺雨的亮相成为了最大焦点。他于2025年12月正式加入腾讯,担任首席AI科学家,此次AGI-Next峰会是其回国后的首次公开发声。
姚顺雨指出,当前AI产业已经明显进入分化阶段。在他看来,toC与toB场景的差异正在被低估。“在消费端,模型能力的提升,用户体感正在变弱;但在企业端,尤其是编程、数据分析、自动化流程中,智能水平几乎直接等价于生产力。”他说。
这一判断也引发了圆桌嘉宾的进一步讨论。多位与会者认为,在toB场景中,模型并不是“锦上添花”,而是正在重构工作方式本身——从写代码、做分析,到规划任务、分配步骤。
其次,围绕“Chat是否已经到头”这一问题,圆桌上并非完全一致。
唐杰指出,Chat能力仍是基础,但单纯以对话为中心的产品形态,已经难以承载更复杂的任务需求。真正的挑战,在于模型能否在真实环境中持续执行任务,并处理失败。
林俊旸则补充认为,Agent并不是“去Chat化”,而是在Chat之上,引入工具调用、长期记忆与环境反馈,让模型具备行动能力。
姚顺雨对此表示认同,并进一步指出,Agent的难点并不在演示,而在稳定性。“当系统开始自动做事,失败成本会迅速放大,这也是为什么在toB场景中,模型的可靠性会被无限放大。”
在模型与应用的关系上,圆桌讨论也呈现出更具现实感的判断。姚顺雨指出,在消费级应用中,模型与产品的深度耦合,仍然是提升体验的重要方式;但在企业级市场,模型与应用分层,反而可能释放更大的创新空间。
“企业真正需要的,不是一个万能模型,而是能嵌入现有流程、理解业务上下文的智能系统。”
这一观点,也与现场嘉宾对“Context重要性”的讨论形成呼应。多位与会者认为,真实业务场景本身,正在成为比模型规模更重要的竞争要素。
作为曾在OpenAI长期工作的研究人员,姚顺雨也从更宏观的角度分享了他对全球AI竞争格局的观察。他认为,当前全球AI竞争,已不仅是模型能力之争,更是人才、工程体系与长期投入能力的综合博弈。年轻一代研究者的流动,正在重塑太平洋两岸的创新结构。
他的回国,被多位与会者视为一个标志性事件——不仅意味着个人选择的变化,也反映出中国在基础模型、推理框架等领域,正逐步形成更完整的技术土壤。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.