网易首页 > 网易号 > 正文 申请入驻

姚顺雨、唐杰、林俊旸、杨强同台发声:中国大模型集体迈向“做事时代”

0
分享至

深圳商报·读创客户端首席记者 袁静娴/文 记者 蔡玉兰/视频

1月10日,在清华大学基础模型北京市重点实验室与智谱AI联合发起的AGI-Next 前沿峰会上,中国大模型领域几条最具代表性的技术路线,少有地在同一张桌前完成了一次“对齐”。

这不仅是一场技术交流,更像一次阶段性共识的形成。

台上,既有刚刚带领智谱完成港股IPO、从学术走向产业深水区的清华教授唐杰,也有从OpenAI回国、首次以腾讯AI首席科学家身份公开亮相的姚顺雨,有长期主导阿里通义千问技术演进的林俊旸,以及在联邦学习与持续学习领域深耕多年的杨强教授。

他们的背景不同、路径各异,却在同一个问题上形成了清晰共振:大模型的主战场,正在从“更会聊天”,转向“真正做事”,并进一步迈向具备自主学习能力的智能体系统。

唐杰:Chat范式正收敛,下一步是让模型在真实环境中“把事做成”

作为中国最早系统性推动大模型落地的学者之一,唐杰在演讲中回顾了过去数年大模型能力的演进路径——从知识记忆、基础推理,到代码生成与复杂任务执行。

他直言,当前大模型在“会不会聊天”这个问题上,差距正在迅速缩小。

“继续在Chat能力上内卷,很可能只是做到性能接近,剩下更多是工程问题。”

在这一判断下,智谱将研发重心转向Thinking、Coding与Agent的深度融合。唐杰指出,真正的挑战不在于模型是否“懂”,而在于是否能在真实环境中稳定、可靠地完成复杂任务。

他以“用一句话生成一个完整可运行的游戏”为例说明,模型需要完成的不只是代码生成,而是包括任务拆解、状态维护、错误修复在内的多步执行过程。这要求模型具备长程规划能力与持续执行能力。

为此,智谱在训练中引入了可验证强化学习(RLVR)思路,将模型置于真实的编程环境、Web环境中,通过结果是否可运行、是否通过测试来形成反馈闭环。

“Benchmark 成绩并不等于用户体验。”唐杰强调,能不能一次跑通,才是决定模型价值的关键。

在更长远的技术判断中,他提出未来模型系统将不再是单一Transformer,而是由多模块构成的复杂智能体系统,包括快速反应的“系统一”、深度推理的“系统二”,以及支撑长期演化的自学习模块。

林俊旸:通用智能不只是模型,而是一个能自主使用工具的Generalist Agent

阿里通义千问技术负责人林俊旸,则从系统架构的角度,对通用智能的形态给出了更为明确的定义。

在他看来,通用人工智能的关键,不在于模型是否“什么都知道”,而在于是否具备自主使用工具、与环境持续交互的能力。这也是Qwen从“Generalist Model” 迈向“Generalist Agent” 的核心动因。

围绕这一目标,通义千问在多个方向同步推进:在文本与推理层面,通过Qwen3系列强化复杂reasoning能力;在编程与Agent方向,模型开始贴近真实软件工程流程,而非只在竞赛型问题中表现;在多模态方面,则着力解决“视觉增强但语言能力退化”的长期难题。

林俊旸特别强调,多模态能力不应是简单拼接,而应进入同一个“认知中枢”。“如果模型真的要形成自我认知,上下文理解必须足够长。”他透露,Qwen已在探索百万级甚至更长上下文窗口,以支撑跨任务、跨时间的连续理解与决策。

在训练范式上,他判断,未来的主线不再是静态标注数据,而是带环境反馈的多轮强化学习。模型需要在真实任务中不断试错、修正,才能真正进入生产工具链。

杨强:工业界跑得很快,但智能的“上界问题”仍需回答

作为联邦学习的重要奠基者,杨强教授在峰会上从基础研究角度,对当前大模型热潮进行了冷静审视。他指出,工业界的进展令人振奋,但学术界需要重新聚焦一些尚未被系统回答的关键问题:在有限算力与数据条件下,智能的理论上界在哪里?训练、推理与记忆应如何最优分配?持续学习如何避免误差累积?

他特别提到“持续学习”的挑战。与一次性训练不同,模型在长期运行中会不断引入噪音,如果缺乏有效的清理与校正机制,系统性能反而可能退化。“人类通过睡眠来整合和清理信息,智能系统也需要类似机制。”杨强指出。

在他看来,如何让模型在长期运行中保持稳定与可信,将是决定其走向真实世界的重要前提,这同样需要学术界与工业界的深度协作。

姚顺雨回国首秀,AI“下半场”如何真正落地?

如果说主题演讲回答的是“技术该往哪里走”,那么圆桌论坛讨论的,则是“这些方向,是否真的能跑通”。而在这一环节,姚顺雨的亮相成为了最大焦点。他于2025年12月正式加入腾讯,担任首席AI科学家,此次AGI-Next峰会是其回国后的首次公开发声。

姚顺雨指出,当前AI产业已经明显进入分化阶段。在他看来,toC与toB场景的差异正在被低估。“在消费端,模型能力的提升,用户体感正在变弱;但在企业端,尤其是编程、数据分析、自动化流程中,智能水平几乎直接等价于生产力。”他说。

这一判断也引发了圆桌嘉宾的进一步讨论。多位与会者认为,在toB场景中,模型并不是“锦上添花”,而是正在重构工作方式本身——从写代码、做分析,到规划任务、分配步骤。

其次,围绕“Chat是否已经到头”这一问题,圆桌上并非完全一致。

唐杰指出,Chat能力仍是基础,但单纯以对话为中心的产品形态,已经难以承载更复杂的任务需求。真正的挑战,在于模型能否在真实环境中持续执行任务,并处理失败。

林俊旸则补充认为,Agent并不是“去Chat化”,而是在Chat之上,引入工具调用、长期记忆与环境反馈,让模型具备行动能力。

姚顺雨对此表示认同,并进一步指出,Agent的难点并不在演示,而在稳定性。“当系统开始自动做事,失败成本会迅速放大,这也是为什么在toB场景中,模型的可靠性会被无限放大。”

在模型与应用的关系上,圆桌讨论也呈现出更具现实感的判断。姚顺雨指出,在消费级应用中,模型与产品的深度耦合,仍然是提升体验的重要方式;但在企业级市场,模型与应用分层,反而可能释放更大的创新空间。

“企业真正需要的,不是一个万能模型,而是能嵌入现有流程、理解业务上下文的智能系统。”

这一观点,也与现场嘉宾对“Context重要性”的讨论形成呼应。多位与会者认为,真实业务场景本身,正在成为比模型规模更重要的竞争要素。

作为曾在OpenAI长期工作的研究人员,姚顺雨也从更宏观的角度分享了他对全球AI竞争格局的观察。他认为,当前全球AI竞争,已不仅是模型能力之争,更是人才、工程体系与长期投入能力的综合博弈。年轻一代研究者的流动,正在重塑太平洋两岸的创新结构。

他的回国,被多位与会者视为一个标志性事件——不仅意味着个人选择的变化,也反映出中国在基础模型、推理框架等领域,正逐步形成更完整的技术土壤。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
18岁伊斯兰少女直播拒戴头巾,被冷血父亲荣誉处决。

18岁伊斯兰少女直播拒戴头巾,被冷血父亲荣誉处决。

环球趣闻分享
2026-01-07 13:30:09
留给大清的时间,真的不多了

留给大清的时间,真的不多了

我是历史其实挺有趣
2026-01-03 08:50:37
碎三观!重庆一男子和妻妹发生不当关系转账380万,妻子默许了…

碎三观!重庆一男子和妻妹发生不当关系转账380万,妻子默许了…

火山诗话
2026-01-14 09:25:46
株洲跟风杀猪宴后续:当地文旅被网友骂惨,灿灿紧急回应两件事!

株洲跟风杀猪宴后续:当地文旅被网友骂惨,灿灿紧急回应两件事!

鋭娱之乐
2026-01-14 15:15:41
黄蜂官方:将为球队传奇人物戴尔-库里退役30号球衣

黄蜂官方:将为球队传奇人物戴尔-库里退役30号球衣

北青网-北京青年报
2026-01-15 07:19:03
出轨忍了,私生子也忍了,套现2亿后,豪门“赘婿”最终被踢出局

出轨忍了,私生子也忍了,套现2亿后,豪门“赘婿”最终被踢出局

火之文
2026-01-13 16:53:35
“马背上的女县长”意外坠马去世,曾发布新年愿望称:2026一如即往,在热爱里驰骋

“马背上的女县长”意外坠马去世,曾发布新年愿望称:2026一如即往,在热爱里驰骋

极目新闻
2026-01-15 00:43:21
南博风波后续:全网追查“借画不还”的神秘老同志,揭开历史迷雾

南博风波后续:全网追查“借画不还”的神秘老同志,揭开历史迷雾

公子麦少
2025-12-21 14:54:43
俄驻委大使披露详情:马杜罗及妻子被控制时,身边实际上没有任何人;防空系统的远程预警站通信出了问题

俄驻委大使披露详情:马杜罗及妻子被控制时,身边实际上没有任何人;防空系统的远程预警站通信出了问题

扬子晚报
2026-01-11 11:42:19
高市安排妥了,李在明在日本吃晚宴,饭还没下肚,中方先回了14字

高市安排妥了,李在明在日本吃晚宴,饭还没下肚,中方先回了14字

科普100克克
2026-01-14 14:03:11
一场3-1,让孔帕尼创造历史,缔造德甲新纪录,冠军恐无悬念

一场3-1,让孔帕尼创造历史,缔造德甲新纪录,冠军恐无悬念

足球狗说
2026-01-15 06:53:51
董宇辉带货的大别山黄油母鸡遭打假,粉丝:我不相信他卖坏东西

董宇辉带货的大别山黄油母鸡遭打假,粉丝:我不相信他卖坏东西

映射生活的身影
2026-01-14 17:16:39
洗碗阿姨睡在饭店四年,店长查看监控破防,隔天马上送给她68万

洗碗阿姨睡在饭店四年,店长查看监控破防,隔天马上送给她68万

程哥讲堂
2025-06-14 17:34:42
“田朴珺们”的上位:这些真相,没人敢明说

“田朴珺们”的上位:这些真相,没人敢明说

红大娘娱乐
2026-01-12 22:10:28
2026养老新政!每月800元补贴全国开领,这三类人直接被拒门外

2026养老新政!每月800元补贴全国开领,这三类人直接被拒门外

复转这些年
2026-01-14 22:31:12
杀年猪女孩“呆呆”涨粉200万,否认注册商标,村委称不敢想:第一次村里有这么大流量

杀年猪女孩“呆呆”涨粉200万,否认注册商标,村委称不敢想:第一次村里有这么大流量

大风新闻
2026-01-14 16:53:19
重庆百货:2025年度归母净利润10.21亿元,同比下降22.36%

重庆百货:2025年度归母净利润10.21亿元,同比下降22.36%

界面新闻
2026-01-14 16:47:46
上映9天票房27万,大鹏投资的新片再次被影迷抛弃,亏本已成定局

上映9天票房27万,大鹏投资的新片再次被影迷抛弃,亏本已成定局

八卦南风
2026-01-14 18:08:33
宋家三胞胎全变一米八欧巴 发育迅速变声又长胡子 学习刻苦是学霸

宋家三胞胎全变一米八欧巴 发育迅速变声又长胡子 学习刻苦是学霸

昆山市江西商会
2026-01-14 00:30:28
美媒:美军使用最新秘密武器,瘫痪中俄雷达,让委安保失去战斗力

美媒:美军使用最新秘密武器,瘫痪中俄雷达,让委安保失去战斗力

兵国大事
2026-01-12 17:48:56
2026-01-15 08:35:00
读创 incentive-icons
读创
读创系深圳报业集团主办的权威财经新媒体,聚焦财经热点,链接资本市场。
19829文章数 40关注度
往期回顾 全部

科技要闻

反垄断大棒,为何砸向了携程

头条要闻

贺娇龙意外坠马头部重伤离世 最后一条朋友圈与马有关

头条要闻

贺娇龙意外坠马头部重伤离世 最后一条朋友圈与马有关

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

家居
亲子
房产
旅游
健康

家居要闻

心之所向 现代建构之美

亲子要闻

我们不对你好,谁对你好~

房产要闻

热销17亿后!天正·三亚湾壹号,被爆违建!

旅游要闻

缙云丨余道勇:时光在天星沟交汇

血常规3项异常,是身体警报!

无障碍浏览 进入关怀版