网易首页 > 网易号 > 正文 申请入驻

前阿里千问负责人林俊旸离职后首发长文,探讨AI未来的发展方向:从训练模型转向训练智能体

0
分享至

3月26日,原阿里通义千问(Qwen)技术负责人林俊旸(Justin Lin)在社交平台上发布了一篇题为“From ‘Reasoning’ Thinking to‘Agentic’ Thinking(从推理式思考到智能体思考)的文章长文。这是他自本月初从阿里辞职之后发布的第一篇长文。在这篇文章中,林俊旸系统性地复盘了推理模型阶段的特征,并探讨了AI未来的发展方向:从训练模型转向训练智能体。

林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向。但"合并"说起来容易,做好却极难。

真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。

分开做在实践中仍然有吸引力。2025 年下半年,Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。

推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示,他提到,千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。

智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。

这意味着,核心问题从“模型能否思考得足够久?”转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。

在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。

林俊旸预测,智能体式思考会成为主流。

《科创板日报》3月4日讯,《科创板日报》记者注意到,3月4日下午,阿里千问大模型核心负责人林俊旸新发朋友圈表示:抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。qwen 的兄弟们,按照原来安排继续干,没问题的。而就在昨日凌晨,林俊旸在社交媒体发文称:me stepping down. bye my beloved qwen.(我卸任了。再见了,我亲爱的千问。)



3月4日凌晨,阿里Qwen技术负责人林俊旸在社交平台上与千问道别,称“我退出了”。随后,阿里巴巴通义实验室科学家惠彬原(Binyuan Hui)转发该条博文并表示自己也退出了千问。南都N视频记者就此向阿里云方面求证,截至发稿尚无回复。


林俊旸在社交平台上与千问道别。


惠彬原称自己也退出了。

林俊旸系阿里千问模型的重要负责人。公开资料显示,林俊旸1993年出生,毕业于北京大学,系阿里巴巴达摩院高级算法专家、阿里通义千问系列大模型技术负责人,主导开发了全球领先的开源大模型。他的研究领域包括自然语言处理和多模态表示学习,研究兴趣集中于大规模语言模型和多模态大模型,曾在多个顶级会议发表多篇论文。公开信息显示,林俊旸对通义千问的技术贡献突出,如他主导开发Qwen3.0等模型性能超越Llama2-70B、首创多模态Agent框架,增强视觉/语音理解能力、推动构建中文社区最大开源模型生态体系等。

有业内人士猜测,林俊旸的离开或由于其考核目标变成了日活跃用户数。对于林俊旸离开后谁会接任其位置,该业内人士也提到或是一位来自谷歌Gemini团队、以日活跃用户数(DAU)指标为导向的非核心人才。南都记者就此向阿里云方面求证,截至发稿尚无回复。

林俊旸与月之暗面创始人兼CEO杨植麟、腾讯首席AI科学家姚顺雨和清华大学教授、智谱创始人兼首席科学家唐杰被在业内并称“基模四杰”,其他几位均为月之暗面、腾讯、智谱等企业的模型掌门人。

今年1月在中关村,林俊旸还提到,自己2021年做模型的时候,阿里芯片团队的人来问自己三年后模型主流架构是不是Transformer和多模态,因为三年后模型才能流片。他表示,“三年之后,我在不在阿里巴巴,我都不知道。但最后我今天还在阿里巴巴,然后他果然还是Transformer,还是多模态,我就非常懊悔为什么当时没有去催他去做。”

模型进展方面,3月3日,阿里巴巴再度开源4款小尺寸千问3.5系列模型。其中最小的0.8B和2B两款,体积极小,推理速度极快,适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。据悉,四款Qwen3.5新模型虽是小尺寸,但均拥有原生多模态能力,以极小的参数量实现了极大的性能提升。模型发布后还迅速引来马斯克在社交媒体上点赞评论,称阿里千问模型“智能密度令人印象深刻”。

来源:澎湃新闻、第一财经、界面新闻、财联社、南方都市报

【来源:潇湘晨报】

报料、维权通道:应用市场下载“晨视频”客户端,搜索“报料”一键直达,或拨打热线0731-85571188;如需内容合作,请拨打政企服务专席19176699651,商务合作联系0731-85572288。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小米高管内训内容曝光:承认大家电「质量差」,一批供应商要完蛋

小米高管内训内容曝光:承认大家电「质量差」,一批供应商要完蛋

雷科技
2026-04-03 14:41:09
1年4900万!天价合同!彻底砸手里了

1年4900万!天价合同!彻底砸手里了

篮球教学论坛
2026-04-05 14:56:14
35岁张水华,静息心率30次/分,最大摄氧量60+,马拉松“圣体”

35岁张水华,静息心率30次/分,最大摄氧量60+,马拉松“圣体”

老王谈跑步
2026-04-05 16:12:43
《清明上班图》阴间设计刷屏!网友:太恐怖

《清明上班图》阴间设计刷屏!网友:太恐怖

广告创意
2026-04-05 09:16:46
中甲3轮积分榜:升班马9分领跑,第2支负分清零球队诞生,3队首胜

中甲3轮积分榜:升班马9分领跑,第2支负分清零球队诞生,3队首胜

中超伪球迷
2026-04-05 17:40:41
连场世界波!杜月徵轰中超处子球,连过2人爆射,46战首球

连场世界波!杜月徵轰中超处子球,连过2人爆射,46战首球

奥拜尔
2026-04-05 17:12:02
湖人又又报销一个,季后赛就看老詹

湖人又又报销一个,季后赛就看老詹

风子说个球
2026-04-05 18:32:51
朝鲜宣布停用中国卫星,改用俄罗斯卫星,无形中帮了中国一个忙

朝鲜宣布停用中国卫星,改用俄罗斯卫星,无形中帮了中国一个忙

花寒弦絮
2026-04-04 00:48:59
荒唐!猫王一生睡遍3000女人,42岁惨死卧室,内裤褪到大腿根

荒唐!猫王一生睡遍3000女人,42岁惨死卧室,内裤褪到大腿根

七阿姨爱八卦
2026-04-04 18:04:16
一嫁前国足谢辉,二嫁普信男,44岁2次离婚的佟晨洁才是人间清醒

一嫁前国足谢辉,二嫁普信男,44岁2次离婚的佟晨洁才是人间清醒

白面书誏
2026-04-02 19:20:05
下跌未结束!黄金有望跌破4000美元/盎司,白银有望跌破60美元/盎司

下跌未结束!黄金有望跌破4000美元/盎司,白银有望跌破60美元/盎司

东方豪侠
2026-04-05 09:47:22
安庆失踪女童后续:手机在水沟找到,奶茶店主道重要线索

安庆失踪女童后续:手机在水沟找到,奶茶店主道重要线索

奇思妙想草叶君
2026-04-05 16:58:36
大陆说到做到,中欧班列铁轨已拆,立陶宛被打疼,找台当局要钱

大陆说到做到,中欧班列铁轨已拆,立陶宛被打疼,找台当局要钱

主宰未来
2026-04-05 15:07:51
西方军事专家:只有吉尔吉斯斯坦知道,中国早就是最强超级大国了

西方军事专家:只有吉尔吉斯斯坦知道,中国早就是最强超级大国了

混沌录
2026-04-05 16:33:12
深圳一小区巷道发现遗书!字迹像孩子所写,现场逐户排查

深圳一小区巷道发现遗书!字迹像孩子所写,现场逐户排查

南方都市报
2026-04-05 15:48:43
癌症患者好消息!血常规这三项指标正常,癌症基本不会再复发了

癌症患者好消息!血常规这三项指标正常,癌症基本不会再复发了

健康之光
2026-04-05 13:50:06
日媒:一伊朗籍男子在日本被殴打致死,警方展开调查

日媒:一伊朗籍男子在日本被殴打致死,警方展开调查

澎湃新闻
2026-04-05 13:11:12
不装阔不套近乎!李亚鹏隔空回应张雪:现状买不起,但兄弟我拉群

不装阔不套近乎!李亚鹏隔空回应张雪:现状买不起,但兄弟我拉群

童叔不飙车
2026-04-04 23:56:13
匈牙利2026年大选前,大规模贿选指控震惊全国

匈牙利2026年大选前,大规模贿选指控震惊全国

最新声音
2026-04-05 15:53:19
官方:足球中国将转播蒙太古杯U-16女足决赛日本VS中国

官方:足球中国将转播蒙太古杯U-16女足决赛日本VS中国

懂球帝
2026-04-05 17:16:38
2026-04-05 19:16:49
潇湘晨报 incentive-icons
潇湘晨报
潇湘晨报,影响湖南
124417文章数 338121关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

自称将劳斯莱斯变现 陈光标晒捐款图:张雪迟迟未提车

头条要闻

自称将劳斯莱斯变现 陈光标晒捐款图:张雪迟迟未提车

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

本地
家居
亲子
旅游
公开课

本地新闻

跟着歌声游安徽,听古村回响

家居要闻

温馨多元 爱的具象化

亲子要闻

别把过敏当感冒 这份儿童春季过敏防护指南请收好

旅游要闻

清明假期第二天 北京市属公园迎客87.36万人次

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版