网易首页 > 网易号 > 正文 申请入驻

前阿里千问负责人林俊旸离职后首发长文,探讨AI未来的发展方向:从训练模型转向训练智能体

0
分享至

3月26日,原阿里通义千问(Qwen)技术负责人林俊旸(Justin Lin)在社交平台上发布了一篇题为“From ‘Reasoning’ Thinking to‘Agentic’ Thinking(从推理式思考到智能体思考)的文章长文。这是他自本月初从阿里辞职之后发布的第一篇长文。在这篇文章中,林俊旸系统性地复盘了推理模型阶段的特征,并探讨了AI未来的发展方向:从训练模型转向训练智能体。

林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向。但"合并"说起来容易,做好却极难。

真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。

分开做在实践中仍然有吸引力。2025 年下半年,Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。

推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示,他提到,千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。

智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。

这意味着,核心问题从“模型能否思考得足够久?”转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。

在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。

林俊旸预测,智能体式思考会成为主流。

《科创板日报》3月4日讯,《科创板日报》记者注意到,3月4日下午,阿里千问大模型核心负责人林俊旸新发朋友圈表示:抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。qwen 的兄弟们,按照原来安排继续干,没问题的。而就在昨日凌晨,林俊旸在社交媒体发文称:me stepping down. bye my beloved qwen.(我卸任了。再见了,我亲爱的千问。)



3月4日凌晨,阿里Qwen技术负责人林俊旸在社交平台上与千问道别,称“我退出了”。随后,阿里巴巴通义实验室科学家惠彬原(Binyuan Hui)转发该条博文并表示自己也退出了千问。南都N视频记者就此向阿里云方面求证,截至发稿尚无回复。


林俊旸在社交平台上与千问道别。


惠彬原称自己也退出了。

林俊旸系阿里千问模型的重要负责人。公开资料显示,林俊旸1993年出生,毕业于北京大学,系阿里巴巴达摩院高级算法专家、阿里通义千问系列大模型技术负责人,主导开发了全球领先的开源大模型。他的研究领域包括自然语言处理和多模态表示学习,研究兴趣集中于大规模语言模型和多模态大模型,曾在多个顶级会议发表多篇论文。公开信息显示,林俊旸对通义千问的技术贡献突出,如他主导开发Qwen3.0等模型性能超越Llama2-70B、首创多模态Agent框架,增强视觉/语音理解能力、推动构建中文社区最大开源模型生态体系等。

有业内人士猜测,林俊旸的离开或由于其考核目标变成了日活跃用户数。对于林俊旸离开后谁会接任其位置,该业内人士也提到或是一位来自谷歌Gemini团队、以日活跃用户数(DAU)指标为导向的非核心人才。南都记者就此向阿里云方面求证,截至发稿尚无回复。

林俊旸与月之暗面创始人兼CEO杨植麟、腾讯首席AI科学家姚顺雨和清华大学教授、智谱创始人兼首席科学家唐杰被在业内并称“基模四杰”,其他几位均为月之暗面、腾讯、智谱等企业的模型掌门人。

今年1月在中关村,林俊旸还提到,自己2021年做模型的时候,阿里芯片团队的人来问自己三年后模型主流架构是不是Transformer和多模态,因为三年后模型才能流片。他表示,“三年之后,我在不在阿里巴巴,我都不知道。但最后我今天还在阿里巴巴,然后他果然还是Transformer,还是多模态,我就非常懊悔为什么当时没有去催他去做。”

模型进展方面,3月3日,阿里巴巴再度开源4款小尺寸千问3.5系列模型。其中最小的0.8B和2B两款,体积极小,推理速度极快,适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。据悉,四款Qwen3.5新模型虽是小尺寸,但均拥有原生多模态能力,以极小的参数量实现了极大的性能提升。模型发布后还迅速引来马斯克在社交媒体上点赞评论,称阿里千问模型“智能密度令人印象深刻”。

来源:澎湃新闻、第一财经、界面新闻、财联社、南方都市报

【来源:潇湘晨报】

报料、维权通道:应用市场下载“晨视频”客户端,搜索“报料”一键直达,或拨打热线0731-85571188;如需内容合作,请拨打政企服务专席19176699651,商务合作联系0731-85572288。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
同事一个月请了三次丧假,结果领导说:你家亲戚死光了?然后同事就给了领导一耳光!我们上去拉偏架,最后领导被揍的鼻青脸肿,还降职调岗

同事一个月请了三次丧假,结果领导说:你家亲戚死光了?然后同事就给了领导一耳光!我们上去拉偏架,最后领导被揍的鼻青脸肿,还降职调岗

大爱三湘
2026-05-28 21:14:00
NBA最有钱老板是快船鲍尔默,那最穷老板是谁?网友:没想到是他

NBA最有钱老板是快船鲍尔默,那最穷老板是谁?网友:没想到是他

钱说体育
2026-05-29 13:15:32
馆长开直播痛苦忏悔,称过去的言行对不起大陆,反遭网友集体拆台

馆长开直播痛苦忏悔,称过去的言行对不起大陆,反遭网友集体拆台

谭谈社会
2026-05-29 11:01:34
拼多多控股Temu因未能遏制非法商品销售,被欧盟处15.7亿元罚款

拼多多控股Temu因未能遏制非法商品销售,被欧盟处15.7亿元罚款

凡人学电脑
2026-05-29 22:37:39
日本开始下狠手?拉黑110多家中企,围堵芯片原料,却被一招反制

日本开始下狠手?拉黑110多家中企,围堵芯片原料,却被一招反制

疯狂的小菠萝
2026-05-30 16:19:46
枪支失火打断老农脊椎致残,22年申诉无果,儿子举刀砍向4名法官

枪支失火打断老农脊椎致残,22年申诉无果,儿子举刀砍向4名法官

易玄
2026-05-29 09:47:13
大定破2万!余承东:全新M9是地球上最强SUV,没有之一!网友:广告法能不能管管他

大定破2万!余承东:全新M9是地球上最强SUV,没有之一!网友:广告法能不能管管他

大白聊IT
2026-05-28 21:21:39
1.7亿,恭喜里夫斯!骑士发力,詹姆斯+字母哥...

1.7亿,恭喜里夫斯!骑士发力,詹姆斯+字母哥...

体育新角度
2026-05-30 15:46:59
A股重磅资金报告:周五杀跌元凶浮出水面!真相让散户无法接受!

A股重磅资金报告:周五杀跌元凶浮出水面!真相让散户无法接受!

丁丁鲤史纪
2026-05-30 13:54:27
欧洲女议员:购买不等于拥有 那盗版就不是偷窃

欧洲女议员:购买不等于拥有 那盗版就不是偷窃

3DM游戏
2026-05-27 22:03:20
为什么往死里扫黄?网友分享太真实了,一次说透

为什么往死里扫黄?网友分享太真实了,一次说透

另子维爱读史
2026-05-27 20:16:03
脏乱差!美媒曾评:国际空间站像垃圾堆,中国空间站像苹果专卖店

脏乱差!美媒曾评:国际空间站像垃圾堆,中国空间站像苹果专卖店

混沌录
2026-05-28 22:53:01
夏天,这碱性菜再贵也要多吃,一降火、二解暑,三补钙补钾,好吃

夏天,这碱性菜再贵也要多吃,一降火、二解暑,三补钙补钾,好吃

阿龙美食记
2026-05-29 21:52:34
外网看傻眼!536万亩麦田告急,中国救援刷屏:粮食是命,不能丢

外网看傻眼!536万亩麦田告急,中国救援刷屏:粮食是命,不能丢

黑鹰观军事
2026-05-29 15:15:34
称台积电领先华为韬定律十年后,黄仁勋宣布在中国台湾投资万亿元

称台积电领先华为韬定律十年后,黄仁勋宣布在中国台湾投资万亿元

火星宏观
2026-05-30 11:07:16
官博认证!!!他就是戈贝尔+库里+杜兰特!

官博认证!!!他就是戈贝尔+库里+杜兰特!

柚子说球
2026-05-29 22:47:39
普京:有理由认为俄乌冲突临近收尾

普京:有理由认为俄乌冲突临近收尾

澎湃新闻
2026-05-30 01:24:05
告诫:最伤眼睛的行为,不是玩手机!而是频繁地去做这6件事

告诫:最伤眼睛的行为,不是玩手机!而是频繁地去做这6件事

侯医生谈健康
2026-05-10 15:20:03
中国没给面子,普京回国后认清现实,沉默一周后,终究还是妥协了

中国没给面子,普京回国后认清现实,沉默一周后,终究还是妥协了

吃货的分享
2026-05-30 15:32:16
猪皮再次成为关注对象?医生提醒:吃猪皮时一定要牢记3个关键点

猪皮再次成为关注对象?医生提醒:吃猪皮时一定要牢记3个关键点

芹姐说生活
2026-05-30 14:44:09
2026-05-30 18:07:00
潇湘晨报 incentive-icons
潇湘晨报
潇湘晨报,影响湖南
128192文章数 338812关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

普京称俄乌冲突临近收尾同日空袭基辅 媒体:并行不悖

头条要闻

普京称俄乌冲突临近收尾同日空袭基辅 媒体:并行不悖

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

游戏
艺术
数码
本地
公开课

多款PS4游戏将于六月下架 包含《使命召唤:战区》

艺术要闻

王文生 2026风景写生新作

数码要闻

LG 32寸电子纸海报,商用显示新玩法?

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版