网易首页 > 网易号 > 正文 申请入驻

林俊旸离职后首发长文复盘千问技术路线:坦言“没有全做对”

0
分享至

3月31日,林俊旸在社交平台转发推文,提到“model+harness is now over model only”。Harness为模型提供工具调用、环境交互、反馈闭环等能力,被比作“智能体的操作系统”(Agent = Model + Harness)。

这与他3月26日离开阿里后首次公开发声的长文《From ‘Reasoning’ Thinking to ‘Agentic’ Thinking(从推理式思考到智能体思考)》观点一致。



全文未谈及离职风波,也未透露个人后续去向,而是将焦点全程放在大模型技术发展路线上,既系统分享了对行业未来的判断,也坦诚复盘了千问团队在模型技术探索中的得失。

林俊旸指出,过去两年行业对大模型的评估标准与核心期待已被重塑。OpenAI的o1模型证明“思考”可被专门训练,DeepSeek-R1则印证推理式后训练可规模化落地,这标志着行业重心已从预训练转向强化学习后训练,数学、代码等可验证领域成为优化模型正确性的关键。

他坦言,2025年上半年行业焦点仍集中在“推理式思考”,而如今行业亟需寻找新突破口,其答案便是“智能体式思考”。核心是“为了行动而思考”,即模型在与环境交互中根据反馈更新计划、修正行为,实现与现实世界的闭环互动。

同时,林俊旸也复盘了千问团队的技术探索。2025年初,团队曾尝试打造统一系统,融合思考与指令模式,Qwen3便是这一方向的具体尝试,但实际落地困难重重。“我们没有全做对。”他坦诚,两种模式的数据分布与核心目标存在本质冲突,强行融合导致模型两端表现平庸,无法满足商业用户需求。为此,2025年下半年千问推出了独立的Instruct和Thinking版本。他强调,真正的融合应是让模型拥有平滑的推理力度光谱,自主分配算力,而非生硬拼接两种模式。

“推理链更长,不等于模型更聪明。”林俊旸明确表示,过长的推理链实则是算力的浪费,行业正从“训练模型”向“训练智能体”加速转型。他进一步解释,推理式思考与智能体式思考的优化目标截然不同,前者以内部思辨质量为评判标准,后者则聚焦模型在环境交互中能否持续取得进展,这也让行业核心问题从“能否想够久”转变为“能否支撑有效行动”。

随之而来的是训练核心的转变,即从单一模型转向“模型+环境”的完整系统,这就要求训练与推理实现彻底解耦。林俊旸最终指出,环境设计、相关基础设施等已成为行业核心竞争力,“好的思考”是能支撑有效行动的路径,未来防范“奖励作弊”将是关键挑战,而智能体式思考终将成为行业主流。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
金融危机要来?专家预测,2026到2027上半年,世界将爆发金融风暴

金融危机要来?专家预测,2026到2027上半年,世界将爆发金融风暴

真猫爷的渔场
2026-05-31 17:09:15
张雪机车回应:不满意第8!开度被限到85% 尾速很低 张雪打电话

张雪机车回应:不满意第8!开度被限到85% 尾速很低 张雪打电话

念洲
2026-05-31 08:28:04
江苏太仓一飞行营地坠机致死案续:获赔256.8万元,家属称将上诉

江苏太仓一飞行营地坠机致死案续:获赔256.8万元,家属称将上诉

澎湃新闻
2026-05-31 13:40:27
5月31日俄乌最新:辉煌的战果

5月31日俄乌最新:辉煌的战果

西楼饮月
2026-05-31 18:05:56
"我的钱可以买你的命!",男子高铁怒怼乘警,网友:查一下来源

"我的钱可以买你的命!",男子高铁怒怼乘警,网友:查一下来源

鲸探所长
2026-05-31 09:57:29
“大傻”去世15年后,儿子入狱孙子身亡,王晶曝他旧事:是狠角色

“大傻”去世15年后,儿子入狱孙子身亡,王晶曝他旧事:是狠角色

LULU生活家
2026-05-31 18:00:37
给钱我都不坐!多名特斯拉前员工坦言:马斯克吹的FSD根本不安全

给钱我都不坐!多名特斯拉前员工坦言:马斯克吹的FSD根本不安全

快科技
2026-05-31 14:09:06
亚美尼亚:俄罗斯还没学会文明打交道的方式

亚美尼亚:俄罗斯还没学会文明打交道的方式

名人苟或
2026-05-31 17:25:53
刚刚,直线拉升!狂飙12%!特朗普,突然发声

刚刚,直线拉升!狂飙12%!特朗普,突然发声

数据宝
2026-05-31 20:48:11
最近俩月,形势大变

最近俩月,形势大变

明人明察
2026-05-31 19:46:13
闹笑话了!黄仁勋摊牌:看不上华为韬定律,却被业内专家说不专业

闹笑话了!黄仁勋摊牌:看不上华为韬定律,却被业内专家说不专业

兵鉴史
2026-05-30 14:32:11
杀人诛心!巴黎老板霸气发声:甩掉姆巴佩,球队才成为顶级豪门!

杀人诛心!巴黎老板霸气发声:甩掉姆巴佩,球队才成为顶级豪门!

田先生篮球
2026-05-31 10:22:15
撤销外语学院不是终点,真正该“撤”的是那套失败的体系

撤销外语学院不是终点,真正该“撤”的是那套失败的体系

迷世书童
2026-05-31 13:35:42
王菲看演唱会,却把俞飞鸿送上了热搜?两个“老阿姨”的状态

王菲看演唱会,却把俞飞鸿送上了热搜?两个“老阿姨”的状态

童叔不飙车
2026-05-31 23:06:29
乌双线双杀,俄当日战损1560人,川普又开始吹捧乌克兰

乌双线双杀,俄当日战损1560人,川普又开始吹捧乌克兰

史政先锋
2026-05-31 16:46:18
成都多家茶馆被同一个号码举报“无证泡茶” 商家怀疑遭“职业索赔”报警获受理

成都多家茶馆被同一个号码举报“无证泡茶” 商家怀疑遭“职业索赔”报警获受理

封面新闻
2026-05-31 18:34:39
校长怒批成人礼:他们是成人了,不是成婚了!

校长怒批成人礼:他们是成人了,不是成婚了!

复转这些年
2026-05-31 21:08:55
虎父无犬子!曼联名宿19岁爱子压哨入选世界杯名单

虎父无犬子!曼联名宿19岁爱子压哨入选世界杯名单

仰卧撑FTUer
2026-05-31 18:57:03
中国U19男足斩获土伦杯开门红

中国U19男足斩获土伦杯开门红

五星体育
2026-05-31 23:12:34
成人女星此前许诺萨福诺夫每扑一球陪他一夜,结果后者0扑救

成人女星此前许诺萨福诺夫每扑一球陪他一夜,结果后者0扑救

懂球帝
2026-05-31 18:50:07
2026-06-01 00:52:49
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
101493文章数 66846关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

媒体:印度多个领域面临严重问题 莫迪发出罕见的号召

头条要闻

媒体:印度多个领域面临严重问题 莫迪发出罕见的号召

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

旅游
本地
数码
艺术
公开课

旅游要闻

大栅栏有六个老茶园

本地新闻

用剪纸的方式,打开江苏扬州

数码要闻

笔记本还要涨价!瑞银警告:产品内存成本压力山大

艺术要闻

耗资约24亿!新美术馆正式开放,深圳人沸腾!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版