网易首页 > 网易号 > 正文 申请入驻

林俊旸离职后首发长文复盘千问技术路线:坦言“没有全做对”

0
分享至

3月31日,林俊旸在社交平台转发推文,提到“model+harness is now over model only”。Harness为模型提供工具调用、环境交互、反馈闭环等能力,被比作“智能体的操作系统”(Agent = Model + Harness)。

这与他3月26日离开阿里后首次公开发声的长文《From ‘Reasoning’ Thinking to ‘Agentic’ Thinking(从推理式思考到智能体思考)》观点一致。



全文未谈及离职风波,也未透露个人后续去向,而是将焦点全程放在大模型技术发展路线上,既系统分享了对行业未来的判断,也坦诚复盘了千问团队在模型技术探索中的得失。

林俊旸指出,过去两年行业对大模型的评估标准与核心期待已被重塑。OpenAI的o1模型证明“思考”可被专门训练,DeepSeek-R1则印证推理式后训练可规模化落地,这标志着行业重心已从预训练转向强化学习后训练,数学、代码等可验证领域成为优化模型正确性的关键。

他坦言,2025年上半年行业焦点仍集中在“推理式思考”,而如今行业亟需寻找新突破口,其答案便是“智能体式思考”。核心是“为了行动而思考”,即模型在与环境交互中根据反馈更新计划、修正行为,实现与现实世界的闭环互动。

同时,林俊旸也复盘了千问团队的技术探索。2025年初,团队曾尝试打造统一系统,融合思考与指令模式,Qwen3便是这一方向的具体尝试,但实际落地困难重重。“我们没有全做对。”他坦诚,两种模式的数据分布与核心目标存在本质冲突,强行融合导致模型两端表现平庸,无法满足商业用户需求。为此,2025年下半年千问推出了独立的Instruct和Thinking版本。他强调,真正的融合应是让模型拥有平滑的推理力度光谱,自主分配算力,而非生硬拼接两种模式。

“推理链更长,不等于模型更聪明。”林俊旸明确表示,过长的推理链实则是算力的浪费,行业正从“训练模型”向“训练智能体”加速转型。他进一步解释,推理式思考与智能体式思考的优化目标截然不同,前者以内部思辨质量为评判标准,后者则聚焦模型在环境交互中能否持续取得进展,这也让行业核心问题从“能否想够久”转变为“能否支撑有效行动”。

随之而来的是训练核心的转变,即从单一模型转向“模型+环境”的完整系统,这就要求训练与推理实现彻底解耦。林俊旸最终指出,环境设计、相关基础设施等已成为行业核心竞争力,“好的思考”是能支撑有效行动的路径,未来防范“奖励作弊”将是关键挑战,而智能体式思考终将成为行业主流。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
盘点:战争满30日,伊朗被斩首高官全名单!下一个会是谁?

盘点:战争满30日,伊朗被斩首高官全名单!下一个会是谁?

大江看潮
2026-03-30 10:03:00
神医扁鹊的养生秘诀:三不要、三不吃,流传千年的健康忠告

神医扁鹊的养生秘诀:三不要、三不吃,流传千年的健康忠告

千秋文化
2026-03-28 21:05:04
范冰冰曼谷慈善夜紫藤花裙亮相,东方雅致与奢华感完美融合

范冰冰曼谷慈善夜紫藤花裙亮相,东方雅致与奢华感完美融合

述家娱记
2026-03-30 11:13:45
他号称“屠夫”,4年制造3千多起命案,专爱破瓜少女,最终被枪毙

他号称“屠夫”,4年制造3千多起命案,专爱破瓜少女,最终被枪毙

柳絮忆史
2026-03-31 09:04:24
中国这次,换了一个打法

中国这次,换了一个打法

陆弃
2026-03-31 08:20:03
又一“许家印”出现!骗贷2700亿潜逃外国,3.75万股民血本无归

又一“许家印”出现!骗贷2700亿潜逃外国,3.75万股民血本无归

近史博览
2026-03-31 16:04:05
梅婷李雪琴等出席《好好的时光》研讨会,梅婷的造型特别抢眼

梅婷李雪琴等出席《好好的时光》研讨会,梅婷的造型特别抢眼

小椰的奶奶
2026-03-31 20:33:37
郑丽文赴京前,民进党官员流泪,全岛同时收到消息,逃兵潮已爆发

郑丽文赴京前,民进党官员流泪,全岛同时收到消息,逃兵潮已爆发

甜柠聊史
2026-04-01 06:40:10
早期于谦一家与德云社成员的合影,多朴实的画面,孙越已经够胖了

早期于谦一家与德云社成员的合影,多朴实的画面,孙越已经够胖了

大江
2026-03-30 15:07:52
2.22亿美元破冰船沉入海底,俄军不敢救?俄军事博主集体破防

2.22亿美元破冰船沉入海底,俄军不敢救?俄军事博主集体破防

老马拉车莫少装
2026-03-31 07:34:30
4抢断4拦截!邵佳一爱将太亮眼:对抗不输喀麦隆,留洋英超涨球了

4抢断4拦截!邵佳一爱将太亮眼:对抗不输喀麦隆,留洋英超涨球了

小火箭爱体育
2026-03-31 17:58:41
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
为什么一堆人总觉得珠三角迟早被长三角超过?

为什么一堆人总觉得珠三角迟早被长三角超过?

夜深爱杂谈
2026-03-16 21:58:53
美军方威胁:如果中国敢拿下东沙岛,美就炸平所有南海人工岛礁?

美军方威胁:如果中国敢拿下东沙岛,美就炸平所有南海人工岛礁?

阿尢说历史
2026-04-01 05:27:41
无论你多善良,这3件事上,都必须心狠!佛法从未告诉你的真相!

无论你多善良,这3件事上,都必须心狠!佛法从未告诉你的真相!

金沛的国学笔记
2026-03-29 12:36:12
一顿晚餐后人间蒸发!华人夫妇失踪整一年,两个孩子无法回美,房产或被监管

一顿晚餐后人间蒸发!华人夫妇失踪整一年,两个孩子无法回美,房产或被监管

华人生活网
2026-04-01 04:07:32
CCTV5直播!澳门世界杯4月1日赛程+最新赛果

CCTV5直播!澳门世界杯4月1日赛程+最新赛果

好乒乓
2026-04-01 07:38:59
凌晨1点40分,洛阳一小学生被爷爷送到校门口,孩子站了近两小时

凌晨1点40分,洛阳一小学生被爷爷送到校门口,孩子站了近两小时

健身狂人
2026-03-31 14:31:03
民进党当局急得跳脚!台陆委会主委威胁郑丽文

民进党当局急得跳脚!台陆委会主委威胁郑丽文

看看新闻Knews
2026-03-31 20:27:01
避其锋芒?江苏女排总决赛第2场0-3上海女排,注意下场直播时间

避其锋芒?江苏女排总决赛第2场0-3上海女排,注意下场直播时间

真理是我亲戚
2026-03-31 21:12:42
2026-04-01 09:12:49
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
99416文章数 66814关注度
往期回顾 全部

科技要闻

营收翻倍、巨亏31亿!中国大模型太烧钱了

头条要闻

牛弹琴:战争开始烂尾 特朗普要跑了以色列目瞪口呆

头条要闻

牛弹琴:战争开始烂尾 特朗普要跑了以色列目瞪口呆

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

欧央行行长与美财长G7会议上交锋!

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

旅游
健康
家居
数码
公开课

旅游要闻

听说中小学朋友们要放春假啦,济宁景区也放“价”啦!

干细胞抗衰4大误区,90%的人都中招

家居要闻

新婚爱巢 甜蜜情趣拉满

数码要闻

iPhone将内置呼气传感器 可筛查糖尿病与高胆固醇

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版