网易首页 > 网易号 > 正文 申请入驻

林俊旸离职后首发长文,智能体式思考将成主流

0
分享至

3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,在从阿里离职后,他首度发布长文详谈自己对大模型发展路线的理解及对AI下一阶段的预判。

林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI的o1表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但2025年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。

前千问大模型技术负责人林俊旸

他提到,2025年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向。但"合并"说起来容易,做好却极难。

真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。

分开做在实践中仍然有吸引力。2025年下半年,Qwen 的2507版本就发了独立的 Instruct 和 Thinking 版本,30B 和235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。

推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示,他提到,千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。

智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。

这意味着,核心问题从“模型能否思考得足够久?”转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。

在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。

林俊旸预测,智能体式思考会成为主流。

责任编辑:李超_NB12814

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全部停招!浙江2026高考招生“断崖式”调整,考生请理性决策

全部停招!浙江2026高考招生“断崖式”调整,考生请理性决策

史海流年号
2026-05-29 11:56:48
国内“纯电MPV”第一名:反超一众新势力,单月销量超2200台

国内“纯电MPV”第一名:反超一众新势力,单月销量超2200台

柳先说
2026-05-29 18:31:59
“一吨石油都别想进出伊朗港口” 对革命卫队意味着什么?

“一吨石油都别想进出伊朗港口” 对革命卫队意味着什么?

高博新视野
2026-05-30 18:47:42
老婆和别人牵手逛商场,我拍下发给了她爸妈,隔天她哭着让我原谅

老婆和别人牵手逛商场,我拍下发给了她爸妈,隔天她哭着让我原谅

千秋文化
2026-05-03 20:23:25
女足欧冠决赛前,巴黎阿森纳球迷巨型横幅斗法

女足欧冠决赛前,巴黎阿森纳球迷巨型横幅斗法

绿茵狂热者
2026-05-31 00:19:10
正式官宣!国务院放大招:城里有房家庭都乐开花,不仅宜居还增值

正式官宣!国务院放大招:城里有房家庭都乐开花,不仅宜居还增值

羽逸地之光
2026-05-29 16:07:54
黄仁勋被粉丝偶遇追着抢买单 当场拒绝:我比较有钱 不用请我

黄仁勋被粉丝偶遇追着抢买单 当场拒绝:我比较有钱 不用请我

快科技
2026-05-29 12:29:06
记者:小蜘蛛想离开很正常,马竞的竞技目标不符合他的追求

记者:小蜘蛛想离开很正常,马竞的竞技目标不符合他的追求

懂球帝
2026-05-31 00:03:25
被问价3500万欧!罗马8球中场引英超两大豪门哄抢

被问价3500万欧!罗马8球中场引英超两大豪门哄抢

坠入温柔晚风
2026-05-31 00:04:05
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
唐嫣罗晋现状意外曝光,令人心疼

唐嫣罗晋现状意外曝光,令人心疼

草莓解说体育
2026-05-31 00:09:30
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
广东佛山这个“任性”的区,明明隶属于佛山市,却不说是佛山人?

广东佛山这个“任性”的区,明明隶属于佛山市,却不说是佛山人?

刘小顺
2026-05-30 12:28:03
很快Here we go,罗马诺:伊劳拉将成为利物浦下一任主帅

很快Here we go,罗马诺:伊劳拉将成为利物浦下一任主帅

懂球帝
2026-05-30 20:11:03
跟低学历妹子谈恋爱是啥体验?网友:低社会化人群被女版黄毛拿下

跟低学历妹子谈恋爱是啥体验?网友:低社会化人群被女版黄毛拿下

带你感受人间冷暖
2026-03-28 16:48:21
晴天霹雳!内马尔重伤恐无缘世界杯,安切洛蒂或用弃将顶替他

晴天霹雳!内马尔重伤恐无缘世界杯,安切洛蒂或用弃将顶替他

澜归序
2026-05-30 06:50:41
为什么说阳痿、跑步、心梗,成了“斩杀”中年男性的“三件套”?

为什么说阳痿、跑步、心梗,成了“斩杀”中年男性的“三件套”?

医药养生保健报社
2026-04-28 17:59:19
《狂飙》高启强原型:从长沙菜场鱼贩到百亿黑老大,结局如何?

《狂飙》高启强原型:从长沙菜场鱼贩到百亿黑老大,结局如何?

南冥那只猫
2026-05-18 09:59:21
空姐的一句大实话,戳穿所有男人的本性,有钱还安分的男人太难得

空姐的一句大实话,戳穿所有男人的本性,有钱还安分的男人太难得

千秋文化
2026-05-27 19:49:01
广州一对夫妻的新家火了,光一个客厅就让无数人效仿,太有品味了

广州一对夫妻的新家火了,光一个客厅就让无数人效仿,太有品味了

阿离家居
2026-05-30 21:31:05
2026-05-31 00:40:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
254704文章数 622559关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

本地
教育
艺术
时尚
健康

本地新闻

用剪纸的方式,打开江苏扬州

教育要闻

26岁女教师赛课时猝死!老师,一路走好,愿天堂没有赛课

艺术要闻

339米!珠海第一高楼,形似“蛟龙出海”

美回巅峰的她们,带火的这些爆款真的好用吗

尝试干细胞疗法如何避免踩坑?

无障碍浏览 进入关怀版