网易首页 > 网易号 > 正文 申请入驻

离开OpenAI后,这位27岁的首席AI科学家要带腾讯走向AI的下半场|姚顺雨

0
分享至


今年9月,姚顺雨从OpenAI离职的消息传出来的时候,就已经有很多传闻说他会加入腾讯,甚至有人说腾讯给出了"亿元年薪"。这个新闻一直没得到肯定,也没否定,就这么在AI圈悬着。

在今天,腾讯的一则内部公告终于让这个从硅谷到中国的AI圈顶级人才流转尘埃落定了。

27岁的姚顺雨正式出任腾讯「CEO/总裁办公室」首席AI科学家,直接向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人。年薪是不是这么夸张我们无人知晓,但腾讯确实动了真格——同时宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部。

朱啸虎前段时间刚说「腾讯还没真正发力」,评价腾讯往往等局面打明白后再加速追赶——从第五第六,追到第三第二,最后追到第一。今天腾讯就用一个27岁的年轻人回应了。

微信就是这么干的。2011年从零起步,一年时间追上QQ,最终成为移动互联网时代的王者。这次腾讯要在AI领域重演这个故事,姚顺雨是关键棋子。

但问题是...为什么是他?

腾讯为什么会有信心,让一个27岁的年轻人,掌舵腾讯AI的下半场?

姚班出来的,都不是普通人

要说姚顺雨的起点,得从2015年说起。那年他高考704分,安徽省理科探花,进了清华姚班。

AI圈的人都知道姚班是什么概念。每年只招30人左右,出了一批又一批顶尖人才。但姚班厉害的地方,我觉得不只是招到了天才,更在于它提供了一套系统的训练体系。

这让我想到费曼说的第一性原理——真正重要的不是记住多少知识,而是学会如何思考。姚班从大一开始就让学生接触前沿研究,参与实际项目。培养的不只是编程能力,更是发现问题、定义问题、解决问题的能力。

姚顺雨在这个环境里待了4年,建立了扎实的理论基础和研究直觉。2019年毕业后,他去了普林斯顿读博,导师是Karthik Narasimhan,专注语言智能体和人机交互。这个方向选择为他后来的突破埋下了伏笔。

ReAct和Tree of Thoughts,这两篇论文改变了什么?

普林斯顿的五年,姚顺雨其实就做了一件事:把大语言模型从「对话系统」变成「任务执行系统」。这在今天当然算不得多新鲜的概念,毕竟今年就是所谓AI Agent的元年。我们也见证过今年年初能实际执行操作,帮用户解决问题的Manus的诞生。

但回到两年前,也就是2023月的时候,这还是鲜被讨论的一个概念,姚顺雨发表了ReAct论文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很简单:让大语言模型不只能"想"(推理),还能"做"(行动),而且两者交替进行。

传统的Chain of Thought(思维链)只让模型"想",但不让它"做"。ReAct的突破在于,让模型在推理的同时,可以调用工具、查询信息、执行操作,再根据反馈继续推理。这种"想-做-想-做"的循环,让AI从"回答问题的系统"变成了"解决问题的助手"。

这篇论文在2023年的ICLR大会上被评为Oral(顶会中只有不到5%的论文能拿到的荣誉)。更重要的是,ReAct成了整个AI Agent领域的基础框架,至今已被引用超过4300次。

2023年5月,姚顺雨又发了Tree of Thoughts(思维树)。如果说ReAct是让AI学会"边想边做",那Tree of Thoughts就是让AI学会"深思熟虑"。

有个数据很能说明问题:在Game of 24这个经典游戏里,GPT-4用传统思维链方法,成功率只有4%。用了Tree of Thoughts后,成功率直接飙到74%。这不是渐进式改进,是范式级的跨越。

Tree of Thoughts的核心想法是:让AI解决问题时,不只是线性思考,而是像人类一样,探索多个可能的推理路径,评估每条路径的可行性,必要时回溯重来。这种"搜索式思考"让大语言模型真正有了规划和决策能力。

这篇论文也在2023年的NeurIPS大会上拿了Oral。

到2024年5月答辩的时候,姚顺雨的博士论文题目是《Language Agents: From Next-Token Prediction to Digital Automation》(语言智能体:从下一个词预测到数字自动化)。这个标题其实很精准地概括了他五年的研究成果:让大语言模型从"预测文字"变成"执行任务"。

现在的Google Scholar显示,姚顺雨论文的总引用次数达到19977次,h-index为27。这个数据在27岁这个年龄段,还真挺夸张的。


去OpenAI的8个月,他干了什么?

2024年8月,刚从普林斯顿毕业的姚顺雨加入了OpenAI。

这是个关键转折点。此前的姚顺雨是纯学术派——理论框架、基准测试、论文发表。但在OpenAI的8个月,他完成了从"学术派"到"产品派"的转变,而且速度快得有点惊人。

他深度参与了OpenAI在2024年底推出的三个重要产品:

  • Computer-Using Agent:让AI像人类一样操作电脑,移动鼠标、点击按钮、浏览网页

  • Deep Research:让AI在互联网上自主研究,整理信息,生成报告

  • Operator:OpenAI首个正式发布的Agent产品

这些产品背后,都能看到ReAct和Tree of Thoughts的影子。姚顺雨在学术上提出的"推理与行动结合"框架,在这里变成了真实可用的产品功能。

8个月时间,参与3个核心产品的开发——这个速度在OpenAI这样的顶尖公司也很罕见。说明姚顺雨不只会写论文,还有快速落地、快速迭代的产品能力。

不过,真正让他变得被大众所熟知的,其实是他在今年4月份发表的《AI的下半场》的文章。


这篇文章在AI圈引起了很多讨论,因为它提出了一个在当时看来很大胆的判断:

"AI正处在中场休息。"

过去几十年,AI的主要精力都在开发新的训练方法和模型。从DeepBlue、AlphaGo,到GPT-4、o-series,历史性的突破都来自"如何训练出更好的模型"。但现在,游戏规则在变。

他总结了一个"配方":大规模语言预训练 + 数据和算力扩展 + "推理与行动"理念。这个配方已经基本标准化、产业化了,能解决各种各样的任务——软件开发、创意写作、IMO级别的数学题、键鼠操作,甚至长篇问答。

那么,AI的下半场要做什么?

"下半场将把重心从'解决问题'转向'定义问题'。我们不再只问'能不能训练出一个模型解决X问题?',而是要问'我们究竟应该让AI去做什么?又该如何衡量真正的进展?'"

姚顺雨提出了一个关键概念:效用问题(Utility Problem)

"AI已经在国际象棋和围棋上击败了世界冠军,在SAT和律师资格考试中超过了大多数人类,甚至在IOI和IMO上拿下了金牌。可世界并没有发生太大改变——至少从经济和GDP的角度来看如此。"

问题出在哪?他认为,根源在于我们的评估方式跟现实世界不一致。

比如,在评估中,任务"应该"自动运行:智能体接收输入,自主执行,得到奖励。但现实中,智能体必须在任务过程中持续跟人类互动——你不会只给客服发一段超长文字,等上10分钟,就指望对方给你一份完整回复。

再比如,评估"应该"是i.i.d.(独立同分布)的。如果有500个任务的测试集,就会独立运行每个任务,最后取平均。可在现实中,我们解决问题往往是顺序进行的,不是并行。一个Google工程师处理代码库问题时,随着对代码越来越熟悉,效率会越来越高;但一个AI Agent在同一个代码库中解决了很多问题,却无法获得这种"熟悉度"。

所以,下半场的新玩法是:

"开发新的评估方式或任务,以衡量真实世界的效用。用现有配方去解决它们,或在配方上加入新的组件。"

这需要什么?产品经理的思维方式

腾讯为什么选他?

腾讯不缺技术,也不缺人才。过去一年,腾讯混元发布了超过30个新模型,混元2.0在复杂推理和文本生成场景国内领先,混元3D模型保持全球领先水准。

但腾讯缺的,可能是一个能带他们走向AI下半场的人。

姚顺雨的价值,我觉得不只在学术成就,而在于他对"AI应该解决什么问题"的理解。

学术贡献:他定义了AI Agent的基本范式——ReAct让AI学会"边想边做",Tree of Thoughts让AI学会"深思熟虑"。这些不是渐进式改进,而是范式级创新。

产品能力:他在OpenAI的8个月,证明了不只会写论文,还能把理论快速转化为产品。Computer-Using Agent、Deep Research、Operator——都是真实可用的产品,不是实验室demo。

思想深度:《AI的下半场》不是简单的行业预测,而是对整个AI研究方法论的深刻反思。他看到了AI从"刷榜"到"创造价值"的转折点,这是腾讯需要的战略视野。

这让我想到张小龙说的产品哲学——好的产品不是功能堆砌,而是找到真正的用户需求。姚顺雨对"效用问题"的思考,本质上就是在追问:AI到底应该为用户创造什么价值?

2025年5月,姚顺雨在一次和张小郡的对谈中被问到:"如果你是微信一号位,会怎么做Agent?"

他说:"我可能会不急,先观望观望。"

这种思考方式,恰恰是腾讯最需要的——不是盲目跟风,不是简单模仿,而是深刻理解技术本质,找到真正有价值的应用场景。

12月17日,腾讯官宣姚顺雨的同时,还宣布了一系列组织架构调整:升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部。AI Infra部负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术。

这是个信号:腾讯不只是挖了个明星研究员,而是在为高强度的技术攻关补齐兵力、夯实底座。

他能给腾讯带来什么?

短期来看,姚顺雨肯定会提升混元的Agent能力。

ReAct和Tree of Thoughts已经是AI Agent领域的基础框架,被广泛应用。姚顺雨对这些框架的理解和实践经验,会直接提升混元在任务执行、多步推理、工具调用等方面的能力。

中期来看,他可能会推动微信生态的AI改造。

在那次对谈中,姚顺雨提到,微信既承载社交关系,也承载职业交互——购物咨询、法律服务、客服沟通等。如果能把Agent能力深度整合到微信生态,让每个用户都能拥有自己的AI助手,想象空间会很大。

朱啸虎说腾讯往往是"追赶者",但历史告诉我们,腾讯追赶能力极强。微信从零起步,一年追上QQ,最终超越QQ成为移动互联网时代的王者。这次腾讯要在AI领域重演这个故事。

姚顺雨的加入,让这个故事有了不同可能性。他不只是执行者,更是思想者。他对"效用问题"的理解,对"AI下半场"的预判,对"评估方式"的反思,都代表着一种新的研究范式和产品思维。

27岁,对大多数人来说,可能还在摸索职业方向。

但姚顺雨已经参与定义了AI Agent的基本范式,参与了OpenAI的核心产品开发,成为了腾讯AI的掌舵人。

AI的下半场,刚开始。

腾讯能不能在这场竞赛中追到第一名,谁都无法预测。事实上,这也不是简单地靠招几个「小天才」型人物就能解决的问题。

不过你至少也借此看到腾讯的方向和决心,他们希望让AI具备在现实世界现实场景中解决问题的能力,这是腾讯作为守位者的需要,也是姚顺雨所真正擅长的。

以及,有一点可以确定的是:国内的头部企业也具有吸引硅谷头部人才的能力,AI圈国内与国外华人的竞争还在持续发生。

而这个27岁的年轻人,已经站在了AI下半场的舞台中央。

参考资料

  • 姚顺雨个人网站: https://ysymyth.github.io/

  • 《AI的下半场》: https://ysymyth.github.io/The-Second-Half/

  • Latent.Space访谈: https://www.latent.space/p/shunyu

  • Tree of Thoughts论文: https://arxiv.org/abs/2305.10601

  • ReAct项目官网: https://react-lm.github.io/

  • 腾讯新闻: https://36kr.com/p/3599367248412930

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国内金饰价格突破1400元/克

国内金饰价格突破1400元/克

财联社
2026-01-07 10:42:17
中国最“闲”的3座机场:每天飞1趟航班,飞机一走员工就集体下班

中国最“闲”的3座机场:每天飞1趟航班,飞机一走员工就集体下班

寻途
2026-01-05 18:31:00
马斯克脑机接口公司最新发布会:2026年实现盲人重获视觉;2028年完成全人类与AI的深度融合

马斯克脑机接口公司最新发布会:2026年实现盲人重获视觉;2028年完成全人类与AI的深度融合

宇量信息
2026-01-06 09:19:08
卢比奥一语道破委内瑞拉荒诞真相:马杜罗的江山,古巴人的管家

卢比奥一语道破委内瑞拉荒诞真相:马杜罗的江山,古巴人的管家

老马拉车莫少装
2026-01-05 21:46:08
中美贸易战又出事了,1月7日,凌晨爆出的四大消息来袭!

中美贸易战又出事了,1月7日,凌晨爆出的四大消息来袭!

双色球的方向舵
2026-01-07 12:18:46
特朗普称格陵兰岛“到处是俄罗斯和中国船只” 丹麦外相:不实

特朗普称格陵兰岛“到处是俄罗斯和中国船只” 丹麦外相:不实

新京报
2026-01-07 10:36:04
最讨厌的演员排名,潘长江仅第五,闫学晶第二,第一毋庸置疑

最讨厌的演员排名,潘长江仅第五,闫学晶第二,第一毋庸置疑

林雁飞
2026-01-04 19:29:51
宏远球迷给胡明轩取了一个新外号

宏远球迷给胡明轩取了一个新外号

体育哲人
2026-01-07 11:26:49
血管堵塞的真凶是肉?是糖?都不是,而是它,比肥肉伤 10 倍!

血管堵塞的真凶是肉?是糖?都不是,而是它,比肥肉伤 10 倍!

神奇故事
2025-12-18 22:10:05
河北老人要冻出毛病了

河北老人要冻出毛病了

不正确
2026-01-06 16:20:40
医生从濒死患者动脉掏血栓如同掏碎肉,因为严重的肺动脉栓塞,导致血氧极低无法自主呼吸

医生从濒死患者动脉掏血栓如同掏碎肉,因为严重的肺动脉栓塞,导致血氧极低无法自主呼吸

观威海
2026-01-06 10:46:23
足球报:周定洋目前更接近加盟新鹏城,蓉城正在接触拜合拉木

足球报:周定洋目前更接近加盟新鹏城,蓉城正在接触拜合拉木

天光破云来
2026-01-07 12:10:33
在农村见过最离谱的事情是什么?男女关系的开放程度让人目瞪口呆

在农村见过最离谱的事情是什么?男女关系的开放程度让人目瞪口呆

夜深爱杂谈
2026-01-06 20:51:44
工地男子扛蛇皮袋坐软卧被乘客举报,乘警检查后,全车人集体起立

工地男子扛蛇皮袋坐软卧被乘客举报,乘警检查后,全车人集体起立

悬案解密档案
2025-07-14 16:42:58
詹姆斯:现在很少有人看篮球了,很多人包括我会看高尔夫

詹姆斯:现在很少有人看篮球了,很多人包括我会看高尔夫

懂球帝
2026-01-07 12:56:05
美高官:先打中国再打朝鲜,打不过就核战,因为中国火箭军太强大

美高官:先打中国再打朝鲜,打不过就核战,因为中国火箭军太强大

有牙的兔纸
2026-01-04 21:07:55
首次庭审细节曝光!马杜罗夫妇身穿囚服拒绝认罪

首次庭审细节曝光!马杜罗夫妇身穿囚服拒绝认罪

看看新闻Knews
2026-01-06 09:01:03
玩套路了!苏州一工厂迎新,基本工资涨至2660,岗位奖金等额下调

玩套路了!苏州一工厂迎新,基本工资涨至2660,岗位奖金等额下调

火山詩话
2026-01-07 07:37:29
胡杏儿哈尔滨旅游,零下20度穿5层衣服,三个儿子羽绒服到脚脖子

胡杏儿哈尔滨旅游,零下20度穿5层衣服,三个儿子羽绒服到脚脖子

观察鉴娱
2026-01-07 09:19:27
为马杜罗辩护的律师是谁?以经验老到、出奇制胜闻名,曾助“维基解密”创始人阿桑奇重获自由

为马杜罗辩护的律师是谁?以经验老到、出奇制胜闻名,曾助“维基解密”创始人阿桑奇重获自由

极目新闻
2026-01-07 10:24:52
2026-01-07 13:35:00
AI进化论花生 incentive-icons
AI进化论花生
AI博主,AppStore付费榜第一的小猫补光灯app开发者
110文章数 51关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

牛弹琴:美国虎视眈眈 欧洲八国集体站队发声

头条要闻

牛弹琴:美国虎视眈眈 欧洲八国集体站队发声

体育要闻

全明星次轮票数:东契奇票王 詹皇超KD升西部第8

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

50万亿存款"洪流"将至 四大去向引关注

汽车要闻

蔚来2025百万台收官 一场迟到的自我修复

态度原创

家居
时尚
本地
手机
公开课

家居要闻

宁静不单调 恰到好处的美

冬天穿衣既要有温度又要有风度!看看这些穿搭,优雅又显瘦

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

手机要闻

小米致歉仍难平众怒!高管否认豢养KOL,米粉们闹麻了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版