![]()
今年9月,姚顺雨从OpenAI离职的消息传出来的时候,就已经有很多传闻说他会加入腾讯,甚至有人说腾讯给出了"亿元年薪"。这个新闻一直没得到肯定,也没否定,就这么在AI圈悬着。
在今天,腾讯的一则内部公告终于让这个从硅谷到中国的AI圈顶级人才流转尘埃落定了。
27岁的姚顺雨正式出任腾讯「CEO/总裁办公室」首席AI科学家,直接向总裁刘炽平汇报,同时兼任AI Infra部、大语言模型部负责人。年薪是不是这么夸张我们无人知晓,但腾讯确实动了真格——同时宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部。
朱啸虎前段时间刚说「腾讯还没真正发力」,评价腾讯往往等局面打明白后再加速追赶——从第五第六,追到第三第二,最后追到第一。今天腾讯就用一个27岁的年轻人回应了。
微信就是这么干的。2011年从零起步,一年时间追上QQ,最终成为移动互联网时代的王者。这次腾讯要在AI领域重演这个故事,姚顺雨是关键棋子。
但问题是...为什么是他?
腾讯为什么会有信心,让一个27岁的年轻人,掌舵腾讯AI的下半场?
姚班出来的,都不是普通人
要说姚顺雨的起点,得从2015年说起。那年他高考704分,安徽省理科探花,进了清华姚班。
AI圈的人都知道姚班是什么概念。每年只招30人左右,出了一批又一批顶尖人才。但姚班厉害的地方,我觉得不只是招到了天才,更在于它提供了一套系统的训练体系。
这让我想到费曼说的第一性原理——真正重要的不是记住多少知识,而是学会如何思考。姚班从大一开始就让学生接触前沿研究,参与实际项目。培养的不只是编程能力,更是发现问题、定义问题、解决问题的能力。
姚顺雨在这个环境里待了4年,建立了扎实的理论基础和研究直觉。2019年毕业后,他去了普林斯顿读博,导师是Karthik Narasimhan,专注语言智能体和人机交互。这个方向选择为他后来的突破埋下了伏笔。
ReAct和Tree of Thoughts,这两篇论文改变了什么?
普林斯顿的五年,姚顺雨其实就做了一件事:把大语言模型从「对话系统」变成「任务执行系统」。这在今天当然算不得多新鲜的概念,毕竟今年就是所谓AI Agent的元年。我们也见证过今年年初能实际执行操作,帮用户解决问题的Manus的诞生。
但回到两年前,也就是2023月的时候,这还是鲜被讨论的一个概念,姚顺雨发表了ReAct论文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很简单:让大语言模型不只能"想"(推理),还能"做"(行动),而且两者交替进行。
传统的Chain of Thought(思维链)只让模型"想",但不让它"做"。ReAct的突破在于,让模型在推理的同时,可以调用工具、查询信息、执行操作,再根据反馈继续推理。这种"想-做-想-做"的循环,让AI从"回答问题的系统"变成了"解决问题的助手"。
这篇论文在2023年的ICLR大会上被评为Oral(顶会中只有不到5%的论文能拿到的荣誉)。更重要的是,ReAct成了整个AI Agent领域的基础框架,至今已被引用超过4300次。
2023年5月,姚顺雨又发了Tree of Thoughts(思维树)。如果说ReAct是让AI学会"边想边做",那Tree of Thoughts就是让AI学会"深思熟虑"。
有个数据很能说明问题:在Game of 24这个经典游戏里,GPT-4用传统思维链方法,成功率只有4%。用了Tree of Thoughts后,成功率直接飙到74%。这不是渐进式改进,是范式级的跨越。
Tree of Thoughts的核心想法是:让AI解决问题时,不只是线性思考,而是像人类一样,探索多个可能的推理路径,评估每条路径的可行性,必要时回溯重来。这种"搜索式思考"让大语言模型真正有了规划和决策能力。
这篇论文也在2023年的NeurIPS大会上拿了Oral。
到2024年5月答辩的时候,姚顺雨的博士论文题目是《Language Agents: From Next-Token Prediction to Digital Automation》(语言智能体:从下一个词预测到数字自动化)。这个标题其实很精准地概括了他五年的研究成果:让大语言模型从"预测文字"变成"执行任务"。
现在的Google Scholar显示,姚顺雨论文的总引用次数达到19977次,h-index为27。这个数据在27岁这个年龄段,还真挺夸张的。
![]()
去OpenAI的8个月,他干了什么?
2024年8月,刚从普林斯顿毕业的姚顺雨加入了OpenAI。
这是个关键转折点。此前的姚顺雨是纯学术派——理论框架、基准测试、论文发表。但在OpenAI的8个月,他完成了从"学术派"到"产品派"的转变,而且速度快得有点惊人。
他深度参与了OpenAI在2024年底推出的三个重要产品:
Computer-Using Agent:让AI像人类一样操作电脑,移动鼠标、点击按钮、浏览网页
Deep Research:让AI在互联网上自主研究,整理信息,生成报告
Operator:OpenAI首个正式发布的Agent产品
这些产品背后,都能看到ReAct和Tree of Thoughts的影子。姚顺雨在学术上提出的"推理与行动结合"框架,在这里变成了真实可用的产品功能。
8个月时间,参与3个核心产品的开发——这个速度在OpenAI这样的顶尖公司也很罕见。说明姚顺雨不只会写论文,还有快速落地、快速迭代的产品能力。
不过,真正让他变得被大众所熟知的,其实是他在今年4月份发表的《AI的下半场》的文章。
![]()
这篇文章在AI圈引起了很多讨论,因为它提出了一个在当时看来很大胆的判断:
"AI正处在中场休息。"
过去几十年,AI的主要精力都在开发新的训练方法和模型。从DeepBlue、AlphaGo,到GPT-4、o-series,历史性的突破都来自"如何训练出更好的模型"。但现在,游戏规则在变。
他总结了一个"配方":大规模语言预训练 + 数据和算力扩展 + "推理与行动"理念。这个配方已经基本标准化、产业化了,能解决各种各样的任务——软件开发、创意写作、IMO级别的数学题、键鼠操作,甚至长篇问答。
那么,AI的下半场要做什么?
"下半场将把重心从'解决问题'转向'定义问题'。我们不再只问'能不能训练出一个模型解决X问题?',而是要问'我们究竟应该让AI去做什么?又该如何衡量真正的进展?'"
姚顺雨提出了一个关键概念:效用问题(Utility Problem)。
"AI已经在国际象棋和围棋上击败了世界冠军,在SAT和律师资格考试中超过了大多数人类,甚至在IOI和IMO上拿下了金牌。可世界并没有发生太大改变——至少从经济和GDP的角度来看如此。"
问题出在哪?他认为,根源在于我们的评估方式跟现实世界不一致。
比如,在评估中,任务"应该"自动运行:智能体接收输入,自主执行,得到奖励。但现实中,智能体必须在任务过程中持续跟人类互动——你不会只给客服发一段超长文字,等上10分钟,就指望对方给你一份完整回复。
再比如,评估"应该"是i.i.d.(独立同分布)的。如果有500个任务的测试集,就会独立运行每个任务,最后取平均。可在现实中,我们解决问题往往是顺序进行的,不是并行。一个Google工程师处理代码库问题时,随着对代码越来越熟悉,效率会越来越高;但一个AI Agent在同一个代码库中解决了很多问题,却无法获得这种"熟悉度"。
所以,下半场的新玩法是:
"开发新的评估方式或任务,以衡量真实世界的效用。用现有配方去解决它们,或在配方上加入新的组件。"
这需要什么?产品经理的思维方式。
腾讯为什么选他?
腾讯不缺技术,也不缺人才。过去一年,腾讯混元发布了超过30个新模型,混元2.0在复杂推理和文本生成场景国内领先,混元3D模型保持全球领先水准。
但腾讯缺的,可能是一个能带他们走向AI下半场的人。
姚顺雨的价值,我觉得不只在学术成就,而在于他对"AI应该解决什么问题"的理解。
学术贡献:他定义了AI Agent的基本范式——ReAct让AI学会"边想边做",Tree of Thoughts让AI学会"深思熟虑"。这些不是渐进式改进,而是范式级创新。
产品能力:他在OpenAI的8个月,证明了不只会写论文,还能把理论快速转化为产品。Computer-Using Agent、Deep Research、Operator——都是真实可用的产品,不是实验室demo。
思想深度:《AI的下半场》不是简单的行业预测,而是对整个AI研究方法论的深刻反思。他看到了AI从"刷榜"到"创造价值"的转折点,这是腾讯需要的战略视野。
这让我想到张小龙说的产品哲学——好的产品不是功能堆砌,而是找到真正的用户需求。姚顺雨对"效用问题"的思考,本质上就是在追问:AI到底应该为用户创造什么价值?
2025年5月,姚顺雨在一次和张小郡的对谈中被问到:"如果你是微信一号位,会怎么做Agent?"
他说:"我可能会不急,先观望观望。"
这种思考方式,恰恰是腾讯最需要的——不是盲目跟风,不是简单模仿,而是深刻理解技术本质,找到真正有价值的应用场景。
12月17日,腾讯官宣姚顺雨的同时,还宣布了一系列组织架构调整:升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部。AI Infra部负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理等核心技术。
这是个信号:腾讯不只是挖了个明星研究员,而是在为高强度的技术攻关补齐兵力、夯实底座。
他能给腾讯带来什么?
短期来看,姚顺雨肯定会提升混元的Agent能力。
ReAct和Tree of Thoughts已经是AI Agent领域的基础框架,被广泛应用。姚顺雨对这些框架的理解和实践经验,会直接提升混元在任务执行、多步推理、工具调用等方面的能力。
中期来看,他可能会推动微信生态的AI改造。
在那次对谈中,姚顺雨提到,微信既承载社交关系,也承载职业交互——购物咨询、法律服务、客服沟通等。如果能把Agent能力深度整合到微信生态,让每个用户都能拥有自己的AI助手,想象空间会很大。
朱啸虎说腾讯往往是"追赶者",但历史告诉我们,腾讯追赶能力极强。微信从零起步,一年追上QQ,最终超越QQ成为移动互联网时代的王者。这次腾讯要在AI领域重演这个故事。
姚顺雨的加入,让这个故事有了不同可能性。他不只是执行者,更是思想者。他对"效用问题"的理解,对"AI下半场"的预判,对"评估方式"的反思,都代表着一种新的研究范式和产品思维。
27岁,对大多数人来说,可能还在摸索职业方向。
但姚顺雨已经参与定义了AI Agent的基本范式,参与了OpenAI的核心产品开发,成为了腾讯AI的掌舵人。
AI的下半场,刚开始。
腾讯能不能在这场竞赛中追到第一名,谁都无法预测。事实上,这也不是简单地靠招几个「小天才」型人物就能解决的问题。
不过你至少也借此看到腾讯的方向和决心,他们希望让AI具备在现实世界现实场景中解决问题的能力,这是腾讯作为守位者的需要,也是姚顺雨所真正擅长的。
以及,有一点可以确定的是:国内的头部企业也具有吸引硅谷头部人才的能力,AI圈国内与国外华人的竞争还在持续发生。
而这个27岁的年轻人,已经站在了AI下半场的舞台中央。
参考资料:
姚顺雨个人网站: https://ysymyth.github.io/
《AI的下半场》: https://ysymyth.github.io/The-Second-Half/
Latent.Space访谈: https://www.latent.space/p/shunyu
Tree of Thoughts论文: https://arxiv.org/abs/2305.10601
ReAct项目官网: https://react-lm.github.io/
腾讯新闻: https://36kr.com/p/3599367248412930
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.