网易首页 > 网易号 > 正文 申请入驻

姚顺雨离职OpenAI,开启下半场

0
分享至

为大模型开启“下半场”的姚顺雨,也开启了个人AI的下半场。

就在最近,这位明星OpenAI华人研究员的动态,开始被火热关注。

之前有人说他出现在小扎的必挖名单上,也有人最近爆料他即将加盟其他的巨头——而且是中国科技巨头,“转会费”也有了惊人传闻。以及还有一种说法,姚顺雨选择个人创业……

姚顺雨去哪儿?还不知道。

但姚顺雨离职OpenAI,得到了不同渠道的证实,只差个人官宣。

他似乎就此要开启个人AI的下半场了。

这个刚刚29岁的年轻人,合肥一中毕业、NOI奥赛银牌、高考704分以安徽探花进入清华姚班,最后在普林斯顿获得计算机博士(语言和强化学习方向),毕业就加入了OpenAI……

而且更早之前,姚顺雨就有着突出而知名的科研成果,比如:

  • 思维树(Tree of Thoughts):让LLM反复思考,大幅提高推理能力

  • SWE-bench:一个大模型能力评估数据集。

  • SWE-agent:一个开源AI程序员。

  • ReAct…

甚至还有超越年龄的哲思,一篇“AI下半场”的博文,在AI圈内外洛阳纸贵。

所以姚顺雨,究竟是一个怎样的年轻人?

姚顺雨成长之路

在2024年刚加入OpenAI不久,姚顺雨在一次采访中推荐了一本书——《哥德尔、艾舍尔、巴赫:集异璧之大成》。

这部由人工智能先驱侯世达撰写的经典著作,将哥德尔的不完备定理、艾舍尔的错觉绘画和巴赫的复调卡农巧妙融汇,展现了这些看似无关的元素如何在计算机的通用递归系统中彼此呼应,并留下了一句意味深长的话:觅之,便有所获

正如这本书所启发的那样,跨学科的眼光与对复杂信息的开放态度,似乎贯穿着姚顺雨的整个求学生涯,并逐渐形成一种个人的风格特质。

和所有的学霸一样,姚顺雨初中就读于合肥最好的学校之一——合肥45中(2009—2012),初中毕业后升入合肥市第一中学

2014 年,他在全国信息学奥林匹克竞赛(NOI)中以495分斩获银牌;次年高考以理科704分的成绩位列安徽省第三,进入清华交叉信息研究院姚班,主修计算机科学。

而这看似“标准学霸”的开局背后,其实孕育着一颗不太一样,甚至稍有反叛的气质。

△来自清小华

姚顺雨在采访中透露,相较其他清华姚班的同学专注于一点,不断深挖的品质,他更爱看很多数学,历史,乃至种各样乱七八糟的东西。

而他对嘻哈音乐的热爱,也早已不是什么新闻。

艾米纳姆、蛋堡、热狗、Jcole等说唱歌手伴随着他的初高中,而在清华他还是清华大学学生说唱社联合创始人。

值得一提的是,在清华大学2019年各类型自主选拔复试的开营仪式上,姚顺雨就给未来的学弟学妹们甩出了一句堪称“freestyle”的理由,解释自己为什么选清华:

但是对于我来说,选择清华、北大并不是问题,因为北大没有我姓氏命名的班级。

除了担任说唱社联合创始人外,姚顺雨还担任清华的招生志愿者和姚班联席会主席。在谈及姚班对他的影响时,他提到:

姚班很注重理论基础课程的学习,像操作系统或电路设计相关的课,看上去和科研好像没有任何关系,但是现在看来还是有些帮助的。它能使你对计算机科学的全貌有基本了解。

△(姚班合影,清华招生公众号)

这种兼容各类信息、涉猎不同学科并从中寻找乐趣的跨界气质,在姚顺雨身上表现得尤为明显。用以赛亚·伯林的话来说,他更像是一只“狐狸”,而不是一只“刺猬”,而这也体现在他后续的研究中。

(注:柏林的“刺猬”比喻那些专注于单一核心理念的人,他们把所有经验都套用到这个中心观点上;而“狐狸”则指那些涉猎广泛、善于灵活应对不同问题的人,更依赖多样化的策略和视角)

让人颇感惊讶的是,在大三下学期之前,姚顺雨既没有接触过AI,甚至连科研也没有做过。

一次交换的机会让他去了MIT,在此之后,他才开始跟着吴佳俊做一些计算机、视觉以及认知科学的研究。

姚顺雨表示,在跟随吴佳俊和学长Jun-Yan Zhu学习时,他不仅掌握了实验、汇报等研究入门的基本功,更受到思想上的深刻影响,他由此认识到心理学与人工智能的交叉,学会了从更高维度和整体框架去思考问题。

结束姚班四年的学习后,2019年,他正式前往普林斯顿攻读博士,跨界气质再次显现。

本科阶段他主要研究计算机视觉,而博士阶段,本来被计算机视觉方向录取的他,却因为兴趣转向,自行联系了自然语言处理(NLP)领域的导师。最终,他因机缘巧合加入了Karthik Narasimhan的团队,开始从事自然语言处理与强化学习的研究。

这等于是从视觉转到了语言,但“觅之,便有所获”。姚顺雨在事后回想到,这种跨界也是他的幸运之处,因为彼时正逢GPT-2兴起。因此,在博士的第一年,他就已经开始想着如何让language model变成Agent.

而对(通用)Agent的关注贯穿着他的研究。

姚顺雨博士生涯的第一个工作叫CALM(2020),研究如何用语言模型来作为Agent来玩语言游戏。

在CALM 中,语言就像媒介:它把人类经验和语义模式转化为可操作的动作候选,同时承载上下文信息,使智能体在庞大的动作空间中高效决策。

姚顺雨表示,虽然这篇工作并不像swebench、ReAct或思维树那么有名,但对他来说具有重要意义。

在张小珺的对谈中,我们发现姚顺雨对语言的关注早在这篇5年前的论文中就已萌芽。

  • 语言是人为了实现泛化而发明出来的工具,这一点比其他东西更本质。

换句话说,用语言来玩游戏是无限的,Agent可以凭借语言进行推理和组合,在不同的上下文中找到合适的动作,泛化就由此而来。

换句话说,Agent也需要具备“跨界”能力,而语言则是绝佳的媒介。

然而,姚顺雨也意识到,如果没有一个好的任务或环境,即使把“游戏”玩得再高分,也毫无意义。

基于这一思考,他的第二篇工作WebShop构建了一个大规模模拟电商环境,使智能体通过理解复杂文本指令,在网页中进行导航和操作,从而推动语言理解与决策能力在真实世界任务中的应用与验证。

同样的,后来的经典工作SWE-BenchSWE-agent也是针对一个有意义的任务(现实编程)展开对Agent能力的验证。

而当时间到了2022 年,GPT-3.5的出现改变了一切。

众所周知,让一张白纸反复试错的效率极低,而在传统强化学习中,这种低效尝试却屡见不鲜:智能体通常要么被限制只做单一任务,比如下围棋,要么在庞大的动作空间中盲目探索。

GPT-3.5 让人们意识到,之前缺失的是先验知识:通过强大的语言预训练,将常识和语言知识融入模型,再通过微调,它才能成为具备跨界气质、拥有泛化能力的Agent。

正如姚顺雨所说:如果你的Pre-Training(预训练)已经包含了所有事情,那么RL(强化学习)只是激发出这些能力的skill(技能)。

在受到GPT-3.5的启发后,姚顺雨就做了ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),让大语言模型在与外部环境交互时,同时进行“推理”和“行动”。

姚顺雨后来评价到这是他最喜欢的工作(也是他目前被引次数最高的工作)。基于此,他的研究逐渐转向于两个核心,一是怎么去做一些有价值、和现实世界更相关的任务和环境;二是怎么去做一些简单、但又通用的方法。

不过,为了实现通用,泛化,必须学会推理。而语言模型刚好提供了一个足够强的先验(prior),这个先验让你可以推理,而推理又能在不同的环境间泛化。

于是,在GPT、思维链等工作的基础上,思维树(Tree of Thoughts, ToT)让语言模型通过多路径探索和自我评估,从而实现比传统左到右推理更高效的复杂问题解决能力。

回顾姚顺雨的求学与研究,不难发现,无论是他对通用智能体的追求,还是对语言作为认知与决策媒介的热忱,都是对跨界思维与泛化能力的持续探索。

28岁的九局下半

相比于热狗的23岁,28岁博士毕业进入OpenAI的姚顺雨,才真正迎来自己的的“九局下半”。

2024年8月1日,姚顺雨宣布加入OpenAI,一时间,说是万众瞩目也毫不为过。

PS:在说到姚顺雨与OpenAI的渊源时,一个不太冷的冷知识是姚顺雨的导师Karthik Narasimhan是GPT‑1第二作者。

在加入OpenAI的一年多时间,姚顺雨最出圈的莫过于今年4月发表的博文《The Second Half》,宣告AI主线程的游戏已进入下半场。

(是的,AI也迎来了自己的九局下半)

姚顺雨表示:AI发展分为上下两阶段。上半场以模型和方法为中心,核心构建了模型和训练方法;随着AI技术成熟,下半场的重点转向如何定义有现实意义的任务、如何有效评估AI系统的表现。

新的评估应该贴近现实世界任务、优化模型配方解决任务,形成新的正向循环。

在这,我们不难看出姚顺雨姿态的转变:从专注求解的科研工作者,逐渐成长为善于发现需求的“产品经理”。

据刚刚曝光的一次与张小珺的访谈中,姚顺雨也谈到了创业的底层逻辑:

毕业前我想得多的是,怎么创造一个爱因斯坦?我那时是比较academia(学院派)的人——你在普林斯顿,你的偶像是冯诺依曼、爱因斯坦——很自然,能想到最有意思的任务是,我能不能发现下一个相对论?这毫无疑问能标志,AGI或ASI(超人工智能)实现了。后来,我到了硅谷,到了加州,进入公司之后,我发现人类的组织也是一个有意思的事情。如果能创造一家新的公司,创造一个one trillion dollar(一万亿美元)、基于Agent的公司,是很有意思的。

而当谈到是否会出去创业时,姚顺雨更是坦率地表示:OpenAI大多数人都会考虑创业。他需要去做更有挑战的事情,去创业是很自然的。当然,还是应该找到一个好的事情。他喜欢把事情想得清楚一点再去做。

当然,从OpenAI离职也不一定非得创业,比如姚顺雨的导师Karthik Narasimhan,就在OpenAI呆了一年后,选择了离开,并去普林斯顿继续象牙塔科研了。

如今,姚顺雨加入OpenAI也过了整整一个年头。

有爆料说“姚顺雨上亿薪资入职腾讯”,但被腾讯官方对外辟谣否认了。

还有一家全新的创业公司刚刚被注册,法人代表正是“姚顺雨”——

但目前依然难以确定这个“姚顺雨”是不是就是我们谈论的姚顺雨,毕竟叫“尧舜禹”这种好名字的,仅仅AI领域,不止一位…

总之,祝福姚顺雨开启下半场。

参考链接
[1]https://openreview.net/profile?id=~Shunyu_Yao1&utm_source=chatgpt.com
[2]https://ysymyth.github.io/?utm_source=chatgpt.com
[3]https://x.com/shunyuyao12?lang=en&utm_source=chatgpt.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张兰彻底变了!绝口不提亲家半个字,马筱梅叽叽歪歪走上大S老路

张兰彻底变了!绝口不提亲家半个字,马筱梅叽叽歪歪走上大S老路

老黯谈娱
2026-04-02 21:03:44
官宣!中甲中乙2队试图向裁判+比赛监督送礼 被中足联罚款10万元

官宣!中甲中乙2队试图向裁判+比赛监督送礼 被中足联罚款10万元

念洲
2026-04-03 17:19:19
央视美女体育解说离职,冬奥因谷爱凌比赛走红,称最讨厌同行一点

央视美女体育解说离职,冬奥因谷爱凌比赛走红,称最讨厌同行一点

米修体育
2026-04-04 00:50:43
马筱梅最新发言翻车!当初靠爱北京圈粉,如今直言离不开湾湾

马筱梅最新发言翻车!当初靠爱北京圈粉,如今直言离不开湾湾

乐悠悠娱乐
2026-04-03 09:18:21
从骨感美人到丰腴尤物:迪丽热巴性感组图?

从骨感美人到丰腴尤物:迪丽热巴性感组图?

娱乐领航家
2026-04-03 22:30:03
“新型出轨”正在朋友圈蔓延,比婚外情更隐蔽更伤人…

“新型出轨”正在朋友圈蔓延,比婚外情更隐蔽更伤人…

LULU生活家
2026-03-27 15:02:40
教育厅原厅长,主动投案!

教育厅原厅长,主动投案!

双一流高校
2026-04-04 00:09:16
CBA排名大变天!上海15连胜第一太稳,北京杀回第3,辽宁陷入泥潭

CBA排名大变天!上海15连胜第一太稳,北京杀回第3,辽宁陷入泥潭

老叶评球
2026-04-03 22:50:07
伊朗恰拉克港口遭袭 4艘登陆艇受损 1人遇难

伊朗恰拉克港口遭袭 4艘登陆艇受损 1人遇难

财联社
2026-04-04 00:18:17
2999元!华为新机上架:2.5K+120Hz+超薄设计,已正式开售!

2999元!华为新机上架:2.5K+120Hz+超薄设计,已正式开售!

科技堡垒
2026-04-02 09:57:13
去了一趟伊朗才发现:原来在伊朗人眼里,中国人原来是这样的

去了一趟伊朗才发现:原来在伊朗人眼里,中国人原来是这样的

凉了时光人
2026-03-19 10:42:25
专家警告:每天吃一个西红柿,就等于给血管“上锁”?真相来了

专家警告:每天吃一个西红柿,就等于给血管“上锁”?真相来了

荆医生科普
2026-04-03 13:33:34
西甲焦点战:马竞与巴萨谁能胜出?

西甲焦点战:马竞与巴萨谁能胜出?

大四喜看球
2026-04-04 01:20:03
哪些苹果设备好评率最高?iPhone 17 Pro Max跌出前十

哪些苹果设备好评率最高?iPhone 17 Pro Max跌出前十

CNMO科技
2026-04-02 15:38:09
香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

读懂世界历史
2026-02-12 21:48:53
西方不明白:“全世界那么多国家,为何只有中国能成世界工厂?”

西方不明白:“全世界那么多国家,为何只有中国能成世界工厂?”

蜉蝣说
2026-03-04 15:28:56
上市公司董事长失联,股价连续三天跌停

上市公司董事长失联,股价连续三天跌停

21世纪经济报道
2026-04-03 15:31:55
因“6秒致辞”走红的县委书记:清华硕士毕业 去年曾用“开幕”两字宣布足球比赛开始

因“6秒致辞”走红的县委书记:清华硕士毕业 去年曾用“开幕”两字宣布足球比赛开始

红星新闻
2026-04-03 15:23:17
巨星影帝任达华新片惨败,首日票房只有零元,著名导演助力也没用

巨星影帝任达华新片惨败,首日票房只有零元,著名导演助力也没用

影视高原说
2026-04-03 19:47:54
美以伊冲突持续,美媒:华盛顿通知东京,约400枚“战斧”导弹交付计划将受影响

美以伊冲突持续,美媒:华盛顿通知东京,约400枚“战斧”导弹交付计划将受影响

环球网资讯
2026-04-03 21:25:09
2026-04-04 02:12:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5453文章数 64621关注度
往期回顾 全部

科技要闻

5万辆库存车,给了特斯拉一记重拳

头条要闻

特朗普非常生气要大清洗 陆军部长、FBI局长等或被调整

头条要闻

特朗普非常生气要大清洗 陆军部长、FBI局长等或被调整

体育要闻

被NBA选中20年后,他重新回到篮球场

娱乐要闻

夏克立官宣再婚当爸?否认婚内出轨

财经要闻

专家称长期摄入“飘香剂”存在健康隐患

汽车要闻

你介意和远房亲戚长得很像吗?

态度原创

时尚
本地
亲子
家居
手机

冬奥双金夫妻:爱与荣耀,顶峰相见

本地新闻

跟着歌声游安徽,听古村回响

亲子要闻

两个孩子棒 父母也棒

家居要闻

温馨多元 爱的具象化

手机要闻

OPPO Find X9 Ultra:真机偷跑!Find X9s Pro:要做小屏影像机皇

无障碍浏览 进入关怀版