网易首页 > 网易号 > 正文 申请入驻

担任腾讯首席AI科学家后,姚顺雨带领团队揭晓首个研究成果

0
分享至

姚顺雨担任腾讯首席AI科学家后首个研究成果揭晓。2月3日,腾讯混元官网技术博客发表了一篇题为《从上下文中学习,远比我们想象的要难》的文章,系统地介绍了腾讯混元团队联合复旦大学的一项新研究。该文章中还提到,未来竞争的焦点将从“谁能把模型训练得更好”,转向“谁能为任务提供最丰富、最相关的上下文”。据悉,这是姚顺雨加入腾讯担任首席AI科学家后团队首次发布研究成果。



去年12月17日,腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化其大模型的研发体系与核心能力。OpenAI著名研究者姚顺雨出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。近日,姚顺雨在现场给腾讯首届“青云奖学金”获得者颁奖。


姚顺雨

过去几年,大语言模型快速进化,如今的前沿模型,已经是顶级的“做题家”:它们能解开奥数级别的难题,能推演复杂的编程逻辑,甚至能通过那些人类需要苦读数年才能拿下的专业资格考试。

但截至目前,在面临真实世界的任务时,模型表现还有待提升。在人类日常工作中,玩家拿起新游戏的规则书,就能在实战中边玩边学;科学家从复杂的实验日志中筛选数据,就能推导出新的结论和定律。这些场景中,人类并不只依赖多年前学到的知识,而是在实时地从眼前的上下文中学习。

在这篇论文里,腾讯混元和复旦大学联合研究团队提到,要让大模型学会“从上下文中学习”,远比我们想象的要难。并且,即便抹平了上下文带来的信息差,模型也未必能解决问题,这说明模型在上下文利用上,依然存在显著的能力短板。

为了衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了 CL-bench,这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。CL-bench 包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。CL-bench只包含一个简单但苛刻的要求:解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。

通过实验,论文发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2% ,也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。

这也为大语言模型后续的迭代指出了一个可能的方向,即强化模型从上下文中进行学习的能力。官方技术博客还提到,如果模型的上下文学习能力能像之前其他能力那样被提升上去,人类在AI 系统中的角色将发生转变:我们不再是主要的数据提供者,而变成了上下文提供者。未来,竞争的焦点将从“谁能把模型训练得更好”,转向“谁能为任务提供最丰富、最相关的上下文”。

研究团队也强调,模型如何记忆很可能成为 2026 年大模型发展的另一个核心主题,并且,一旦上下文学习与记忆变得可靠,模型或许就能实现自主学习,它们将自主准备上下文,从中学习并自我巩固。

采写:南都N视频记者 林文琪

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国专家:看不懂中国人,中国把一根几千块的光纤,当成面条来卖

美国专家:看不懂中国人,中国把一根几千块的光纤,当成面条来卖

纪中百大事
2026-02-03 22:27:52
不到72小时,足球界迎来3大重磅消息,李铁、本泽马牵涉其中

不到72小时,足球界迎来3大重磅消息,李铁、本泽马牵涉其中

梨花黛娱
2026-02-03 14:55:18
贪财好色、薄情寡义、直播哭穷,近期这4位老戏骨翻车理由太离谱

贪财好色、薄情寡义、直播哭穷,近期这4位老戏骨翻车理由太离谱

说历史的老牢
2026-01-05 15:07:58
“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

“继承权”无需再争!2026新规落地:父母房产按“这些规则”处理

复转这些年
2026-01-27 03:00:03
俄美乌新一轮三方会谈即将举行,只剩一个问题,却是死结

俄美乌新一轮三方会谈即将举行,只剩一个问题,却是死结

新民晚报
2026-02-03 11:59:51
霍震霆没想到,不到48小时,李嘉诚再迎3大噩耗,个个戳他心窝

霍震霆没想到,不到48小时,李嘉诚再迎3大噩耗,个个戳他心窝

风流女汉
2026-02-03 20:03:44
藏不住了!陈建斌自爆当年分手内幕,难怪吴越至今不婚不育

藏不住了!陈建斌自爆当年分手内幕,难怪吴越至今不婚不育

车窗起雾q
2026-01-18 02:26:34
卡戴珊汉密尔顿秘恋一月,十年好友变恋人,汉密尔顿第八冠要凉

卡戴珊汉密尔顿秘恋一月,十年好友变恋人,汉密尔顿第八冠要凉

月下守候
2026-02-03 14:03:22
在岸人民币兑美元(CNY)北京时间03:00收报6.9397元,较周一夜盘收盘涨51点

在岸人民币兑美元(CNY)北京时间03:00收报6.9397元,较周一夜盘收盘涨51点

每日经济新闻
2026-02-04 05:23:14
巴基斯坦军方鏖战两天两夜,大批叛军就地伏诛,这场大捷前所未有

巴基斯坦军方鏖战两天两夜,大批叛军就地伏诛,这场大捷前所未有

王嚾晓
2026-02-03 13:45:44
上海94-84战胜广东 球员评价:4人优秀,偰李永炜及格,4人低迷

上海94-84战胜广东 球员评价:4人优秀,偰李永炜及格,4人低迷

篮球资讯达人
2026-02-04 01:37:35
癌症去世的人越来越多?医生反复叮嘱:宁可打打牌,也别做这5事

癌症去世的人越来越多?医生反复叮嘱:宁可打打牌,也别做这5事

医学原创故事会
2026-01-25 22:54:04
肮脏视频再被爆!一女孩为爱泼斯坦提供跪式服务,穿水手服爬行

肮脏视频再被爆!一女孩为爱泼斯坦提供跪式服务,穿水手服爬行

叶公子
2026-02-03 20:03:58
发现一个奇怪现象:喜欢把家里打扫得很干净的人,往往会有这3种命运,并非迷信

发现一个奇怪现象:喜欢把家里打扫得很干净的人,往往会有这3种命运,并非迷信

LULU生活家
2025-12-23 18:33:20
特朗普眨眼莫迪点头,美印已达成贸易协议,中国成为美国关税高地

特朗普眨眼莫迪点头,美印已达成贸易协议,中国成为美国关税高地

火星宏观
2026-02-03 18:13:30
3换1?火箭队追哈登,预计筹码出炉!只待31岁控卫点头,即可报价

3换1?火箭队追哈登,预计筹码出炉!只待31岁控卫点头,即可报价

熊哥爱篮球
2026-02-03 20:25:46
出轨的人自以为“赚翻了”,实则是“赔惨了”,终究是害人害己

出轨的人自以为“赚翻了”,实则是“赔惨了”,终究是害人害己

风起见你
2026-02-04 05:31:08
谷爱凌不再回避!坦言“世界不会原谅我了”,彻底走上朱婷的老路

谷爱凌不再回避!坦言“世界不会原谅我了”,彻底走上朱婷的老路

有范又有料
2026-01-29 16:02:11
彻底破防!网传宁波男子花50万彩礼结婚,妻子新婚出轨被捉奸在床

彻底破防!网传宁波男子花50万彩礼结婚,妻子新婚出轨被捉奸在床

火山诗话
2026-02-03 06:51:09
历代皇室为何把王莽的头颅当宝贝,前后收藏了272年,它有何特别

历代皇室为何把王莽的头颅当宝贝,前后收藏了272年,它有何特别

千秋文化
2026-01-30 21:47:10
2026-02-04 06:23:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
596308文章数 3587077关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

挪威王储妃给爱泼斯坦发暧昧邮件:你让我兴奋

头条要闻

挪威王储妃给爱泼斯坦发暧昧邮件:你让我兴奋

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

大S逝世一周年 S家没通知大S子女惹争议

财经要闻

中央一号文件:扎实推进乡村全面振兴

汽车要闻

上汽决定不再等那个“正确答案”了

态度原创

家居
旅游
时尚
艺术
公开课

家居要闻

极简木艺术 典雅自在

旅游要闻

避开网红坑!嘉峪关真正的宝藏在这

状态比10年前更好,她到底做对了什么?

艺术要闻

一篇文章看懂“传统吉祥图案”的寓意

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版