网易首页 > 网易号 > 正文 申请入驻

前OpenAI灵魂人物Jason Wei最新演讲!三大思路揭示2025年AI终极走向

0
分享至


新智元报道

编辑:定慧

【新智元导读】在AI加持下的这一年人类突飞猛进,停下来回头看去,似乎AI已经无所不能,但前OpenAI灵魂研究员认为AI不可能瞬间超越人类,他还提出了三个关于AI的最新洞见。

用三句话总结下2025年AI的发展,你会想到什么?

  • 所有能被验证的任务,最终都会被AI解决

  • 智能最后会变成商品知识价格归零

  • AI不会瞬间超过人类

最近,前OpenAI核心研究员、CoT(思维链)作者Jason Wei在斯坦福大学AI Club做了一场精彩的演讲。


这是他跳槽到Meta后少有的公开分享。

我们的世界,在AI大行其道的这一年,到底发生了什么?

AI继续发展下去是什么样子的?


量化交易员说AI很酷,但并不能做我的工作;

顶级实验室AI研究院:2-3年后,AI就要取代我的工作了。

那么,谁对谁错?

智能的商品化

Jason Wei的原话是Intelligence as a Commodity

AI的智能发展可以分为两个阶段:

第一阶段:前沿突破,当AI还无法很好地完成某任务时,研究的重点是「解锁新能力」。

第二阶段:能力商品化,一旦AI能完成该任务,该能力就会被快速复制、成本趋近于零。

例如在MMLU(多任务语言理解基准)上,过去几年模型性能稳步提升,而达到特定分数的成本却逐年下降


「自适应算力」的出现

AI的出现,也是首次深度学习真正实现自适应计算AdaptiveCompute)

过去无论任务简单还是困难,模型都消耗相同的算力


现在可以根据任务难度动态调整推理算力

例如在o1模型中,推理时投入更多计算,就能在数学题上获得更高准确率。

这意味着:智能的成本可以持续下降,而无需无限扩大模型规模。

同时,信息获取越来越容易。 AI正在让「公开知识」的获取时间趋近于零。


Jason以「查找1983年釜山结婚人数」为例:

  • 互联网时代前:去图书馆查百科,数小时

  • 互联网时代:搜索网站、筛选资料,数分钟

  • 聊天机器人时代:直接问AI ,即时

  • 智能体(Agent)时代:自动查找并整合数据库,数秒到数分钟

总结一下,Jason Wei认为智能作为一种「商品」,将越来越便宜

  • 知识民主化:编程、生物黑客等曾需高门槛知识的领域被大众化。

  • 私有信息的相对升值:公开信息成本趋零,内幕或独家信息的价值反而更高。

  • 个性化互联网:未来每个人可能拥有一套完全定制的知识入口。


验证者法则

什么是验证者法则?

所有能被验证的任务,最终都会被AI解决

所以现在会出现各种各样的评测基准。

只要能建立「能够被验证的任务」,AI都会攻破这个领域。

很明显的一点是,越容易生成的任务,越难被验证。

这就是验证的非对称性

比如数独和造一个网站,都属于中等难度和高难度的任务。

但是要验证一个数独题目的正确性,和验证一个网站是否开发的不错,很简单!

许多任务存在「生成难,验证易」的不对称:


  • 解数独:难求解,易验证。

  • 写出网站的全部代码:极难生成,但验证只需点击浏览。

  • 写事实性文章:容易生成「似是而非」的文本,但事实核查极其耗时。

  • 提出饮食法:容易断言「只吃野牛最好」,但验证需长期实验。

我们可将任务放在二维平面上:X轴,生成难度;Y轴,验证难度。


某些任务可以通过提供额外信息使其更易验证:

例如提供答案或测试集,使「生成→验证」更高效。

AI能否学会一项任务,与该任务的可验证性成正比

即:任何可验证、可量化的任务,AI终将掌握。

比如下面这种图,在过去5年中,大部分AI基准评测都非常容易被「验证」。


Jason Wei给出了可验证性的五个因素:

  • 是否存在客观真值;

  • 验证速度是否快;

  • 能否批量验证大量样本;

  • 结果是否低噪声、稳定;

  • 是否有连续反馈(不仅是「对/错」,还有质量梯度)。

几乎所有AI基准(benchmarks)都具备这些特征,因此被迅速攻克。

Jason Wei重点描述一个案例:DeepMind的AlphaEvolve


该系统通过大规模采样与自我验证,解决了大量「易验证难求解」的任务。


核心流程是:

  • 用语言模型生成候选答案;

  • 自动打分(验证);

  • 取最优样本再输入模型,形成迭代;

  • 反复迭代后性能显著提升。


这种策略绕过了「训练集-测试集」的泛化问题,只针对「单个任务」持续优化。

总结一下:

  • 可轻易验证的任务将率先被AI自动化。

  • 新的创业机会:AI创造「可测量的目标」

  • 即——只要你能定义一个明确的度量指标,AI就能为你优化它。


智能的锯齿边缘

这个关键点英文叫做The Jagged Edge of Intelligence,智能的锯齿边缘。

直接翻译有点抽象,但是如果看下图就很好理解了。

简单来说,就是AI的智能并不是「全知全能」,AI的智能水平就像锯齿一样,有高有低。


AI为什么不会「瞬间超越人类」

Jason认为不会出现「AI快速爆炸式超越人类」的「Fast Take off」。

AI的自我改进能力将是渐进的、分任务发展的

不同任务的学习速度和上限各不相同,不会「一夜超神」。

每个任务的改进速率不同:

  • 一些任务进步快(如可验证的数学、编程)。

  • 一些任务改进慢(如需要真实世界交互或罕见数据的语言)。

AI的发展呈「锯齿形」曲线:某些领域突飞猛进,某些长期停滞。

那么AI在哪些任务上发展快,哪些发展的慢?

判断任务进展速度的三条启发式法则:

  • 数字化任务发展快:迭代速度高、实验成本低;例如软件开发远快于机器人制造。

  • 对人类简单的任务,对AI也简单:但AI也能在某些「人类极难但有明确目标」的领域超越人类,如癌症影像预测。

  • 数据越多,AI越强:语言模型在高频语言上性能显著优于低资源语言,若任务能提供单一客观指标,还可用强化学习生成合成数据。

比如AI代码,现在基本已经被AI攻克,竞赛数学也被攻克了。

但是如果数据量很小,无法数字化的领域,AI就很难攻克。


总结一下:

  • 不存在统一的「AI超级智能爆发」;

  • 各任务将以不同速率演进;

  • 影响最大的领域是:数字化、人类已擅长、数据丰富的领域

Jason Wei在演讲最后总结道:

智能与知识将变得快速且廉价,公共知识的获取时间趋零。

而「验证者法则」则预示着可度量性推动AI进步,任何可验证的任务都会被AI征服。

智能的边界是锯齿状的。各任务发展速率不同,不会出现瞬间的超智能崛起。

未来的信息将无摩擦地流动,而AI的边界,将由我们能定义和验证的事物所决定。

演讲嘉宾介绍


Jason Wei,目前是Meta Superintelligence Labs的研究科学家。

他曾在OpenAI工作两年,参与创建了o1模型DeepResearch项目;

在那之前,他是Google Brain的研究员,推动了Chain-of-Thought推理InstructionTuning(指令微调)等技术的发展。

他的论文被引用超过9万次,是现代AI领域最具影响力的研究者之一。

参考资料:

https://www.youtube.com/watch?v=b6Doq2fz81U

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
外婆一直在舅舅家养老,我妈每月给舅舅家打2100元生活费

外婆一直在舅舅家养老,我妈每月给舅舅家打2100元生活费

小秋情感说
2025-11-06 14:25:23
山姆翻车再上热搜!商品头图全是假的,网友刷屏“辞退高管”

山姆翻车再上热搜!商品头图全是假的,网友刷屏“辞退高管”

雷科技
2025-11-04 14:50:05
中科大硕士求职比亚迪被拒,连面试的机会都没有,HR:问你母校!

中科大硕士求职比亚迪被拒,连面试的机会都没有,HR:问你母校!

知晓科普
2025-11-05 15:21:19
竞争对手爆发终结雷霆 杨瀚森开拓者生涯提前结束

竞争对手爆发终结雷霆 杨瀚森开拓者生涯提前结束

体坛周报
2025-11-06 14:46:33
缺谁谁尴尬?詹姆斯开季休战9场,湖人7胜2负高居西部第二

缺谁谁尴尬?詹姆斯开季休战9场,湖人7胜2负高居西部第二

懂球帝
2025-11-06 16:14:25
6-0!国锦赛首位4强选手诞生:吴宜泽连胜12局!淘汰世界第1第13

6-0!国锦赛首位4强选手诞生:吴宜泽连胜12局!淘汰世界第1第13

球场没跑道
2025-11-06 16:43:35
哈佛大学教授一句话,解决人生90%的问题

哈佛大学教授一句话,解决人生90%的问题

洞见
2025-11-04 21:50:08
缺谁都能赢,湖人随机刷新3巨头,这场又变了,签约3人有成倍回报

缺谁都能赢,湖人随机刷新3巨头,这场又变了,签约3人有成倍回报

体坛大辣椒
2025-11-06 14:42:43
雷军:越来越多人开上小米汽车 感受到小米超高品质

雷军:越来越多人开上小米汽车 感受到小米超高品质

3DM游戏
2025-11-05 18:42:18
印度不讲武德,给苹果开41亿美元罚单,库克傻眼了!

印度不讲武德,给苹果开41亿美元罚单,库克傻眼了!

公子故事会
2025-11-05 18:11:49
女子破庙避雨,见两黑蛇缠绵不休,她一把扯掉自己红肚兜

女子破庙避雨,见两黑蛇缠绵不休,她一把扯掉自己红肚兜

梦飞故事会
2024-08-03 21:13:29
收到中国邀请函,卡尼得意忘形,转头背刺中国,中美都得罪了个遍

收到中国邀请函,卡尼得意忘形,转头背刺中国,中美都得罪了个遍

绝对军评
2025-11-06 15:43:39
网红鸭:从“做羽绒”到“穿羽绒”,现存羽绒服相关企业超4.8万家

网红鸭:从“做羽绒”到“穿羽绒”,现存羽绒服相关企业超4.8万家

投资时间网
2025-11-05 10:41:50
湖人险胜!东契奇35+9+13,赛后谁留意老詹?走入场内和队友庆祝

湖人险胜!东契奇35+9+13,赛后谁留意老詹?走入场内和队友庆祝

担酒
2025-11-06 14:14:13
刘亦菲李宇春缺席,杨幂意外C位,网友调侃新局面

刘亦菲李宇春缺席,杨幂意外C位,网友调侃新局面

暖心萌阿菇凉
2025-11-05 15:44:34
新人婚车遭拦截被索要50条烟,新娘弃车离开,婚车司机称“刚下楼婚车就被拦”,律师:或涉嫌敲诈勒索罪

新人婚车遭拦截被索要50条烟,新娘弃车离开,婚车司机称“刚下楼婚车就被拦”,律师:或涉嫌敲诈勒索罪

洪观新闻
2025-11-06 15:23:22
被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

徐徐道史
2025-11-04 18:34:05
还没完了!赵鸿刚对手给所有武林大师下战书,中国武协或出面干预

还没完了!赵鸿刚对手给所有武林大师下战书,中国武协或出面干预

杨华评论
2025-11-05 23:59:12
红军村惨烈决战:乌军顽强抵抗俄军冲锋,付出惨重代价

红军村惨烈决战:乌军顽强抵抗俄军冲锋,付出惨重代价

世界探索者探索
2025-11-01 00:06:39
中国将迎来前所未有的死亡高峰,专家得出答案:是这些因素导致

中国将迎来前所未有的死亡高峰,专家得出答案:是这些因素导致

小小包工头阿汾
2025-11-06 08:19:52
2025-11-06 17:39:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13801文章数 66238关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

孙东旭离开东方甄选 曾因与董宇辉"小作文风波"引争议

头条要闻

孙东旭离开东方甄选 曾因与董宇辉"小作文风波"引争议

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

数码
教育
本地
家居
军事航空

数码要闻

10亿美元!新版Siri将融入谷歌Gemini大模型,明年上线

教育要闻

黔南:“石榴籽”抱紧,幸福路同行

本地新闻

这届干饭人,已经把博物馆吃成了食堂

家居要闻

别样府院 畅享诗意生活

军事要闻

美国发射洲际弹道导弹 俄方回应

无障碍浏览 进入关怀版