网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

奥特曼：ChatGPT只是意外，全能AI智能体才是真爱！Karpathy：7年前就想到了

2025-08-04 17:09:58　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：定慧好困

【新智元导读】当全世界为ChatGPT的成功喝彩时，OpenAI一个曾不起眼的小组，却在通过攻克数学难题，秘密锻造其真正的核心武器：「推理」能力，也就是终极目标「AI智能体」的心脏。他们的野望，是打造一个能为你代劳一切事务的全能AI。

历史往往都是由无数「意外和巧合」所塑造的。

2022年，当研究员Hunter Lightman加入OpenAI时，他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。

然而，Lightman却悄悄投身于一个看似不起眼的团队：MathGen。

他们的任务只有一个：训练AI模型去攻克高中级别的数学竞赛难题。

如今，这个曾经默默无闻的MathGen团队，竟被视为OpenAI现在能够问鼎行业的真正原因！

2023年5月31日OpenAI发布研究博客《Improving Mathematical Reasoning with Process Supervision》，正式提出过程监督（process supervision）训练的效果。

并在作者署名中出现Hunter Lightman等与MathGen team有关的研究人员。该博客是首次与MathGen团队相关的官方发布之一。

同日，奥特曼于X发布祝贺消息——这是首次由OpenAI亲口确认MathGen Team的官方存在。

他们锻造的「AI推理能力」，正是那项终极技术——AI智能体（AI Agent）的心脏！

这种智能体，将像人类一样，在电脑上独立完成你交办的一切任务！

「那时候，AI的数学推理能力简直一塌糊涂！」Lightman回忆道，「我们的使命，就是让它学会真正的思考。」

从「笨学生」到「奥数金牌」的进化！

平心而论，今天的OpenAI模型远未完美——它们依然会「一本正经地胡说八道」，那些所谓的AI智能体在复杂任务面前也常常束手无策。

但是，一场巨变正在发生！

OpenAI最顶尖的模型，其数学推理能力已实现惊天逆袭！

就在最近，

OpenAI坚信，这种强大的推理能力，将可以复制到任何领域！

这正是他们构建通用AI智能体的基石，是他们从创立之初就魂牵梦绕的终极梦想！

如果说，ChatGPT的成功是一场「无心插柳的惊世之作」，一个本想低调测试却意外引爆全球的奇迹。

那么，AI智能体，则是OpenAI精心布局数年、深思熟虑的战略结晶！

「未来，你只需要向电脑下达指令，它就会为你搞定一切！」

OpenAI的CEO奥特曼在2023年的开发者大会上宣告，「这种能力，就是AI智能体。它带来的颠覆，将是空前绝后的！」

奥特曼的预言能否成真？世界还在观望。但OpenAI已然出手！

2024年秋，其首个AI推理模型o1横空出世，一鸣惊人！

不到一年，缔造这一神话的21名核心研究员，瞬间成为硅谷疯抢的顶尖人物！

扎克伯格不惜血本，开出上亿美元的天价薪酬，从OpenAI挖走了5名o1团队的核心成员，组建Meta的「超级智能」军团。

其中一位，，更是被直接任命为Meta超级智能实验室的首席科学家！

一场围绕「AI大脑」的人才战争，已然白热化！

强化学习：引爆智能革命的古老技艺

OpenAI这场推理革命的背后，是一种被称为强化学习（RL）的古老技术在焕发新生。

它就像一个严厉的教练，在模拟环境中不断对AI的选择进行奖惩，从而教会AI何为「正确」。

这项技术并不新鲜。

早在2016年，谷歌DeepMind的AlphaGo就曾用它击败世界围棋冠军，名震天下。

彼时，OpenAI的元老级员工Andrej Karpathy已开始构想，如何用强化学习（RL）打造一个能熟练操作电脑的AI智能体。

然而，从理想到现实，OpenAI足足走了数年。

2018年，OpenAI推出了开创性的大语言模型GPT系列。

论文地址：https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

它靠着海量数据和GPU集群，成了文本处理的天才，并最终孕育了ChatGPT。

但它的软肋也同样致命——连基础数学都搞不定。

直到2023年，石破天惊的突破降临！

一个代号「Q*」（后被称为「Strawberry」）的项目，将大语言模型、强化学习（RL）和一种名为「测试时计算」的技术三位一体，融会贯通！

它赋予了模型额外的思考时间，让AI在给出答案前，能反复规划、推演和验证。

「思维链」（CoT）技术由此诞生！AI在处理闻所未闻的数学难题时，表现脱胎换骨！

「我亲眼目睹了模型开始真正地推理，」研究员El Kishky激动地说，「它会发现自己的错误，然后回溯修正，它甚至会表现出沮丧。那感觉，就像在阅读一个人的思想！」

这些技术单拎出来，并非首创。

但OpenAI的鬼斧神工之处，在于将它们以前所未有的方式组合，直接催生了后来的王牌——o1。

那一刻，OpenAI恍然大悟：这种规划与事实核查能力，不正是驱动AI智能体的完美引擎吗？

「我们攻克了一个我苦思冥想数年的难题！」Lightman说，「那是我科研生涯中，最心潮澎湃的瞬间！」

引爆推理：一场自下而上的豪赌

拥有了AI推理模型，OpenAI的雄心被彻底点燃。

他们发现了两条全新的进化路径：

1. 在模型训练后期，投入更多的算力！

2. 在回答问题时，给予模型更多的思考时间和算力！

「OpenAI这家公司，思考的从来不只是当下，而是未来如何将优势无限扩大！」Lightman说。

2023年「Strawberry」项目突破后，OpenAI火速组建了一支由研究员Daniel Selsam领衔的「AI智能体」特攻队。

他们的目标只有一个：将这项新能力推向极致！

起初，公司内部甚至没有严格区分「推理模型」和「AI智能体」。

共同的目标只有一个：打造能完成复杂任务的超级AI！

最终，这支特攻队的工作汇入了更宏大的o1模型项目，由联合创始人Ilya Sutskever等一众顶级大佬亲自挂帅。

为了打造o1，OpenAI必须押上最宝贵的资源——顶尖人才和GPU。

在OpenAI，资源从不靠论资排辈，而靠实力说话。

研究员必须用惊人的突破来换取公司的全力支持。

「在OpenAI，所有研究创新都源于一线，是自下而上的。」Lightman解释道。

「当我们把o1的惊人证据摆在桌上时，整个公司立刻达成共识：就是它了，全力冲锋！」

许多前员工认为，正是OpenAI对通用人工智能（AGI）近乎偏执的追求，才催生了这场推理革命。

他们心无旁骛，不为短期产品所动，将所有宝押在了打造最强AI大脑上。这种不计成本的豪赌，在其他AI巨头那里几乎不可能。

这个决策，如今回看，极具远见！

到2024年底，许多AI巨头发现，传统的「堆数据、堆算力」模式，回报越来越低。

而AI领域最激动人心的脉搏，正源自「AI推理」的进步！

AI究竟会不会「思考」？一场哲学的终结

AI真的在「推理」吗？它真的拥有了「思想」吗？

自o1问世以来，ChatGPT的界面里充满了「正在思考」、「正在推理」等拟人化词汇，仿佛在宣告一个新纪元的到来。

当被问及这个问题时，研究员Kishky基巧妙地回答：「我们是在教模型如何最高效地利用算力，去找到答案。如果从这个计算机科学的角度定义，那没错，它就是在推理。」

Lightman的看法则更加务实和「结果导向」：

「别管它内部是怎么运作的！如果一个模型能解决极其困难的问题，那它就已经掌握了达成目标所必需的、近似于推理的能力。」

他总结道，「我们可以称之为推理，因为它看起来就像那么回事。但这都只是手段，我们真正的目的，是为全人类打造强大到不可思议的AI工具！」

OpenAI的科学家们坦言，人们大可不必认同他们对「推理」的定义。

事实上，批评者早已涌现。但他们认为，争论名词远不如模型本身的能力重要。

AI研究员Nathan Lambert打了个绝妙的比方：AI推理就像飞机。

飞机的灵感来自飞鸟，但其飞行原理与鸟类截然不同。

这丝毫不影响飞机的伟大，它依然能带我们飞向天空。

AI的「思考」，或许也是如此——灵感源于人脑，机制却全然不同，但这并不妨碍它实现同样、甚至超越人类的结果。

终极战场：让AI智能体搞定主观任务

今天市场上的AI智能体，在编码等规则明确的领域已大显身手。

OpenAI的Codex能帮程序员处理琐碎代码，而Anthropic的模型更是在Cursor等AI编程工具中备受追捧，成为首批让用户心甘情愿付费的AI智能体。

然而，真正的挑战在于主观世界！

当你想让AI帮你网购、或找个长期停车位时，通用的AI智能体（如ChatGPT Agent）往往会让你失望——它们反应迟钝，还尽犯些低级错误。

这正是AI智能体走向普及的最后一道天堑：如何教会AI处理那些没有标准答案、充满主观色彩的任务？

「这本质上是个数据问题，」Lightman一针见血，「我们当前最激动人心的研究，就是如何让模型在不可验证的任务上进行有效训练。我们已经找到了一些线索！」

OpenAI的另一位核心研究员Noam Brown透露，他们已掌握全新的通用强化学习技术，能教会AI那些无法用简单对错来衡量的技能。

那块IMO奥数金牌，正是用这种方法拿下的！

夺金的AI模型，是一种更先进的系统：它能同时派出多个AI智能体，分头探索不同的解题思路，最后优中选优。

如今，谷歌和xAI的最新模型也纷纷采用了这种「群体智能」策略。

「AI的数学能力会越来越强，其他推理领域也一样。」Brown对此信心爆棚，「进步的速度快得令人难以置信，我看不出任何放缓的迹象！」

GPT-5的野望：通往万能AI的终极图景

这些突飞猛进的技术，很可能将在OpenAI即将发布的GPT-5模型中全面展现。

OpenAI的目标只有一个：用GPT-5的绝对优势，捍卫自己在AI智能体领域的王权！

但他们的野心不止于此。

Kishky基描绘了一幅终极图景：未来的AI智能体将能凭直觉理解你的意图，无需你繁琐地设置。

它会自主判断何时调用何种工具、需要投入多少「思考」，就像一个心有灵犀的超级助理。

这，才是ChatGPT的最终形态：一个能为你代劳互联网上一切事务，并且懂你心意的全能AI智能体！

这与今天的ChatGPT相比，已是天壤之别。但毫无疑问，OpenAI的研究正全速驶向这个未来。

然而，赛道已拥挤不堪！

几年前的绝对王者，如今已强敌环伺。DeepSeek、谷歌、Anthropic、xAI、Meta……个个虎视眈眈。

问题不再是OpenAI能否实现其智能体的未来，而是——

它能否在群雄逐鹿的血战中，第一个冲过终点。

参考资料：

https://techcrunch.com/2025/08/03/inside-openais-quest-to-make-ai-do-anything-for-you/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

AI实盘投资哪家强？专访Nof1人工智能负责人：表现最佳的都是开源模型

每日经济新闻 2025-11-05 23:20:06
0 跟贴 0
ChatGPT智能体来了：自己操作电脑干活，接管你的电脑，自动执行各种任务

量子位 2025-07-18 18:08:35
0 跟贴 0

大模型也会赌博上瘾！理智出走！

量子位 2025-11-03 07:06:08
0 跟贴 0

波士顿机器狗练成“轻功”！连续七个后空翻

量子位 2025-09-07 01:03:18
9 跟贴 9
Sakana AI造了个数字生命「培养皿」，AI学会打架、结盟、抢地盘

机器之心Pro 2025-11-05 13:58:14
0 跟贴 0

当Search Agent遇上不靠谱搜索结果，清华团队祭出自动化红队框架

机器之心Pro 2025-10-16 16:00:02
0 跟贴 0

开源RL框架Verlog来了，专为LLM智能体打造，400回合不成问题

机器之心Pro 2025-10-08 15:52:12
0 跟贴 0
亚马逊与Perplexity打起来了！互联网平台与智能体水火不容？

雷科技 2025-11-05 21:29:34
0 跟贴 0

聚焦手机AI“超级入口”，中兴Nebula小模型让手机秒变“小秘”？

量子位 2025-11-04 14:30:47
0 跟贴 0
五八智能四足机器人平台Q20A，适用于千行百业

量子位 2025-09-30 15:35:41
0 跟贴 0
五八智能四足机器人平台Q20A 不止跑跳整活还能维护公共安全

量子位 2025-09-30 10:01:00
0 跟贴 0
机器狗被锯腿也能继续走，Skild Brain估值45亿美元

量子位 2025-09-27 17:49:32
0 跟贴 0
机器人管家Figure 03来了，承包一切家务！

量子位 2025-10-11 10:13:00
0 跟贴 0
学术圈最强AI工具：6.9亿专业文献，“搜读创编”全程辅助

量子位 2025-09-11 18:42:26
0 跟贴 0
机器人终于有自己的真机评测大考了

量子位 2025-10-15 20:05:44
0 跟贴 0
机器狗跳千手观音，波士顿动力达人秀炸场

量子位 2025-06-13 15:55:52
0 跟贴 0
格斗冠军机器人突然发疯！吓呆研究人员

量子位 2025-07-25 09:10:58
0 跟贴 0
一个叫高斯的AI，只用了三周完成强素数定理

量子位 2025-09-20 00:57:38
0 跟贴 0
AI重塑人机交互方式，下一代终端如何变革？

量子位 2025-09-24 20:17:01
0 跟贴 0
李飞飞发起机器人家务挑战赛，老黄第一时间批钱赞助

量子位 2025-10-13 09:30:54
0 跟贴 0
从被群嘲到顶级玩家，阿里AI逆袭之路

华商韬略 2025-07-28 17:27:23
0 跟贴 0
机器人叠衣，灵巧手抓万物，超实用机器人组合来了

量子位 2025-07-29 03:31:41
0 跟贴 0
小鹏机器人里面是不是真人？全球网友吵翻了，CEO 现场「扒开衣服」自证

爱范儿 2025-11-06 17:18:24
0 跟贴 0
AI科学家登场！12小时抵人类科学家半年工作量，已有7项大成果

新智元 2025-11-06 17:15:23
0 跟贴 0
谷歌AlphaEvolve太香了，陶哲轩甚至发了篇论文，启发数学新构造

机器之心Pro 2025-11-06 17:28:11
0 跟贴 0
RLinf上新πRL：在线强化学习微调π0和π0.5

机器之心Pro 2025-11-06 17:29:51
0 跟贴 0
机器人首次踢5v5足球赛，摔跤是战术？我们和参赛队员聊了聊

量子位 2025-08-21 10:48:04
0 跟贴 0
物流业deepseek时刻，中国无人车火爆全球

华商韬略 2025-06-17 10:58:23
0 跟贴 0
可口可乐又翻车了？用AI做圣诞卡车广告，观众说「没灵魂」！

新智元 2025-11-06 17:15:35
0 跟贴 0
Anthropic的“第二大金主”或再出手！谷歌计划加大投资力度

财联社 2025-11-06 16:59:04
0 跟贴 0
订特斯拉新车7年拿不到车，OpenAI CEO奥特曼和马斯克再“互怼”

扬子晚报 2025-11-04 19:46:20
34 跟贴 34
基准榜单靠不住？奥特曼：AGI不是奇点，监管别一刀切

机器之心Pro 2025-10-09 18:32:29
0 跟贴 0
神秘策略曝光：中美关系颠覆在即？

和明艳 2025-11-04 07:57:14
3 跟贴 3
10亿美元！新版Siri将融入谷歌Gemini大模型，明年上线

雷科技 2025-11-06 17:02:30
0 跟贴 0
OpenAI官宣：全球企业客户突破100万席位数量超700万

财联社 2025-11-06 03:48:05
1 跟贴 1
何小鹏亲证小鹏机器人真伪，股价应声上涨

每日经济新闻 2025-11-06 13:47:44
0 跟贴 0
网友质疑小鹏人型机器人里是“真人” 何小鹏评论区回应 : 感谢认可

每日经济新闻 2025-11-06 13:47:43
0 跟贴 0
足协官宣 45岁邵佳一出任国足新主帅

央视新闻客户端 2025-11-05 17:36:01
13235 跟贴 13235
樊振东化身奥特曼亮相，孙颖莎第一天正式上训，王楚钦高情商发言

球盲百小易 2025-11-06 00:31:08
6 跟贴 6
奥特曼谈马斯克：我曾视他为英雄，如今不再说话

量子位 2025-09-16 04:14:37
0 跟贴 0

午后直线拉升！600939，超40万手封涨停

午后直线拉升！600939，超40万手封涨停

数据宝

2025-11-06 14:17:13

董璇46岁生日与丈夫恩爱合体，张维伊形象爆改越看越般配

董璇46岁生日与丈夫恩爱合体，张维伊形象爆改越看越般配

娱慧

2025-11-06 11:38:11

你这辈子听过最诛心的话是啥？网友：老公的爸爸，要我去找好人家

你这辈子听过最诛心的话是啥？网友：老公的爸爸，要我去找好人家

带你感受人间冷暖

2025-11-05 00:20:06

造价10亿地标13.6亿起拍！广州圆大厦第三次上架找买家

造价10亿地标13.6亿起拍！广州圆大厦第三次上架找买家

南方都市报

2025-11-06 11:51:15

尼泊尔“一妻多夫”该如何生活？妻子苦不堪言：一点都不幸福。

尼泊尔“一妻多夫”该如何生活？妻子苦不堪言：一点都不幸福。

百态人间

2025-11-06 05:45:02

宁波市轨道交通集团有限公司原副总经理张付林被“双开”

宁波市轨道交通集团有限公司原副总经理张付林被“双开”

界面新闻

2025-11-06 17:02:49

人民讨厌“阿里味儿”，山姆不要变成另一个阿里

人民讨厌“阿里味儿”，山姆不要变成另一个阿里

超先声

2025-11-04 17:40:42

德国外长刚重启访华，就开始搞事情，居然邀请蔡英文，我国不能忍

德国外长刚重启访华，就开始搞事情，居然邀请蔡英文，我国不能忍

DS北风

2025-11-06 10:58:05

裁员裁到核心是啥体验？网友：裁到我这条静脉，都照样痛很久

裁员裁到核心是啥体验？网友：裁到我这条静脉，都照样痛很久

解读热点事件

2025-11-06 00:05:09

林丹在西班牙为子庆生，谢杏芳盛装笑容满面，豪宅别墅显得热闹

林丹在西班牙为子庆生，谢杏芳盛装笑容满面，豪宅别墅显得热闹

科学发掘

2025-11-06 13:42:50

5国军方介入，菲军援手全部到齐，南海生变，解放军周边全是强敌

5国军方介入，菲军援手全部到齐，南海生变，解放军周边全是强敌

荐史

2025-11-04 19:10:14

周四收盘：今天涨到4008，做好准备了，周五很可能将迎来关键变盘

周四收盘：今天涨到4008，做好准备了，周五很可能将迎来关键变盘

好贤观史记

2025-11-06 15:00:23

1945年，跟林总一起赶赴东北的五位干部都是谁？建国后遭遇各不同

1945年，跟林总一起赶赴东北的五位干部都是谁？建国后遭遇各不同

冰雅忆史

2025-11-06 09:33:19

美国或关闭部分领空

新京报

2025-11-05 16:11:19

队记：杨瀚森将随开拓者队出征四天后开始的五连客场之旅

队记：杨瀚森将随开拓者队出征四天后开始的五连客场之旅

懂球帝

2025-11-06 16:14:25

返回时间已定！神舟二十号快速返回：比神舟十二缩短15小时

返回时间已定！神舟二十号快速返回：比神舟十二缩短15小时

火星一号

2025-11-04 21:46:57

新闻多一度丨神二十推迟返回空间碎片影响有多大？

新闻多一度丨神二十推迟返回空间碎片影响有多大？

新京报

2025-11-05 18:11:09

不雅视频流出！医院副院长出轨眼科主任？

不雅视频流出！医院副院长出轨眼科主任？

新动察

2025-11-06 15:10:03

Shams：詹姆斯将继续缺席湖人接下来的五连客，或11月19日复出

Shams：詹姆斯将继续缺席湖人接下来的五连客，或11月19日复出

懂球帝

2025-11-06 09:06:50

白百何疑开撕王传君冲热搜！疑因奖项分配不公，发文暗讽沪圈操作

白百何疑开撕王传君冲热搜！疑因奖项分配不公，发文暗讽沪圈操作

古木之草记

2025-11-05 18:13:32

AI产业主平台领航智能+时代

13801文章数 66238关注度

往期回顾全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

孙东旭离开东方甄选曾因与董宇辉"小作文风波"引争议

头条要闻

孙东旭离开东方甄选曾因与董宇辉"小作文风波"引争议

体育要闻

送走两位全明星，公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何谁给她的勇气？

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么？怎么大猩猩都来参加新车发布了？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

本地

亲子

手机

军事航空

中国色特别策划 | 故宫技艺与古意新生

本地新闻

这届干饭人，已经把博物馆吃成了食堂

亲子要闻

11月11日 | 陈慧敏督导专题讲座，破解迷思，剖析影子老师的角色定位

手机要闻

2025年第三季度，中国手机在印度遭遇了什么？

军事要闻

美国发射洲际弹道导弹俄方回应

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版