网易首页 > 网易号 > 正文 申请入驻

OpenAI首席科学家:AI实习生,离我们不远了

0
分享至

全文 2,000字 | 阅读约 6 分钟


(Jakub关于模型能力演进路径的最新观点)

2026 年 9 月,OpenAI 计划推出首个“AI研究实习生”。

这是 OpenAI 首席科学家 Jakub Pachocki 在最新访谈中给出的时间表。距离现在,只剩5 个月。

在他看来,AI 的定位已经从单纯的工具转向“人类员工”:能独立运行多久、能否应对模糊的任务、需要多少人工干预,这些成为了衡量模型的新标准。

这意味着,AI 的角色开始从日常助手变成完成任务的智能体。

当这一转变发生时,被重塑的不仅只是 AI 的形态,更是人类的工作方式。

第一节|能力演进:从编程到科学研究

这一轮的 AI 技术浪潮,很容易被外界狭隘地理解为“编程工具变强了”。

但在 OpenAI 内部,变化早已不止于写代码,而是开始向更完整的工作流推进。

Jakub Pachocki透露,他们已经把Codex用在大量实际的编程工作中。真正的改变不在于代码写得更快,而是很多原本需要人类一步步操作的流程,现在可以直接交由模型去执行。你不再需要亲自敲下每一行代码,只需下达目标,让它完成一整段任务,人只负责最后的检查和微调。

除了工作效率的提升,过去几个月里,模型在数学和科学领域能力也出现极大提升。

AI 现在开始能够处理更复杂的问题,它不只是给出最终答案,还能提供中间的推理过程,甚至提出有价值的解题思路。在一些测试中,它已经能够接近甚至达到国际数学竞赛难度。更重要的是,在“首创性证明(first proof)”这种研究型挑战中,模型在极短时间内,就跑通了本该需要人类花上数天甚至更久才能摸索出的解题路径。

这说明什么?说明AI不仅能执行指令,还开始具备了探索未知的能力。

编程之所以成为突破口,是因为它天然有着清晰的反馈机制,对或错极易验证。数学也是同样的逻辑。正因为在这些领域能够精准评判结果的好坏,模型才有机会不断修正自己的过程,逐渐将能力向高难度推进。当这种能力稳定下来后,它便开始向更复杂、更贴近现实的问题迁移,比如科学研究中的假设验证、实验设计,甚至是新的思路生成。

Jakub 在访谈中强调:他们越来越关注的,不再是模型在某个基准测试上的跑分,而是它在真实世界中能否真正帮人解决问题。无论是研究、工程,还是其他具有实际商业价值的工作,衡量标准正在从“答对多少题”,转向“能否把一项任务推进到底”。

从写代码到做研究,表面上看行业跨度极大,其实底层有一条极其清晰的演进路径:先在可被验证的领域建立基础能力,再把这种能力延伸到更复杂的现实场景,最终深度介入那些原本需要人类长期投入的高级工作之中。

第二节|两个差距和一个时间表

将当下的 AI 精确定位为“实习生”,是 Jakub Pachocki 经过深思熟虑的结论。

因为“实习生”与“独立研究员”之间,存在两个最本质的差距。

第一,是独立工作的持续时间。

如果你把任务交给一位经验丰富的人类研究员,你只需指明一个大方向,比如“把模型能力再提升一截”。对方就能自主拆解问题、寻找路径、不断试错,甚至持续数周或数月推进工作。但目前的 AI 还做不到这一点。尽管它的连续运行时间在变长,也能完成一段完整的任务,但依然需要人类在关键节点给出明确的指引和纠偏。

第二,是处理模糊问题的能力。

现实世界里的绝大多数工作,起初并没有标准答案。往往只有一个粗略的方向、一个初步的想法,甚至只是一个模糊的目标,需要在推进的过程中不断去澄清和定义。人类研究员的不可替代性恰恰在于此:他们不仅是执行者,更是探路者,能决定“下一步该做什么”。

现阶段的 AI,更擅长处理那些“已经被定义清楚”的任务。比如,验证一个具体的思路、用新方法跑一次实验,或者对已知结果进行数据分析,在这些明确的边界内,它做得越来越好,效率甚至超越了人类。可一旦让它自己去定义问题、选择探索方向,其能力表现还不稳定。

这就是它被称为“AI实习生”的原因。

Jakub 给出了极其明确的时间表:在2026 年 9 月前,实现“研究实习生”级别的AI系统;在2028年3月前,将其推进到具备更高自主性的“AI研究员”。

按他的原话,实现这一跨越的大部分技术要素已经具备,现在的核心工作就是将它们有效整合。

我们已经站在了变革的前夜。

第三节|执行外包,决策留给人

当 AI 跨越了单纯“回答问题”的边界,开始能够闭环完成一段任务时,这场变化就不再停留在工具升级的层面,而是触及了更底层的命题:人类究竟该如何做事。

在访谈中,Jakub Pachocki 指出,模型短期能力的跃升,正在直接改变研究推进的速度。这意味着,许多原本需要人力一点点啃下来的冗长工作,现在正被加速,甚至被完全重置。

过去,推进一项复杂研究或项目的标准节奏往往是:人类提出想法 → 亲自动手验证 → 不断试错调整 → 缓慢向前推进。大量的时间被消耗在繁琐的执行细节中,真正用于决定方向的时刻反而寥寥无几。

但随着 AI 能够接手大部分执行工作时,人不再需要亲自完成每一步,可以把更多精力放在三件事上:确定方向、拆解任务、评估结果。“执行”本身,正逐渐被外包给工具。

当一个人不再被具体的操作占满时间,他的核心价值就不再是“做得有多快”,而是“决定做什么”以及“如何统筹”。面对同样的工具,有人只能用来加快手头的计件工作,有人却能以此为杠杆,极大地拓展业务边界,这中间的差距将变得越来越大。

这种工作流的重组,在顶尖实验室中已经成为现实。Jakub 坦言,他们团队如今越来越需要将精力放在“哪些方向值得投入”的取舍上,而不是像过去那样平均分配资源。原因是:当执行的成本大幅下降时,真正稀缺的就不再是人手,而是正确的选择。

类似的变化也在影响更多工作场景。

比如写代码、做分析、写方案,这些原本需要完整经验积累的事情,门槛正在下降。一个人不需要掌握所有细节,也可以完成相当一部分工作。但与此同时,对整体把控的要求反而更高了。你需要知道目标是什么,哪些结果是有效的,哪些只是表面看起来不错。

所以,如果将“AI实习生”放回现实世界,它带来的震撼,绝不仅仅是为我们添了一个得力助手。它是在强迫人类的工作方式发生转向:从“亲自把事做完”,转向“设计并管理 AI 去把事做完”。

这时候,每个白领问题变成了:你能不能决定什么值得做,以及怎么把这件事交给 AI 做好。

结语|只剩一件事

“AI 实习生”不是关于未来的设想,是正在发生的现实。

AI 能力边界,正在从“帮你做一点”,走向“替你完成一段”。

我们需要适应的,是职业角色的彻底转变:当 AI 接管了越来越多的执行工作,人类最终剩下的,只剩一件事:

决定什么值得做。

识自AI

本文由AI深度研究院出品,内容整理自Jakub Pachocki在Unsupervised Learning播客访谈等网上公开素材,属评论分析性质。内容为观点提炼与合理引述,未逐字复制原访谈材料。未经授权,不得转载。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:

https://www.youtube.com/watch?v=vK1qEF3a3WM

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普威胁若中国向伊朗供武就加征关税,外交部:关税战没有赢家

特朗普威胁若中国向伊朗供武就加征关税,外交部:关税战没有赢家

澎湃新闻
2026-04-13 15:32:26
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
巴铁彻底服了。

巴铁彻底服了。

安安说
2026-04-13 10:40:06
15个副省级市已明确,辽宁2个,江苏1个,安徽、河南1个都没有

15个副省级市已明确,辽宁2个,江苏1个,安徽、河南1个都没有

今日搞笑分享
2026-04-14 07:54:44
李国麟喊话莫氏鸡煲老板“你什么时候开宵夜”,店方:没有这个计划

李国麟喊话莫氏鸡煲老板“你什么时候开宵夜”,店方:没有这个计划

现代快报
2026-04-13 16:28:23
禁区外,插花脚,摩洛哥中卫旷世杰作预定普斯卡什

禁区外,插花脚,摩洛哥中卫旷世杰作预定普斯卡什

体坛周报
2026-04-13 15:07:15
在上海生活的毛剑卿,银行负责人妻子很漂亮,如今已是助理教练

在上海生活的毛剑卿,银行负责人妻子很漂亮,如今已是助理教练

米果说识
2026-04-13 14:33:48
单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

单程决死突击!伊朗飞行员壮烈牺牲,炸翻美司令部,换掉3架美机

混沌录
2026-04-13 17:41:11
下一波暴雨,马上到广东!还有9级大风

下一波暴雨,马上到广东!还有9级大风

鲁中晨报
2026-04-14 07:24:07
厦门市在改名吗?厦门铁路公园出现大量“春江市”标识,引发热议

厦门市在改名吗?厦门铁路公园出现大量“春江市”标识,引发热议

火山詩话
2026-04-14 05:42:49
中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

懂球帝
2026-04-13 22:48:15
外媒:欧委会和德国就欧尔班败选发声

外媒:欧委会和德国就欧尔班败选发声

参考消息
2026-04-13 16:39:13
25岁男子为寻求刺激,十几天内猥亵7人,专挑天黑独自行走或跑步的女性

25岁男子为寻求刺激,十几天内猥亵7人,专挑天黑独自行走或跑步的女性

观威海
2026-04-13 18:24:10
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
欧冠2006冠军名单被提前泄露,12年后全中,欧足联至今没吭声

欧冠2006冠军名单被提前泄露,12年后全中,欧足联至今没吭声

篮坛第一线
2026-04-13 14:48:02
穆帅命悬一线!本菲卡2-0续命,决战葡萄牙体育成欧冠生死战

穆帅命悬一线!本菲卡2-0续命,决战葡萄牙体育成欧冠生死战

阿晞体育
2026-04-13 10:57:09
多校鼓励博士生读硕士,释放了什么信号

多校鼓励博士生读硕士,释放了什么信号

第一财经资讯
2026-04-13 19:55:20
日网疯传“日本买石油,用人民币结算”,网民反应太好玩

日网疯传“日本买石油,用人民币结算”,网民反应太好玩

这里是东京
2026-04-13 19:13:51
马伊琍官宣喜讯不到24小时,文章高调求“复合”,过往恩怨已翻篇

马伊琍官宣喜讯不到24小时,文章高调求“复合”,过往恩怨已翻篇

林轻吟
2026-04-14 07:22:14
协议即将达成,28国联手对付中国,名单公开,没一个善茬

协议即将达成,28国联手对付中国,名单公开,没一个善茬

温读史
2026-04-13 10:56:29
2026-04-14 10:00:49
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
441文章数 170关注度
往期回顾 全部

科技要闻

OpenAI痛批Anthropic营收注水80亿美元

头条要闻

麻生太郎被指对高市的态度出现转变 正在物色替代人选

头条要闻

麻生太郎被指对高市的态度出现转变 正在物色替代人选

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

伊朗要求五个中东国家赔偿战争损失

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

时尚
健康
艺术
亲子
军事航空

今年科切拉的风吹向了谁?

干细胞抗衰4大误区,90%的人都中招

艺术要闻

郑丽文来啦!揭露蒋经国和宋美龄鲜为人知的秘密!

亲子要闻

清明过后少给娃吃凉,多喝这碗扶阳汤,体质好长得壮

军事要闻

特朗普:今晚10点封锁伊朗 对北约非常失望

无障碍浏览 进入关怀版