网易首页 > 网易号 > 正文 申请入驻

OpenAI联合创始人揭秘AI进化新方向:让模型学会和人类一样反思

0
分享至

Karpathy 认为强化学习(RL)在 AI 领域目前很火,而且确实能带来显著的性能提升。RL 的核心逻辑是:通过奖励信号(比如“这次做得好”或“这次很差”),调整模型未来行为的概率。

这种方法比传统的监督微调(SFT)更高效,因为它通过“试错”能挖掘出更优的策略,而不需要人工事无巨细地标注数据。

这就是所谓的“verifier functions”(验证函数)带来的杠杆效应——你只需要告诉模型结果好坏,它自己就能摸索出更好的路径。但 Karpathy 也提出了两个关键的担忧,说明 RL 可能不是 AI 智能进化的全部答案:

1. 长任务的局限性(渐进问题):

当任务变得很长(比如需要几分钟甚至几小时的交互),RL 的机制看起来有点低效。你花了大量时间完成一个复杂任务,最后只得到一个单一的“得分”(scalar reward),然后用这个得分去调整整个过程中的行为权重。这就像跑了一场马拉松,最后只告诉你“跑得不错”或“跑得不好”,但没有具体告诉你哪里可以改进。这种方式在超长任务上显得粗糙,效率不高。

2. 人类学习的差异(机制问题):

人类在学习时并不完全依赖“结果好坏”这种单一信号。我们会通过反思来提取更多信息,比如“这次哪里做得好?哪里出了问题?下次该怎么改进?”这种反思过程会生成明确的经验教训(lessons),就像一条条指导原则,帮我们在未来做得更好。

Karpathy 觉得,RL 缺少这种类似人类反思的机制,而这可能是 LLMs 未来进化的关键。

人类学习的启发:反思与“经验教训”

Karpathy 用“second nature”(第二本能)来形容人类通过反思逐渐掌握技能的过程。比如,你学骑自行车时,摔了几次后会总结:“我得保持平衡,眼睛看前方。”这种总结就像一条“经验教训”,直接指导你下次的行为。

Karpathy 认为,AI 应该也有类似机制,尤其是像 LLMs 这样有强大语言能力和上下文学习能力的模型。他举了个例子:LLMs 在处理某些任务(比如数单词“strawberry”里的“r”)时,因为分词和内部计算的限制,表现得很吃力。Anthropic 给 Claude 加了一条“补丁”提示,大意是:“如果要数字母,先把单词拆成单个字母,用逗号隔开,然后一个一个数。”这条提示就像人类总结的“经验教训”,直接告诉模型怎么做更有效。

问题在于:这条“补丁”是工程师手动加的。Karpathy 想知道,能不能让模型自己通过实践和反思,自动生成这样的“经验教训”,而不是靠人类硬编码?更进一步,这些教训能不能被“蒸馏”成模型的直觉(类似人类睡觉时巩固记忆),避免上下文窗口无限膨胀?

提出的一种新算法思路

Karpathy 设想了一种可能的算法,灵感来自人类反思的机制,专门为 LLMs 设计:

1. 多次尝试(Rollouts):让模型针对一个任务做几次尝试,每次记录行为和结果(奖励高低)。

2. 反思阶段:把这些尝试的结果塞进上下文窗口,用一个“元提示”(meta-prompt)引导模型分析:“这次哪里做得好?哪里不好?下次该怎么改进?”生成一条明确的“经验教训”(lesson),以字符串形式记录。

3. 更新系统提示:把新生成的“教训”加到系统提示中,或者存到一个“教训数据库”里,供未来使用。4. 长期优化:为了避免上下文窗口塞满这些教训,可以通过某种方式(类似“睡眠”)把它们蒸馏到模型权重中,形成更高效的直觉。这种方法利用了 LLMs 的独特优势——它们能理解和生成语言,能在上下文里学习新策略。而传统的 RL(比如在 Atari 游戏或机器人控制中)没有这种语言能力,所以无法直接套用这个思路。

为什么这很重要?未来的 S 曲线

Karpathy 认为,RL 确实比监督微调更“苦涩”,而且还会带来更多性能提升。但他也相信,RL 只是当前的一条 S 曲线(技术进步的阶段性曲线),未来还有更多曲线等待发现。特别是对于 LLMs 这样有语言能力的模型,可能会有全新的学习范式,超越传统 RL 的局限。

这些范式可能跟人类反思、总结、归纳的方式更接近,而且在长任务和复杂问题上更高效。他提到的 ChatGPT 新增的“Memory”功能,可能是一个雏形,但目前只用于个性化定制(比如记住用户偏好),还没用于解决复杂问题。Karpathy 的设想是:如果能让模型自己总结经验教训,并在实践中不断优化,可能会开启 AI 智能的新篇章。

Andrej Karpathy个人简介:

Andrej Karpathy 是人工智能研究机构 OpenAI 的创始成员之一,并在其早期发展阶段(2015年至2017年)担任研究科学家;

2017年6月,他接受埃隆·马斯克的邀请,离开 OpenAI,加入特斯拉,担任人工智能和 Autopilot Vision 的总监,后晋升为 AI 高级总监;

2023年2月,在离开特斯拉一段时间后,Karpathy 宣布重新加入 OpenAI,参与改进 ChatGPT 的 GPT-4模型。

责任编辑:孙海阳_NS7151

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方不再退让!达尔文港风波升级,5亿澳元开启澳方毁约买单路

中方不再退让!达尔文港风波升级,5亿澳元开启澳方毁约买单路

快看张同学
2026-02-03 09:48:46
黄金、白银直线飙涨!特朗普突发!事关关税!

黄金、白银直线飙涨!特朗普突发!事关关税!

证券时报e公司
2026-02-03 07:57:16
外交部:敦促美方严肃认真对待中方关切,要求美国执法部门立即停止错误行径

外交部:敦促美方严肃认真对待中方关切,要求美国执法部门立即停止错误行径

环球网资讯
2026-02-02 15:32:43
雷军:第一代小米SU7已停售 个别车商为了蹭流量又哭又闹 欢迎大家帮我们举报

雷军:第一代小米SU7已停售 个别车商为了蹭流量又哭又闹 欢迎大家帮我们举报

快科技
2026-02-02 12:42:07
郑爽张恒家街头互撕!郑爽满头白发疑精神失常,孩子哭到发抖没人管

郑爽张恒家街头互撕!郑爽满头白发疑精神失常,孩子哭到发抖没人管

八卦王者
2026-02-03 10:08:04
晚年的李作鹏每日无酒肉不欢,在审查时要求改善生活,吃肉喝酒?

晚年的李作鹏每日无酒肉不欢,在审查时要求改善生活,吃肉喝酒?

春秋砚
2026-02-02 16:30:07
具俊晔心碎发声「我的熙媛」:下次再见,我们要在一起一辈子

具俊晔心碎发声「我的熙媛」:下次再见,我们要在一起一辈子

ETtoday星光云
2026-02-02 19:34:09
一个残酷的真相:夜空中7000颗星星,全都位于银河系范围内

一个残酷的真相:夜空中7000颗星星,全都位于银河系范围内

观察宇宙
2026-01-31 20:29:00
伊朗武装部队总参谋长:地区战火将波及美国及其盟友

伊朗武装部队总参谋长:地区战火将波及美国及其盟友

财联社
2026-02-02 15:53:04
新春走基层|独龙江戍边民警带我“出任务”:给文面奶奶拍下“人生照片”

新春走基层|独龙江戍边民警带我“出任务”:给文面奶奶拍下“人生照片”

新华社
2026-02-02 15:34:42
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
大S逝世一周年雕像揭幕,具俊晔设计寄思念,雨中悼念看哭众人

大S逝世一周年雕像揭幕,具俊晔设计寄思念,雨中悼念看哭众人

很哥
2026-02-02 22:36:10
爱泼斯坦的文件正在曝光!塞尔维亚总统武契奇:预计48小时内伊朗将遭到袭击,“或者有其他重大事件发生”

爱泼斯坦的文件正在曝光!塞尔维亚总统武契奇:预计48小时内伊朗将遭到袭击,“或者有其他重大事件发生”

浙江之声
2026-02-02 15:38:46
蔡康永发文缅怀大S,说大S应该被好好疼爱的

蔡康永发文缅怀大S,说大S应该被好好疼爱的

素素娱乐
2026-02-03 07:27:12
中美俄,供养着一大群废物

中美俄,供养着一大群废物

智先生
2026-02-02 21:11:32
江苏省教育厅发布:假期不仅是孩子学业休整的驿站,更是全面发展的沃土,请理性看待校外培训,莫让假期变成“第三学期”

江苏省教育厅发布:假期不仅是孩子学业休整的驿站,更是全面发展的沃土,请理性看待校外培训,莫让假期变成“第三学期”

扬子晚报
2026-02-02 14:41:49
赵匡胤帐下的五虎大将,都有谁?他们的结局如何,谁混得最好?

赵匡胤帐下的五虎大将,都有谁?他们的结局如何,谁混得最好?

凡人侃史
2026-02-01 23:47:51
大S的两个孩子,不参加妈妈的雕像仪式原因曝光

大S的两个孩子,不参加妈妈的雕像仪式原因曝光

素素娱乐
2026-02-03 12:06:34
哪些人情世故是你长大后才明白的?网友:贵人不可贱用

哪些人情世故是你长大后才明白的?网友:贵人不可贱用

解读热点事件
2026-01-29 04:45:45
发现个奇怪现象:电车没有“干掉”油车,却“干掉”了汽车修理厂

发现个奇怪现象:电车没有“干掉”油车,却“干掉”了汽车修理厂

刘哥谈体育
2026-01-19 11:46:50
2026-02-03 13:23:03
爆角追踪
爆角追踪
全球热点事,一起来追踪。
1223文章数 213778关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

男子投200万做租赁业务起步即爆单 每周收租金超百万

头条要闻

男子投200万做租赁业务起步即爆单 每周收租金超百万

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

精神病医院骗保内幕调查:住院相当于坐牢

汽车要闻

问界M6官图首发 以年轻化设计叩击25-30万级市场

态度原创

本地
手机
家居
健康
军事航空

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

手机要闻

米粉隔空喊话卢伟冰 Turbo 6需要1TB大存储

家居要闻

极简木艺术 典雅自在

耳石症分类型,症状大不同

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版