网易首页 > 网易号 > 正文 申请入驻

“实现AGI仍需十年”:AI三大认知缺陷让Karpathy重估了技术进度

0
分享至

在“AGI 近在咫尺”的热潮中,这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy,曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家,近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对话,并在随后发布的长文中系统阐述了他对人工智能发展的思考。

从 AGI 时间表、强化学习的局限、智能体的真实能力,到教育与人类未来的图景,Karpathy 系统地提出了一个核心观点:“AGI 仍需十年。但这是一个乐观、但需要冷静面对的十年。”

他以自动驾驶的十年征途、代码生成的缺陷、以及“无声崩溃”的模型现象,为当前整个行业对未来的狂热预期校准了表达方式。


(来源:youtube @ Dwarkesh Patel)

近年来,随着大型语言模型(LLM)能力的飞跃,从“AI 元年”到“AGI 元年”的口号不绝于耳,行业内的普遍预期似乎已将 AGI 的实现压缩到了短短几年之内。Karpathy 对此持有保留态度。他认为,当前行业中弥漫着过度预测的倾向,而这种过于激进的期待忽视了现实层面的复杂性和偶然性。他强调,更加准确的表述应该是我们正步入“智能体的十年(Decade of Agents)”。

从业二十年的经验告诉 Karpathy,当前被寄予厚望,认为可以替代实习生、甚至是正式员工工作的的智能体,目前来说“根本还跑不通”。他指出了当前智能体存在的根本性认知缺陷(Cognitive Deficits)——缺乏真正的持续学习能力。也就是说,你无法真正教会它们某件事,它们的多模态能力仍处初级阶段。在 Karpathy 看来,这些问题无疑是棘手的和困难的,但也是可以克服的。但解决这些问题,至少需要一个十年的尺度。

但这并不代表 Karpathy 正在唱衰 AGI 的未来,相反,他想强调人类确实在过去几年里取得了 LLM 带来的惊人进展,但距离能在任意岗位上取代人类的通用智能,仍有漫长的系统集成与现实约束需要克服,包括对物理世界的感知、执行、社会协调、安全与防护等层面。

Karpathy 的“十年之论”很大程度上源于他领导特斯拉自动驾驶五年的深刻教训。他指出,自动驾驶领域存在一个巨大的演示(Demo)到产品(Product)的鸿沟。尽管在 1986 年就存在过卡车自动驾驶的演示,Karpathy 本人在 2014 年体验 Waymo 时,也获得了近乎完美的驾驶体验,但纵观过去十年,自动驾驶行业仍步履蹒跚。

Karpathy 使用了三个“九”来形容这一过程:实现 90% 的可靠性(第一个九)相对容易,但从 90% 到 99%(第二个九),再到 99.9%(第三个九),“每增加一个九,都需要投入与之前同样多的工作量”。在特斯拉的五年里,他们可能只推进了两到三个“九”。相同的增长曲线也存在于 AI 智能体的发展中,尤其是涉及高风险的软件工程领域。一个表现近乎完美的 AI 程序员,如果每七年(相当于自动驾驶的平均事故间隔)犯一个重大错误,就可能泄露数亿人的社保号码,其后果是灾难性的。

目前,行业对 AGI 路径的最大赌注之一是“AI 自动化 AI 研究”,即 AI 智能体通过编写代码实现递归式自我改进。然而,Karpathy 以自己构建 nanochat(一个 ChatGPT 的极简复刻版)的亲身经历,对此提出了反对意见。他发现,在编写这种智力密集型的、非样板化的新代码时,现有的 AI 编程助手几乎没有帮助。他将当前的代码 AI 斥为残次品(Slop)。

具体而言,Karpathy 认为 AI 的认知缺陷表现在三个层面:

第一是无法理解“定制化”:当 Karpathy 没有使用 PyTorch 标准的 DDP(分布式数据并行)容器,而是编写了自己的同步程序时,AI 助手完全无法理解,并非常焦虑地试图让他用回标准库;

第二是“臃肿与过时”:Karpathy 认为,AI 助手倾向于过度防御,编写大量“try-catch”语句,试图构建生产级代码库,导致代码臃肿,并且频繁使用“已弃用的 API”;

第三是“高昂的沟通成本”:他发现用自然语言向 AI 解释自己想要什么(Vibe Coding)效率极低,远不如自己定位到代码,输入前几个字母,让自动补全来完成。

一言以蔽之,Karpathy 认为整个行业都高估了 AI 的自主性。他更认同于自动滑块(Autonomy Slider)的比喻:AI 目前更像是一个更好的编译器或语法高亮(highlight),而不是一个自主的程序员。人类正在缓慢地提升自己的抽象层次,但远未到被取代的时刻。

同时,Karpathy 多次批评强化学习(RL),认为它是用吸管吸监督信号的低效方式。在他看来,RL 的信号稀薄且嘈杂存在着错误答案可能被奖励(误打误撞),和正确推理可能被惩罚(后续出错)的情况。他看好的是新的学习范式,比如系统提示学习(System Prompt Learning)与基于智能体交互的学习(Agentic Interaction)。

这些思路试图让模型通过持续交互和任务驱动形成学习闭环,而不是靠脆弱的奖励函数。

他认为,ChatGPT 的记忆系统就是这种新型学习范式的早期原型。

除此之外,Karpathy 还提出了 Cognitive Core(认知核心)的概念,即通过剥离模型的记忆能力,让它更好地泛化。他指出,人类记忆有限,反而形成了强大的抽象与推理能力;

而 LLM 记忆过多,倾向于复述,而非理解。因此,有意限制模型记忆,可能是一种“正则化”。他还提出,一个反直觉的趋势是:“模型必须先变得更大,然后才能变得更小”——先获得足够的多样性,再提炼出核心结构。

对于业界最关心的AGI 是否会带来经济爆炸问题,Karpathy 给出了最出人意料的答案:不会。

他预测,AGI 的到来,将平滑地“融入”过去数百年 2% 的 GDP 年增长曲线中。Karpathy 认为,AI 并非一种全新的、能打破规律的技术,它从根本上是计算的延伸。纵观历史,无论是计算机的发明、互联网的普及,还是 iPhone 的诞生,这些“革命性”技术都没有在 GDP 曲线上造成一个突兀的“尖峰”。它们的影响是巨大的,但扩散是缓慢的、渐进的,最终都被平滑地吸收到 2% 的增长中。

“我们已经处于一场智能爆炸中数十年了,”Karpathy 说,“只是我们在以慢动作的方式经历它”。从工业革命开始,自动化和递归式自我改进就一直在发生。编译器是早期的软件自动化,Google 搜索、IDE,乃至今日的 AI,都只是这条平滑曲线上的最新一步。AGI 不会改变这条曲线的斜率,它只是“使我们能继续保持在 2% 增长轨迹上”的原因。


(来源:X @Andrej Karpathy)

在为行业的狂热降温后,Karpathy 也分享了自己的下一步——创办教育项目“Eureka”。他坦言,他最恐惧的未来不是 AGI 失控,而是《机器人总动员》(WALL-E)或《蠢蛋进化论》(Idiocracy)中的景象:人类被 AI 剥夺了权力,沦为无用的旁观者。

他将自己的项目比作“星际舰队学院”(Starfleet Academy),一个旨在培养人类精英、驾驭前沿技术的机构。他认为,教育是一个构建知识坡道的、高难度的技术问题。Karpathy 描绘了一个“AGI 之后”的教育图景。届时,教育的目的不再是有用(为了赚钱),而是有趣(for fun)。他将其比作去健身房:现代人不需要强大的体力来搬运重物,但人们依然健身,因为它“有趣、健康,而且‘六块腹肌’看起来很性感”。

他相信,当 AI 消除了学习的“摩擦力”(那种因为太难或太简单而“碰壁”的痛苦感),学习本身将成为一种乐趣和自我实现。在 Karpathy 的设想中,人类的未来不是被机器取代,而是借助技术,实现“超人化”的认知繁荣。

参考资料:

1.https://www.dwarkesh.com/p/andrej-karpathy

2.https://x.com/karpathy/status/1979644538185752935

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
政府关门35天终于酿成大祸?一架波音飞机撞向大楼,现场十分惨烈

政府关门35天终于酿成大祸?一架波音飞机撞向大楼,现场十分惨烈

哄动一时啊
2025-11-07 21:21:29
荷兰政府:预计安世中国将很快恢复芯片供应,荷方将继续与中方、欧盟等密切协调

荷兰政府:预计安世中国将很快恢复芯片供应,荷方将继续与中方、欧盟等密切协调

界面新闻
2025-11-07 14:54:07
央视对全红婵的称呼变了,两字之差释放强烈信号,陈宇汐说对了

央视对全红婵的称呼变了,两字之差释放强烈信号,陈宇汐说对了

探源历史
2025-11-06 08:50:00
太炸裂!副院长和主任纵欢后续:手术单当床单,身份被扒不简单!

太炸裂!副院长和主任纵欢后续:手术单当床单,身份被扒不简单!

千言娱乐记
2025-11-06 10:48:47
貂皮水洗退货后续:警方介入,宝妈身份被扒彻底社死 商家有后手

貂皮水洗退货后续:警方介入,宝妈身份被扒彻底社死 商家有后手

揽星河的笔记
2025-11-06 13:58:48
美国选举结果利好乌克兰

美国选举结果利好乌克兰

名人苟或
2025-11-06 16:40:48
打虎!方红卫被查

打虎!方红卫被查

极目新闻
2025-11-07 20:14:29
钱再多有什么用!印度首富3个孩子各有短板,没人能继承家族事业

钱再多有什么用!印度首富3个孩子各有短板,没人能继承家族事业

照见古今
2025-11-07 19:52:50
绝不当“冤大头”!菲律宾灾情惨烈,西方援助敷衍,中国不能惯着

绝不当“冤大头”!菲律宾灾情惨烈,西方援助敷衍,中国不能惯着

博卜talk
2025-11-07 16:27:23
不装了?面对解放军武力夺台,郑丽文语出惊人,喊出“武力保台”

不装了?面对解放军武力夺台,郑丽文语出惊人,喊出“武力保台”

赵钇是个热血青年
2025-11-05 17:29:23
湖南人民医院不雅视频事件反转,网友力挺男女主角:发视频的该杀

湖南人民医院不雅视频事件反转,网友力挺男女主角:发视频的该杀

刚哥说法365
2025-11-07 18:52:04
成“老赖”不到72小时,于谦资产被扒底朝天,杨议的话有人信了

成“老赖”不到72小时,于谦资产被扒底朝天,杨议的话有人信了

科学发掘
2025-10-31 14:06:52
多名网友爆料,手机信号栏被运营商塞广告

多名网友爆料,手机信号栏被运营商塞广告

黑猫科技迷
2025-11-06 22:00:39
小米汽车99.4%保值率遭打脸:二手市场无人问津,谁都不敢接

小米汽车99.4%保值率遭打脸:二手市场无人问津,谁都不敢接

麦小柒
2025-11-06 20:40:23
林丹在西班牙为子庆生,谢杏芳盛装笑容满面,豪宅别墅显得热闹

林丹在西班牙为子庆生,谢杏芳盛装笑容满面,豪宅别墅显得热闹

科学发掘
2025-11-06 13:42:50
俄罗斯为啥不担心芯片制造光刻机问题?除中国,其他国家都不担心

俄罗斯为啥不担心芯片制造光刻机问题?除中国,其他国家都不担心

百态人间
2025-10-31 05:35:02
强烈建议:今后所有的乒乓球比赛,禁止球迷到现场观看比赛和加油

强烈建议:今后所有的乒乓球比赛,禁止球迷到现场观看比赛和加油

杨哥乒乓
2025-11-07 19:45:29
德国足协推出新logo:从草根到顶级

德国足协推出新logo:从草根到顶级

体坛周报
2025-11-07 10:55:34
杜兰特嘲讽莫兰特父亲:你儿子不想在灰熊待了,享受最后的周末吧

杜兰特嘲讽莫兰特父亲:你儿子不想在灰熊待了,享受最后的周末吧

懂球帝
2025-11-07 08:31:13
政治和军事难平衡,波克罗夫斯克不行了,乌军战场形势不尽如人意

政治和军事难平衡,波克罗夫斯克不行了,乌军战场形势不尽如人意

山河路口
2025-11-07 12:45:23
2025-11-08 00:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15837文章数 514273关注度
往期回顾 全部

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

头条要闻

家长称男婴被两个不满12周岁女孩害死:拿她们没办法

头条要闻

家长称男婴被两个不满12周岁女孩害死:拿她们没办法

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

王家卫的“看人下菜碟”?

财经要闻

荷兰政府:安世中国将很快恢复芯片供应

汽车要闻

美式豪华就是舒适省心 林肯航海家场地试驾

态度原创

家居
数码
本地
艺术
公开课

家居要闻

现代自由 功能美学居所

数码要闻

萤石启明Y5000FVX Ultra体验:当智能锁拥有三块屏幕和AI大脑

本地新闻

这届干饭人,已经把博物馆吃成了食堂

艺术要闻

Donna Young:美国当代艺术家

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版