网易首页 > 网易号 > 正文 申请入驻

“实现AGI仍需十年”:AI三大认知缺陷让Karpathy重估了技术进度

0
分享至

在“AGI 近在咫尺”的热潮中,这位 AI 领域的核心人物选择踩下了刹车。Andrej Karpathy,曾任特斯拉 AI 总监、OpenAI 创始成员的硅谷顶尖技术专家,近日在 Dwarkesh Patel 的播客中发表了一场长达两个多小时的深度对话,并在随后发布的长文中系统阐述了他对人工智能发展的思考。

从 AGI 时间表、强化学习的局限、智能体的真实能力,到教育与人类未来的图景,Karpathy 系统地提出了一个核心观点:“AGI 仍需十年。但这是一个乐观、但需要冷静面对的十年。”

他以自动驾驶的十年征途、代码生成的缺陷、以及“无声崩溃”的模型现象,为当前整个行业对未来的狂热预期校准了表达方式。


(来源:youtube @ Dwarkesh Patel)

近年来,随着大型语言模型(LLM)能力的飞跃,从“AI 元年”到“AGI 元年”的口号不绝于耳,行业内的普遍预期似乎已将 AGI 的实现压缩到了短短几年之内。Karpathy 对此持有保留态度。他认为,当前行业中弥漫着过度预测的倾向,而这种过于激进的期待忽视了现实层面的复杂性和偶然性。他强调,更加准确的表述应该是我们正步入“智能体的十年(Decade of Agents)”。

从业二十年的经验告诉 Karpathy,当前被寄予厚望,认为可以替代实习生、甚至是正式员工工作的的智能体,目前来说“根本还跑不通”。他指出了当前智能体存在的根本性认知缺陷(Cognitive Deficits)——缺乏真正的持续学习能力。也就是说,你无法真正教会它们某件事,它们的多模态能力仍处初级阶段。在 Karpathy 看来,这些问题无疑是棘手的和困难的,但也是可以克服的。但解决这些问题,至少需要一个十年的尺度。

但这并不代表 Karpathy 正在唱衰 AGI 的未来,相反,他想强调人类确实在过去几年里取得了 LLM 带来的惊人进展,但距离能在任意岗位上取代人类的通用智能,仍有漫长的系统集成与现实约束需要克服,包括对物理世界的感知、执行、社会协调、安全与防护等层面。

Karpathy 的“十年之论”很大程度上源于他领导特斯拉自动驾驶五年的深刻教训。他指出,自动驾驶领域存在一个巨大的演示(Demo)到产品(Product)的鸿沟。尽管在 1986 年就存在过卡车自动驾驶的演示,Karpathy 本人在 2014 年体验 Waymo 时,也获得了近乎完美的驾驶体验,但纵观过去十年,自动驾驶行业仍步履蹒跚。

Karpathy 使用了三个“九”来形容这一过程:实现 90% 的可靠性(第一个九)相对容易,但从 90% 到 99%(第二个九),再到 99.9%(第三个九),“每增加一个九,都需要投入与之前同样多的工作量”。在特斯拉的五年里,他们可能只推进了两到三个“九”。相同的增长曲线也存在于 AI 智能体的发展中,尤其是涉及高风险的软件工程领域。一个表现近乎完美的 AI 程序员,如果每七年(相当于自动驾驶的平均事故间隔)犯一个重大错误,就可能泄露数亿人的社保号码,其后果是灾难性的。

目前,行业对 AGI 路径的最大赌注之一是“AI 自动化 AI 研究”,即 AI 智能体通过编写代码实现递归式自我改进。然而,Karpathy 以自己构建 nanochat(一个 ChatGPT 的极简复刻版)的亲身经历,对此提出了反对意见。他发现,在编写这种智力密集型的、非样板化的新代码时,现有的 AI 编程助手几乎没有帮助。他将当前的代码 AI 斥为残次品(Slop)。

具体而言,Karpathy 认为 AI 的认知缺陷表现在三个层面:

第一是无法理解“定制化”:当 Karpathy 没有使用 PyTorch 标准的 DDP(分布式数据并行)容器,而是编写了自己的同步程序时,AI 助手完全无法理解,并非常焦虑地试图让他用回标准库;

第二是“臃肿与过时”:Karpathy 认为,AI 助手倾向于过度防御,编写大量“try-catch”语句,试图构建生产级代码库,导致代码臃肿,并且频繁使用“已弃用的 API”;

第三是“高昂的沟通成本”:他发现用自然语言向 AI 解释自己想要什么(Vibe Coding)效率极低,远不如自己定位到代码,输入前几个字母,让自动补全来完成。

一言以蔽之,Karpathy 认为整个行业都高估了 AI 的自主性。他更认同于自动滑块(Autonomy Slider)的比喻:AI 目前更像是一个更好的编译器或语法高亮(highlight),而不是一个自主的程序员。人类正在缓慢地提升自己的抽象层次,但远未到被取代的时刻。

同时,Karpathy 多次批评强化学习(RL),认为它是用吸管吸监督信号的低效方式。在他看来,RL 的信号稀薄且嘈杂存在着错误答案可能被奖励(误打误撞),和正确推理可能被惩罚(后续出错)的情况。他看好的是新的学习范式,比如系统提示学习(System Prompt Learning)与基于智能体交互的学习(Agentic Interaction)。

这些思路试图让模型通过持续交互和任务驱动形成学习闭环,而不是靠脆弱的奖励函数。

他认为,ChatGPT 的记忆系统就是这种新型学习范式的早期原型。

除此之外,Karpathy 还提出了 Cognitive Core(认知核心)的概念,即通过剥离模型的记忆能力,让它更好地泛化。他指出,人类记忆有限,反而形成了强大的抽象与推理能力;

而 LLM 记忆过多,倾向于复述,而非理解。因此,有意限制模型记忆,可能是一种“正则化”。他还提出,一个反直觉的趋势是:“模型必须先变得更大,然后才能变得更小”——先获得足够的多样性,再提炼出核心结构。

对于业界最关心的AGI 是否会带来经济爆炸问题,Karpathy 给出了最出人意料的答案:不会。

他预测,AGI 的到来,将平滑地“融入”过去数百年 2% 的 GDP 年增长曲线中。Karpathy 认为,AI 并非一种全新的、能打破规律的技术,它从根本上是计算的延伸。纵观历史,无论是计算机的发明、互联网的普及,还是 iPhone 的诞生,这些“革命性”技术都没有在 GDP 曲线上造成一个突兀的“尖峰”。它们的影响是巨大的,但扩散是缓慢的、渐进的,最终都被平滑地吸收到 2% 的增长中。

“我们已经处于一场智能爆炸中数十年了,”Karpathy 说,“只是我们在以慢动作的方式经历它”。从工业革命开始,自动化和递归式自我改进就一直在发生。编译器是早期的软件自动化,Google 搜索、IDE,乃至今日的 AI,都只是这条平滑曲线上的最新一步。AGI 不会改变这条曲线的斜率,它只是“使我们能继续保持在 2% 增长轨迹上”的原因。


(来源:X @Andrej Karpathy)

在为行业的狂热降温后,Karpathy 也分享了自己的下一步——创办教育项目“Eureka”。他坦言,他最恐惧的未来不是 AGI 失控,而是《机器人总动员》(WALL-E)或《蠢蛋进化论》(Idiocracy)中的景象:人类被 AI 剥夺了权力,沦为无用的旁观者。

他将自己的项目比作“星际舰队学院”(Starfleet Academy),一个旨在培养人类精英、驾驭前沿技术的机构。他认为,教育是一个构建知识坡道的、高难度的技术问题。Karpathy 描绘了一个“AGI 之后”的教育图景。届时,教育的目的不再是有用(为了赚钱),而是有趣(for fun)。他将其比作去健身房:现代人不需要强大的体力来搬运重物,但人们依然健身,因为它“有趣、健康,而且‘六块腹肌’看起来很性感”。

他相信,当 AI 消除了学习的“摩擦力”(那种因为太难或太简单而“碰壁”的痛苦感),学习本身将成为一种乐趣和自我实现。在 Karpathy 的设想中,人类的未来不是被机器取代,而是借助技术,实现“超人化”的认知繁荣。

参考资料:

1.https://www.dwarkesh.com/p/andrej-karpathy

2.https://x.com/karpathy/status/1979644538185752935

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

芳芳历史烩
2025-09-24 20:13:19
中国正在上演的诡异经济

中国正在上演的诡异经济

难得君
2025-10-29 19:26:55
全红婵退赛另有隐情!放弃全运单人不是只保伤,国家队在下一盘棋

全红婵退赛另有隐情!放弃全运单人不是只保伤,国家队在下一盘棋

一只番茄鱼
2025-11-02 23:11:44
1982年戴安娜艰难生下威廉,女王第一眼就赞了孙子的耳朵,很幽默

1982年戴安娜艰难生下威廉,女王第一眼就赞了孙子的耳朵,很幽默

讯崽侃天下
2025-11-02 20:16:57
刘强东带章泽天见客户,章泽天穿四万香奈儿外套,刘强东满脸宠溺

刘强东带章泽天见客户,章泽天穿四万香奈儿外套,刘强东满脸宠溺

一只番茄鱼
2025-11-02 21:32:57
乌军将大规模莫斯科,无人机和导弹全面出动!

乌军将大规模莫斯科,无人机和导弹全面出动!

知兵
2025-10-31 21:38:48
ASML CEO:中国正尝试抛弃我们的光刻机,还可能拿稀土卡我们脖子

ASML CEO:中国正尝试抛弃我们的光刻机,还可能拿稀土卡我们脖子

泠泠说史
2025-11-01 15:55:16
中信建投:A股或进入新一轮横盘调整 关注主线和风格切换

中信建投:A股或进入新一轮横盘调整 关注主线和风格切换

财联社
2025-11-02 18:34:17
你见过哪些惊为天人的神操作?网友:我愿称第一个小姐姐为天人

你见过哪些惊为天人的神操作?网友:我愿称第一个小姐姐为天人

带你感受人间冷暖
2025-11-01 00:10:10
趁着不少人还在观望,中国家长迅速出手,不到300万把文京区卷成“新海淀”

趁着不少人还在观望,中国家长迅速出手,不到300万把文京区卷成“新海淀”

掘金日本房产
2025-11-02 18:05:23
历史再次选中了香港,这次关乎国运!

历史再次选中了香港,这次关乎国运!

米筐投资
2025-08-26 07:11:32
刘嘉玲在录制综艺节目的时候走混搭路线,看起来格外的年轻。

刘嘉玲在录制综艺节目的时候走混搭路线,看起来格外的年轻。

小椰的奶奶
2025-11-02 04:29:45
腿控必看!10位巅峰「美腿女艺人」大盘点!

腿控必看!10位巅峰「美腿女艺人」大盘点!

素然追光
2025-11-03 03:14:58
乔欣为什么喜欢展示她漂亮的大脚丫?

乔欣为什么喜欢展示她漂亮的大脚丫?

老吴教育课堂
2025-11-03 04:24:15
牡丹花下死!结婚刚一个月,娶“白月光”的李国庆彻底成为笑话

牡丹花下死!结婚刚一个月,娶“白月光”的李国庆彻底成为笑话

春秋论娱
2025-09-23 07:20:44
2026年中国载人任务公布,1名航天员将在轨1年,为何如此安排?

2026年中国载人任务公布,1名航天员将在轨1年,为何如此安排?

科学黑洞v
2025-11-02 10:04:45
有哪些泼天富贵你没有接住?网友:就差一点我就成富二代了

有哪些泼天富贵你没有接住?网友:就差一点我就成富二代了

解读热点事件
2025-10-31 00:05:07
花掉三亿人民币,打捞一艘800年沉船,打开船舱后,所有人都懵了

花掉三亿人民币,打捞一艘800年沉船,打开船舱后,所有人都懵了

通鉴史智
2025-11-01 07:24:00
毛主席曾留七大预言:当时没人信,如今6个已应验,第7个即将实现

毛主席曾留七大预言:当时没人信,如今6个已应验,第7个即将实现

秀心文雅
2025-09-13 10:25:44
国民党再掀波澜!郑丽文上任真相令人震惊!

国民党再掀波澜!郑丽文上任真相令人震惊!

鲁源写作读书会
2025-11-01 06:00:07
2025-11-03 06:19:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15808文章数 514255关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

马来西亚首富之子买上海大平层 449平米1.17亿元

头条要闻

马来西亚首富之子买上海大平层 449平米1.17亿元

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

房产
教育
本地
健康
公开课

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

教育要闻

TTS新传论文带读:新词新词!!!来看看什么叫做“报格”!!!

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

核磁VS肌骨超声,谁更胜一筹?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版