网易首页 > 网易号 > 正文 申请入驻

大神卡帕西谈AGI:悲观5-10倍

0
分享至

2025年,被称为智能体之年。这一年正在进入尾声,智能体怎么样了?

硅谷AI大神卡帕西(Andrej Karpathy),最近接受科技播客 Dwarkesh Patel长达3小时采访,对AI界提出了一些尖锐的批评。他在对话中说:有些智能体就是垃圾,这个行业“试图假装这很神奇”。播客视频发布之后,引起许多争议。

卡帕西平时写推文的风格,其实一向是反思、谦逊、技术含量很高又带点人文色彩。他又发了一篇长推文,借此澄清了播客中被误读的重点:他并不看空 AGI,只是比当前的乐观情绪更理性;他看好智能体交互、看衰传统 RL;强调“认知核心”与记忆削弱的方向;也批评了过度自动化的 Agent 幻象。

下面是他的长推文翻译,我们做了一点删节,调整了小标题。如下:


很高兴上周能参加 Dwarkesh 的节目。我觉得他的问题和整场对话都非常好。

我刚又重新看了一遍那期播客。首先,是的,我知道——我说话实在太快了,对此我很抱歉。这对我自己其实也不利,因为有时候我的“说话线程”比“思考线程”还快,结果导致有些解释没讲好;有时我又担心自己扯得太远、太枝蔓。总之,这里是一些补充说明:

AGI 时间表:悲观5-10倍

我在节目里谈AGI时间表的部分似乎成了早期反响里最热门的段落。我说的“智能体的十年(decade of agents)”其实指的是我之前那条推文。总体来说,我的 AI 时间线比你在旧金山的 AI 圈聚会或 Twitter 时间线上听到的要悲观 5–10 倍,但相比近来出现的一股“AI 怀疑论”浪潮,我又仍然算乐观。

这并不矛盾——我认为我们确实在近几年 LLM 上取得了巨大进展, 但同时要实现真正的 AGI 仍有大量工作要做:底层工程整合、感知器与执行器接入物理世界、社会制度配套、安全与防护(如越狱、数据投毒)等,还有许多研究任务要完成,才能造出一个“在任何岗位上你都宁愿雇用它而非人类”的实体。

从整体上看,10 年其实已经是个相当乐观的 AGI 时间表——只是与当下的“过热”情绪相比,才显得不那么乐观而已。

动物 vs 幽灵

我在 Sutton 的播客上写过一篇相关的想法。我对“只需放出一种简单算法就能从零学会一切”这类说法持怀疑态度。

如果有人真的造出了这样的系统,那我宁愿被打脸——那将是 AI 史上最惊人的突破。

在我看来,动物绝不是这样的例子。它们在出生前就被进化过程预装了大量智慧,出生后的学习其实很有限(比如斑马一出生就能站立奔跑)。从工程角度说,我们不可能“重做一次进化”。

但 LLM 意外地走出了一条替代路径:我们通过预测网络上的下一个 token,而不是生物进化,来“预装”大量智能。 这种方式造出的智能体,不像动物,更像幽灵或灵体(ghosts/spirits)。当然,我们可以也应该让它们逐渐更“像动物”,这也是许多前沿研究正在做的事情。

嘈杂的强化学习

我已经多次批评过RL。首先,它的问题是“像通过吸管吸监督信号(sucking supervision through a straw)”,也就是说信号效率极低。

其次,RL的反馈极其嘈杂:一个生成可能包含许多错误,但只要最终结果正确,就可能把那些错误步骤也奖励了;反过来,一个中途很有洞见的 token 却可能因为后续出错而被惩罚。“过程监督”或LLM 评审也各有问题。

我认为我们会看到新的学习范式出现。我长期看好“智能体式交互(agentic interaction)”,但短期看衰传统 RL

我最近看到一些论文的方向是对的,类似我之前称作“系统提示学习(system prompt learning)”的思路。但 arXiv 上的点子与能在前沿实验室真正大规模落地的实现之间,仍有鸿沟。

总体我仍然乐观——这一方向的进展会很快出现。 例如,ChatGPT 的记忆功能等,已经是这种新学习范式的原始实践雏形。

认知才是核心

我早先的帖子中,核心想法是剥除 LLM 的记忆,使其更难死记硬背,甚至主动移除部分记忆,从而增强泛化能力。 否则模型会过度依赖所记住的东西。

人类记忆困难——而这反倒可能是个优点,一种天然的正则化。参见我另一篇关于模型规模趋势“反向”的帖子: 为什么“模型必须先变大,然后才能变小”。

低能的智能体

我对当前业界的批评主要是:工具做得过头,而能力还没跟上。我生活在一个“中间状态”的世界——我想与 LLM 协作,我们各有所长。整个业界似乎活在一个未来幻境里:那时完全自主的智能体并行合作写完所有代码,人类已无用武之地。

例如,我并不想要一个跑 20 分钟后回来给我1000 行代码的智能体。我更不想监督 10 个这样的代理团队。

我希望以自己能理解的“块”为单位推进:LLM在写代码时能解释给我听;它能向我证明代码正确;它自动查API文档并展示用法;在不确定时少做假设,多与我协作。

我希望在过程中一起学习,成为更好的程序员,而不是被动地接收一堆“看似能跑的山一样的代码”。

我只是认为:这些工具应该更现实地匹配当前能力和行业需求。否则,若处理不好,我们可能会迎来“软件垃圾山”:漏洞、攻击面、安全问题都会激增。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
委内瑞拉代总统:委未受外部势力统治

委内瑞拉代总统:委未受外部势力统治

界面新闻
2026-01-07 07:18:38
她16岁带病夺冠,退役后定居美国,嫁美国帅哥,如今已当上大老板

她16岁带病夺冠,退役后定居美国,嫁美国帅哥,如今已当上大老板

知鉴明史
2025-12-14 10:10:02
比马杜罗遭遇更离奇:美国抓捕“中美亲善大使”,结局出乎意料!

比马杜罗遭遇更离奇:美国抓捕“中美亲善大使”,结局出乎意料!

华人星光
2026-01-06 12:18:23
徐根宝选择参加朱辰杰的婚礼,放弃另一个弟子的婚礼

徐根宝选择参加朱辰杰的婚礼,放弃另一个弟子的婚礼

周扬
2026-01-05 22:53:42
马杜罗被“绑架”到美国,彻底打脸国内的某些军事专家

马杜罗被“绑架”到美国,彻底打脸国内的某些军事专家

微评社
2026-01-05 11:17:53
6-0!6-1!萨巴伦卡太强了,直通冠军,郑钦文真打不过

6-0!6-1!萨巴伦卡太强了,直通冠军,郑钦文真打不过

体育就你秀
2026-01-06 12:20:57
Claude Code最强开源对手!GitHub 50.2k Star了,作者为它烧掉2.4w美元。

Claude Code最强开源对手!GitHub 50.2k Star了,作者为它烧掉2.4w美元。

袋鼠帝
2026-01-06 18:00:31
郑丽文迎来两大好消息:老对头失势、新强援到位,但要警惕柯文哲

郑丽文迎来两大好消息:老对头失势、新强援到位,但要警惕柯文哲

博览历史
2026-01-06 18:16:24
朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

朝鲜谁都不服,却主动将三位中国人写进教科书,还为其树立了铜像

云霄纪史观
2025-12-27 15:49:05
正视差距!中国想复刻美国特种兵“斩首”某岛还缺什么?

正视差距!中国想复刻美国特种兵“斩首”某岛还缺什么?

花花娱界
2026-01-05 20:42:58
马筱梅晒孕肚,一根妊娠纹都没长,一顿4菜2个汤,孕晚期才102斤

马筱梅晒孕肚,一根妊娠纹都没长,一顿4菜2个汤,孕晚期才102斤

心静物娱
2026-01-07 09:38:37
小米正式回应团队与争议KOL接触事件:辞退涉事员工

小米正式回应团队与争议KOL接触事件:辞退涉事员工

手机中国
2026-01-06 23:26:10
迪丽热巴的盛世美颜!

迪丽热巴的盛世美颜!

微微热评
2026-01-06 12:24:48
拜仁5-0完胜,26岁日本球星凌空斩,17岁新星2球1助,18岁新星1球1助

拜仁5-0完胜,26岁日本球星凌空斩,17岁新星2球1助,18岁新星1球1助

凌空倒钩
2026-01-06 23:53:46
杜兰特:离开太阳是我生涯首次被赶走 因此投进绝杀感觉格外好

杜兰特:离开太阳是我生涯首次被赶走 因此投进绝杀感觉格外好

北青网-北京青年报
2026-01-06 15:18:03
台媒:台军一架F-16战机夜间训练时失事,飞行员疑跳伞逃生,目前正在搜救中

台媒:台军一架F-16战机夜间训练时失事,飞行员疑跳伞逃生,目前正在搜救中

环球网资讯
2026-01-06 21:17:27
2026新加坡被预言为全球最惨国?!开年就遭这10大暴击...

2026新加坡被预言为全球最惨国?!开年就遭这10大暴击...

新加坡万事通
2026-01-06 19:06:34
日本预测,未来20年亚洲最发达的“四座城市”,我国几座榜上有名

日本预测,未来20年亚洲最发达的“四座城市”,我国几座榜上有名

牛牛叨史
2024-07-19 23:32:16
中国财政供养人员达6846万?结构失衡才是财政压力的核心

中国财政供养人员达6846万?结构失衡才是财政压力的核心

流苏晚晴
2025-12-04 19:27:08
湖人半场落后鹈鹕51-54,东契奇詹姆斯均得分上双

湖人半场落后鹈鹕51-54,东契奇詹姆斯均得分上双

格斗社
2026-01-07 10:16:39
2026-01-07 10:59:00
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
281文章数 61关注度
往期回顾 全部

科技要闻

马斯克杀疯了!xAI官宣200亿美元融资

头条要闻

李文荣被公诉:泄露尚未公开企业重组信息 搞权色交易

头条要闻

李文荣被公诉:泄露尚未公开企业重组信息 搞权色交易

体育要闻

全明星次轮票数:东契奇票王 詹皇超KD升西部第8

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

茅台为何要和分销商彻底说拜拜?

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

房产
健康
亲子
数码
教育

房产要闻

海珠双冠王!中交天翠以强兑现力+生活温度,筑就长期主义产品

这些新疗法,让化疗不再那么痛苦

亲子要闻

雀巢也出现毒奶粉事件了?

数码要闻

联想官宣6月推SteamOS版Legion Go 2掌机

教育要闻

定了!多所高校发布2026保送新政

无障碍浏览 进入关怀版