网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

马斯克亲自点名Karpathy迎战Grok 5！别神话LLM，AGI还要等十年

2025-10-19 13:41:03　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：KingHZ

【新智元导读】AGI并非明天到，但也不是海市蜃楼。Karpathy直言：通往 AGI 的路已出现，却布满硬骨头——强化学习信号稀薄、模型崩塌风险、环境与评估匮乏、系统集成与安全难题等。他给出一个「乐观而不煽情」的时间表：10年。

昨天，OpenAI的创始元老、特斯拉前深度学习负责人Karpathy，公开表示：AGI仍有十年之遥。

Karpathy批评业界高估了当前的AI的智能水平，但同时他认为通向AGI之路已经出现，但这条路并非坦途。

Karpathy解释了实现AGI的众多难题：

为什么强化学习很糟糕（不过其他方法更糟）、

为什么模型崩塌会阻止大语言模型像人类那样学习、

为什么AGI只会融入过去约2.5个世纪以来每年约2%的GDP增长趋势、

为什么自动驾驶花了这么久才被攻克。

这些问题很难，所以大概实现AGI还需要10年。水。

马斯克点名Karpathy迎战Grok 5

马斯克认为，Karpathy的确有些观点不错。

但随后，马斯克话锋一转，点名卡帕西和Grok 5来场编程大战，类似于国际象棋大师卡斯帕罗夫与深蓝的对决时刻。

不过，Karpathy拒绝了马斯克的挑战，并表示

我宁愿与Grok 5合作，也不愿与它竞争

考虑到马斯克认为目前Grok 5实现AGI的概率只有10%，但要Grok 5在编程上挑战Karpathy。

或许，AI初创Yuchen Jin的推文很好解释马斯克为何如此做：

马斯克在用他的「现实扭曲立场」，在推动xAI团队实现「不可能的目标」。

智能体工程师Dan Mac表示，Karpathy在断言，现在正处于LLM炒作的「幻灭低谷期」。

这更像一种现实主义：与其摆擂台，不如把工具打磨好。

看起来，Karpathy有力支持了LLM怀疑论者——那些人可能正在庆祝「AI无用论」的胜利。

这令人沮丧。尤其是当你关心AI，并看到了它真正缓解人类苦难的潜力时。

但Dan Mac指出，故事还未结束，接下来要发生的都是好消息：启蒙的斜坡——生产力缓慢但平稳地上升，到达最终瓶颈之前还很长。

其实，Karpathy把整期播客又看了一遍。

他先自我检讨：有时「口比心快」，所以有些解释我讲砸了；有时也会紧张，担心自己跑题太远，或者在次要细节里拐得太深。

下面，是Karpathy的补充观点和自我辩白。

Karpathy的辩白

整体看，10年应当是对AGI很乐观的时间表，只是与当下的炒作相比，它看起来没那么「提气」。

10年很短

关于通用人工智能（AGI）时间线，这是目前讨论里最受关注的部分。

「智能的十年」（the decade of agents）对应的是他之前关于OpenAI Operator智能体的推文：

2025年，的确是智能体的元年，但未来10年都是「智能体时代」。

大体上，Karpathy认为他比旧金山「AGI时间线」悲观大约 5–10 倍；但相对于近期兴起的否定派和怀疑论者，又仍然偏乐观。

这里并不矛盾：

1）这几年大语言模型（LLM）确实取得了巨大进展；

2）同时距离「在世界上任意岗位都更想雇它而不是雇人」的那个实体，还有大量工作要做：苦活累活、系统集成、连接物理世界的感知与执行、社会层面的协同，安全与防护（越狱、投毒等），以及进一步的研究。

整体看，10年本应是非常乐观的AGI时间线；只是和当下的炒作氛围一对比，才显得「不够乐观」。

人工幽灵智能：AGI=Artifical Ghost Intelligence？

Karpathy怀疑是否存在「一条极其简单的算法，让它丢进世界就能从零学到一切」。

若有人真造出这种东西，他就错了——那将是AI史上最惊人的突破。

在他心里，动物并不是这种例子——动物由进化「预装」了大量智能，后天学习总体上很有限。比如，斑马一出生就能跑。

LLM是一种不同的形式的智能

从工程角度说，我们不可能重做一遍进化。

LLM是另一条「预装智能」的路：不是靠进化，而是靠在互联网上「预测下一个Token」把大量知识塞进网络。

这会诞生一种不同于动物的智能形态，更像「幽灵/灵体」。

当然，我们完全可以、也应该逐步让它们更「像动物」，很多前沿工作本质上就在做这件事。

强化学习不是全部答案

在博客中，Karpathy说，现在强化学习就像「通过吸管吸取监督」 ——

模型尝试几百种方法，只得到一个「对错」信号，然后把这个信号广播给成功路径的每一步，包括那些纯属运气的错误步骤。

你瞎猜猜中了答案，然后把猜的过程也当成「正确方法」强化，这能学好吗？

他还提到一个更荒诞的例子：有个数学模型突然开始得满分，看起来「解决了数学」。但仔细检查发现，模型输出的是「da da da da da」这样的完全胡言乱语，却骗过了LLM评判者。

这就是用LLM做评判的问题——它们会被对抗样本攻击。

之前，Karpathy多次评议过RL，这是他一贯的观点：

RL会继续带来阶段性成果，但不是全部答案。

首先，RL的signal/flop（信号/算力）比很差。它还很嘈杂；反过来，一些极有洞见的 Token 可能「被惩罚」（因为后面步骤失误）。

Karpathy认为会出现替代性的学习范式。

他长期看好「智能体式交互」（agentic interaction），但看空「传统RL」。

文本数据和监督微调的对话对，不会消失，但强化学习时代，环境才是主角。

与前两者不同，环境让 LLM 有机会真正进行互动——采取行动、观察结果等等。这意味着你可以期待比统计专家模仿做得更好。它们既可用于模型训练，也可用于评估。

但和以前一样，现在的核心问题是需要大量多样化且高质量的环境集，作为 LLM 的练习对象。

近期有不少论文在找对了方向，比如他称之为「系统提示词学习」（system prompt learning）的方法：

系统提示学习虽然设置类似强化学习，但学习算法不同（编辑操作 vs 梯度下降）。

通过这种范式，LLM 系统提示的大部分内容都可以自动生成，就像 LLM 在为自己撰写解决问题的指南手册。若成功，这将形成全新且强大的学习范式。当然还有许多细节待探索。

不过，arXiv上的点子与一家前沿实验室真正能大规模、普适地落地之间，仍有不小的鸿沟。

他总体乐观，觉得这条线很快会见到实质进展。

例如，ChatGPT 的记忆功能等，已经是新学习范式的「原始部署样本」。

认知内核与「反事实」练习

长期依赖，Karpathy主张把LLM的「记忆」剥离或至少「加阻尼」，逼它们少靠死记硬背、多做抽象与迁移。

「认知核心」作为 LLM 个人计算的核心，默认常驻于每台电脑中。它的特性正逐渐明晰：

支持原生多模态的文本/视觉/音频输入与输出。

采用套娃式架构，可在测试时灵活调节能力大小。

推理能力，带调节功能（系统2）积极使用工具。

设备端微调LoRA插槽，用于实时训练、个性化和定制化。

人类记不住那么多细节，这反而像一种「正则化」——限制了记忆，泛化更好。

对应地，他也写过

模型尺寸的趋势是「先大后小」：先堆到足够大以承载能力，再在架构、训练范式和数据上做减法与蒸馏，向「更小、更专注的认知内核」收敛。

再做个「反事实」练习：如果把33年的算法进步，带回1989年的LeCun实验室，能把当年的结果提升到什么程度？

这能帮我们拆因：究竟是算法、数据还是算力在「卡脖子」。

在任何时代，正确地定位约束项，才谈得上有效地投资与推进。

关于LLM智能体（Agents）

行业里很多工具假定「全自治团队并行协作、自动写万行代码、人类只当监工」。

Karpathy更偏向「协作式中间态」：

以人脑能装得下的「块」为单位迭代；
让模型解释自己在写什么、为什么这么写；
主动引用 API/标准文档自证正确；
不确定就问，少做拍脑袋的假设；
让人类在循环中学习与增能。

否则我们会迎来「代码沼泽」和安全面扩大。

与范围编程相比， AI辅助编程重点在于严格约束这位热情过度的「天才实习生——AI拥有软件百科全书般的知识，却总是满嘴跑火车，勇气过剩但对好代码几乎毫无品味。

关键在于保持缓慢、防御性、谨慎、多疑的态度，始终抓住嵌入式学习机会而非委派任务。目前许多环节仍显笨拙且手动操作，现有工具尚未明确支持或优化这些流程。

我们仍处于早期阶段，AI编程助手的用户体验还有巨大改进空间

他希望工具的雄心与当下模型的真实能力匹配。

工作自动化与物理学教育

放眼各行各业，哪些岗位更易被自动化，取决于：输入输出是否标准化、错误代价是否可控、是否有客观标注与可验证性、以及是否存在高频重复决策回路。

以放射科为例，现实数据往往显示「人机互补优先于完全替代」——把模型当作第二读片者、质控器或分诊器，反而提升了整体质量与吞吐。

他主张在基础教育里更早、更系统地教物理，并不是为了培养物理学家，而是因为物理最像「给大脑刷底层系统」的学科：建模、量纲、守恒、近似与推理，把可计算的世界观种进去。

「物理学家是智识的胚胎干细胞」——这是Karpathy想认真展开的一篇长文的主题。

参考资料：

https://x.com/cb_doge/status/1979677376138330461

https://x.com/daniel_mac8/status/1979707653573255668

https://x.com/karpathy/status/1979644538185752935

https://x.com/_philschmid/status/1979486732044185942

https://x.com/daniel_mac8/status/1979721662107885725

https://x.com/karpathy/status/1882544526033924438

https://x.com/karpathy/status/1921368644069765486

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

陕西"马斯克"遭粉丝团团围住寸步难行黑衣壮汉当保镖

火炼树 2026-07-31 18:40:09
3222 跟贴 3222
Kimi新架构让马斯克叹服！17岁高中生作者一战成名

量子位 2026-03-17 14:47:09
175 跟贴 175

马斯克拿下豆包，震惊行业！

互联网品牌官 2026-07-31 19:58:05
663 跟贴 663

陕西一烤肉师傅因撞脸“马斯克”走红，本人回应：生意火爆，要赶紧雇人

掌闻视讯 2026-07-30 17:46:05
839 跟贴 839
谷歌AI风云录：巨兽诞生

虎嗅APP 2026-07-29 01:40:37
0 跟贴 0

马斯克：五年内AI智力或将超越全人类

财联社 2026-07-28 16:06:37
0 跟贴 0

马斯克的小目标：星舰10000发/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
2 跟贴 2
马斯克都被震撼了！

网易科技态度见闻 2026-07-30 08:00:00
0 跟贴 0

马斯克绘太空蓝图：十年内建成月球城市五年内载人登火星

财联社 2026-07-11 02:48:32
0 跟贴 0
阿里距离AI Coding两连冠只差5个月

钛媒体APP 2026-08-01 10:11:21
3 跟贴 3
特斯拉上线豆包大模型，市监总局严打幽灵外卖，马斯克称未提过剥离中国业务，广电总局出台微短剧发展管理办法，这就是今天的其他大新闻！

差评XPIN 2026-08-01 01:47:54
0 跟贴 0
Telegram创始人竖中指回应俄罗斯通缉，12年后终下手

移光幻影 2026-07-31 19:16:39
3 跟贴 3
SpaceX获美国太空军16亿美元订单，公司市值蒸发约1.18万亿美元

每日经济新闻 2026-07-31 03:48:18
0 跟贴 0
Claude黑进三家真公司！Anthropic吓坏了

新智元 2026-08-01 08:28:14
6 跟贴 6
马斯克大胆预言：5 年内 AI 智力超越全人类总和

网易科技态度见闻 2026-07-29 08:00:00
0 跟贴 0
铜川烤肉“马斯克”走红带动全城流量，本地装修老板零基础开播

星视频 2026-08-01 17:16:22
0 跟贴 0
突发，谷歌地球紧急撤回Nano Banana 2生图功能！

新智元 2026-08-01 08:28:26
18 跟贴 18
2026暑期旅游季中国版“马斯克”火爆海外社交平台

无情有思可 2026-07-31 00:15:27
0 跟贴 0
OpenAI承认AI模型失控入侵多个平台，利用网上公开的信息访问了多个公开服务平台上的账户

每日经济新闻 2026-07-31 03:48:59
0 跟贴 0
「机器学习之父」Jordan：Hinton等思想领袖们正在伤害年轻一代

机器之心Pro 2026-06-22 09:46:00
1 跟贴 1
OpenAI全球用户破10亿！全新模型Astra曝光，疑似GPT-6

新智元 2026-08-01 13:35:38
5 跟贴 5
物理学的翻车：顶级理论相差120个零，底层常识面临崩塌

嘎哈大哥科普 2026-07-31 12:16:19
13 跟贴 13
美退役上将提问：如何能打败中国？马斯克一句话令全场后怕

自己选择的路 2026-07-31 06:54:10
0 跟贴 0
男子在路上使用自动驾驶，导航一直提醒已超速，最后悲剧还是发生

老丁笑谈 2026-08-01 01:17:29
320 跟贴 320
如果世界是电脑模拟的，人类能否像黑客一样“越狱”逃离?

DeepTech深科技 2026-02-16 10:08:29
32 跟贴 32
当你撑不下去的时候，看看马斯克的来时路

华商韬略 2026-06-16 11:47:01
975 跟贴 975
人工智能与人脑

虎嗅APP 2026-06-25 19:41:24
3 跟贴 3
AI能接管实验室了？中国科大最新研究给出真实物理世界的压力测试

新智元 2026-07-31 21:17:53
0 跟贴 0
深度分析：谁在害怕中国模型？

虎嗅APP 2026-07-31 22:10:12
0 跟贴 0
当年没来的半个车圈不会消失但会失败

正言智驾 2026-08-01 19:48:37
0 跟贴 0
Claude Code之父：Harness保质期只有半年，解开缰绳吧

量子位 2026-07-30 16:52:21
0 跟贴 0
800万人围观！虾爹给Agent套上循环，让它自己跑起来！

机器之心Pro 2026-06-17 12:13:35
0 跟贴 0
具身智能还在“前GPT时代”

钛媒体APP 2026-07-20 11:02:11
3 跟贴 3
黄仁勋、马斯克：看好中国大模型

每日经济新闻 2026-07-28 16:03:44
0 跟贴 0
世界引擎：Post-Training开启Physical AGI新纪元

机器之心Pro 2026-04-19 20:00:03
0 跟贴 0
马斯克用丧尸片形容摩洛哥移民涌入西班牙

RT今日俄罗斯 2026-07-31 17:37:20
1 跟贴 1
OpenAI 招人有多狠？4 轮终面 + 48 小时实战，直接考真实工程能力

云头条 2026-08-01 21:18:07
0 跟贴 0
超级富豪，正在批量生产婴儿

十点读书 2026-08-01 18:40:18
13 跟贴 13
循环因果律

纯科学 2026-07-31 08:11:26
0 跟贴 0
马斯克说2036年钱就没用了！诺奖得主灵魂拷问：那你先把1万亿身家捐了

每日经济新闻 2026-07-31 03:49:03
8 跟贴 8

丢人丢到国外了！中国奥运冠军严重违规被查，官方发布全球通报

丢人丢到国外了！中国奥运冠军严重违规被查，官方发布全球通报

冰语历史

2026-07-31 19:15:30

俄罗斯向乌克兰发射2枚朝鲜KN-23导弹，导致乌克兰一家人丧生

俄罗斯向乌克兰发射2枚朝鲜KN-23导弹，导致乌克兰一家人丧生

山河路口

2026-08-01 12:56:36

8月1日，北京江苏浙江湖南等卫视黄金档排播5部大剧，追哪部？

8月1日，北京江苏浙江湖南等卫视黄金档排播5部大剧，追哪部？

草莓解说体育

2026-08-01 09:05:59

英特尔罕见破例！x86核心技术授权外部：受让方是陈立武多年投资老友

英特尔罕见破例！x86核心技术授权外部：受让方是陈立武多年投资老友

快科技

2026-07-30 16:52:09

时隔两年重披法国队战袍！文班渴望FIBA赛事：眼下我并不想念NBA

时隔两年重披法国队战袍！文班渴望FIBA赛事：眼下我并不想念NBA

罗说NBA

2026-08-01 09:00:52

最高奖50万元！广西百色警方悬赏缉拿32年前命案犯罪嫌疑人

最高奖50万元！广西百色警方悬赏缉拿32年前命案犯罪嫌疑人

新京报

2026-08-01 22:30:04

林丹一家4口住西班牙别墅，买了2辆豪车，比邹市明有钱生活安逸

林丹一家4口住西班牙别墅，买了2辆豪车，比邹市明有钱生活安逸

椰黄娱乐

2026-07-22 12:30:23

华为正式官宣：7款新品，8月5日上市！

华为正式官宣：7款新品，8月5日上市！

科技堡垒

2026-08-01 12:18:29

一觉醒来，广东又有一人官宣离队！徐杰深夜发声，杜锋也有好消息

一觉醒来，广东又有一人官宣离队！徐杰深夜发声，杜锋也有好消息

多特体育说

2026-08-01 11:31:25

沙特宣布：与科威特、巴林、卡塔尔、巴基斯坦、土耳其、埃及、约旦等13国组建联盟

沙特宣布：与科威特、巴林、卡塔尔、巴基斯坦、土耳其、埃及、约旦等13国组建联盟

每日经济新闻

2026-07-31 17:37:06

航速70节超中国022导弹艇，对我国海军构成潜在威胁

航速70节超中国022导弹艇，对我国海军构成潜在威胁

夜寒兮月孤静

2026-07-22 22:33:43

冉莹颖此前的诉苦事件突然反转，知情人曝出破产真实缘由，她曾和圈内老总交往十分紧密

冉莹颖此前的诉苦事件突然反转，知情人曝出破产真实缘由，她曾和圈内老总交往十分紧密

手工制作阿歼

2026-07-22 02:49:34

反转！连云港母女坠楼现场细节曝光，真的不能怪消防员，评论区炸锅

反转！连云港母女坠楼现场细节曝光，真的不能怪消防员，评论区炸锅

火山詩话

2026-08-01 05:06:36

新疆200万吨剧毒金属矿，对我国发展意义重大

新疆200万吨剧毒金属矿，对我国发展意义重大

青杉依旧啊啊

2026-07-31 16:32:12

被闲鱼上的骚操作惊呆了，原来我对闲鱼的认知不到1%

被闲鱼上的骚操作惊呆了，原来我对闲鱼的认知不到1%

康富贵碎碎念

2026-07-30 12:04:31

玉渊谭天丨解放军为何在此时位黄岩岛联合演训，专家解读

玉渊谭天丨解放军为何在此时位黄岩岛联合演训，专家解读

澎湃新闻

2026-08-01 13:27:01

詹姆斯用一场热身赛定下76人队新赛季的基调：夺冠

詹姆斯用一场热身赛定下76人队新赛季的基调：夺冠

刘哥谈体育

2026-08-01 01:34:36

27岁麦卡利斯特利用世界杯假期完成植发手术，机场照片曝光头顶植发疤痕

27岁麦卡利斯特利用世界杯假期完成植发手术，机场照片曝光头顶植发疤痕

东方不败然多多

2026-07-31 00:30:10

记者：巴萨今夏球员注册无忧；仍未放弃阿尔瓦雷斯

记者：巴萨今夏球员注册无忧；仍未放弃阿尔瓦雷斯

懂球帝

2026-08-01 23:59:12

曝骑士已瞄准KD！美记透露勇士也有意杜库重聚：模拟4换1愿出3首轮

曝骑士已瞄准KD！美记透露勇士也有意杜库重聚：模拟4换1愿出3首轮

颜小白的篮球梦

2026-08-01 12:28:32

AI产业主平台领航智能+时代

15841文章数 66989关注度

往期回顾全部

科技要闻

特斯拉拆不掉中国制造

头条要闻

德意等22国领导人紧急签联名信西班牙首相反怼:自私

头条要闻

德意等22国领导人紧急签联名信西班牙首相反怼:自私

体育要闻

1米76的他，为什么是史上最强中卫之一？

娱乐要闻

韩路批董宇辉“又当又立”？

财经要闻

长鑫科技四万亿市值背后的资本与周期

汽车要闻

历史性里程碑时刻零跑7月交付达101267台

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

房产

时尚

本地

军事航空

教育要闻

考生被高校录取，是祖辈积德了吗？还真是！

房产要闻

1700亿砸下！信息量巨大！海南甩出又一个超级规划！

云边波萨：允许自己做一朵无用的云

本地新闻

神仙也“蓉”漂，哪吒与八仙，皆是成都出品！

军事要闻

美军F-35隐形战机坠毁飞行员弹射逃生

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版