网易首页 > 网易号 > 正文 申请入驻

ARC创始人:2030年AGI?但LLM不是答案

0
分享至

François Chollet最近出现在Y Combinator的播客里。这位Keras之父、ARC Prize创始人,现在正经营着一个叫NDI的实验室。他和主持人Garry Tan聊了两件事:AGI到底什么时候来,以及为什么他认为大语言模型这条路走不到终点。

Chollet给出了一个具体时间点:2030年左右。但他话锋一转,说现在的重点不是争论时间表,而是想清楚怎么"驾驭这股浪潮"。因为无论你怎么看,AI的发展势头已经挡不住了。


真正值得注意的,是他对NDI实验室的定位。这不是又一个做大模型的团队。Chollet说得直白:他们要做的是"与深度学习截然不同的基础架构",目标是直接跳到"最优解",而不是在现有技术栈上修修补补。他承认成功率可能只有10%到15%,但因为没人做、且意义重大,值得赌一把。


NDI的核心方向叫"符号程序合成"。别误会,这不是帮你写代码的Copilot。Chollet解释得很清楚:他们做的是底层工作,试图用"尽可能小的符号模型"替代神经网络里那些庞大的参数曲线。既然符号模型没法用梯度下降优化,他们就发明了一套新方法,叫"符号下降法"——相当于在符号空间里重建梯度下降的等价物。

为什么非要这么做?Chollet回溯到2016年他在Google Brain的经历。当时他想用深度学习做逻辑推理和定理证明,结果发现卡住的地方不是模型"表达能力"不够,而是梯度下降这个算法本身。它找不到能泛化的、具有"推理风格"的程序,只会陷入对训练数据的模式匹配和过拟合。

他承认GPT-4这类模型的进步令人惊讶,但指出了关键边界:在数学、代码这些"可形式化验证"的领域,模型能通过强化学习自我改进,因为环境能提供明确的奖励信号。但一旦进入法律文书这类无法自动验证的领域,进展就慢得多,模型只能依赖昂贵的人工标注数据。

这正是ARC基准系列的由来。Chollet在2017到2018年间想造一个"推理领域的ImageNet",核心思想是衡量"智能作为一种规模化获取技能效率的手段"。

2019年发布的ARC V1测试"流体推理":系统要根据输入输出网格推断底层规则。在2024年底o1这类推理模型出现前,即使模型规模扩大数万倍,基础语言模型的表现也接近零。o1带来的阶跃式提升,第一次证明了"推理"作为一种新能力的出现。

2025年,ARC V2被迅速攻破。基于代码的智能体通过"目标化训练"范式——生成类似任务、尝试解决、验证、根据成功路径微调、循环——让V2迅速饱和。Chollet认为这揭示了一个关键洞察:进步不在于模型本身"更聪明",而在于新的、可自动化的训练后范式。这也说明,当前很多成果依赖人类设计的"框架",离真正的AGI还很远,因为AGI应该能自主创建框架。


现在发布的ARC V3完成了从"建模"到"智能体"的跃迁。系统被扔进一个全新的交互式环境,没有指令、没有目标,必须通过试错自主探索、理解环境、发现目标、制定计划。关键指标是效率:几百到几千个行动步骤内解决,和人类首次接触时的水平相当。

V3的游戏库超过250个,由内部工作室专门开发,避免借用现有游戏的文化符号,只基于核心物理和主体性等"先天知识",防止通过记忆或针对性训练作弊。Chollet特意对比了DeepMind的Atari研究和OpenAI的Dota研究:那些是在相同环境里训练和测试,本质是记忆最佳策略;V3要求在首次遇到的游戏中评估,每一步探索都计入效率得分,真正测试"流体智力"。

他透露ARC V4将侧重"持续性学习"和更长尺度的课程学习,V5围绕"创新"展开。整个系列的终极目标是不断缩小前沿AI与人类学习效率之间的"可衡量差距",当差距消失时,就是AGI到来的时刻。

关于AGI的最终形态,Chollet的预测很具体:一个极小的"流体智能引擎"——可能只有几兆字节代码,甚至不到1万行——加上一个庞大的可扩展知识库。他认为这个核心引擎的原理可能几十年前就潜藏着,只是没被发现。

实现AGI的关键,是把人类从"改进循环"里尽可能剔除,让系统能自我改进且速度自我加速。当前LLM技术栈的优势正是能通过增加数据和计算扩展知识库,减少人工干预。但Chollet显然认为这还不够。

他把NDI的"符号程序合成"比作"科学的算法化":从大量观测数据中压缩出最简洁的符号规则。人类思维在高层次上也做着类似的因果建模和程序合成,只是人脑的低层实现是神经网络式的。NDI想做的,是找到那个更纯粹、更最优的上层结构。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视曝光4种“致癌日用品”,家里千万别囤!很多人还被蒙在鼓里

央视曝光4种“致癌日用品”,家里千万别囤!很多人还被蒙在鼓里

39健康网
2026-05-27 10:32:46
还记得8年前诬告朱军“性骚扰”的弦子吗?近况曝光,全网叫好

还记得8年前诬告朱军“性骚扰”的弦子吗?近况曝光,全网叫好

叨唠
2026-05-27 21:09:09
果园带货主播“开空调”翻车:无实物表演式带货,就是赤裸裸的欺诈 丨中听

果园带货主播“开空调”翻车:无实物表演式带货,就是赤裸裸的欺诈 丨中听

大象新闻
2026-05-27 08:48:45
毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

中吴网
2026-05-25 22:42:39
大瓜!广发百亿基金经理遭实名举报,网友:张雪峰的话含金量上升

大瓜!广发百亿基金经理遭实名举报,网友:张雪峰的话含金量上升

火山詩话
2026-05-27 14:48:31
教育部门回应“学生顶烈日,后方两人撑伞”:男子系退休返聘教师,双方非父女关系

教育部门回应“学生顶烈日,后方两人撑伞”:男子系退休返聘教师,双方非父女关系

红星新闻
2026-05-27 18:42:22
东南大学青年首席教授,出任985高校院长

东南大学青年首席教授,出任985高校院长

超级数学建模
2026-05-27 22:45:07
1.2亿欧!巴萨终于敲定新巨星,夏窗有钱操作,莱万接班人来了

1.2亿欧!巴萨终于敲定新巨星,夏窗有钱操作,莱万接班人来了

祥谈体育
2026-05-27 20:53:42
市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

小陆搞笑日常
2026-05-28 00:00:18
64.98万!最贵问界来了,余承东:地球最强SUV

64.98万!最贵问界来了,余承东:地球最强SUV

车东西
2026-05-27 18:10:50
这和不穿有啥区别?徐璐真空上阵,身材火辣,抢了所有女星风头!

这和不穿有啥区别?徐璐真空上阵,身材火辣,抢了所有女星风头!

川渝视觉
2026-05-27 22:29:45
瞒不住了!刘诗诗吴奇隆离婚实锤,年龄差不是根,这3件事致命伤

瞒不住了!刘诗诗吴奇隆离婚实锤,年龄差不是根,这3件事致命伤

落雪听梅a
2026-05-27 09:08:14
畸形审美?这4位男演员长相平平,却总当主角演帅哥,实在不理解

畸形审美?这4位男演员长相平平,却总当主角演帅哥,实在不理解

仙味少女心
2026-05-27 13:17:17
足协罕见表态!甘树然遭炮轰:中超裁判泥石流,回去吹城市联赛吧

足协罕见表态!甘树然遭炮轰:中超裁判泥石流,回去吹城市联赛吧

奥拜尔
2026-05-27 21:20:33
发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

青春期父母成长学堂
2026-05-27 06:41:39
同济大学、中山大学等多所高校学者被举报涉嫌学术不端,有人被免职;科研人员:有些“大咖”太忙,甚至不清楚手下在做什么

同济大学、中山大学等多所高校学者被举报涉嫌学术不端,有人被免职;科研人员:有些“大咖”太忙,甚至不清楚手下在做什么

每日经济新闻
2026-05-26 21:49:15
广东用电负荷创历史新高 突破1.65亿千瓦

广东用电负荷创历史新高 突破1.65亿千瓦

财联社
2026-05-27 21:52:10
航天员黎家盈回来后还会回香港吗?还是留在北京工作?

航天员黎家盈回来后还会回香港吗?还是留在北京工作?

林子说事
2026-05-27 14:51:25
科学家挖出2000年前种子,尝试种植后,竟长出灭绝1500多年的植物

科学家挖出2000年前种子,尝试种植后,竟长出灭绝1500多年的植物

春风秋雨
2026-05-27 19:25:06
“天生恶人”王厚军,从成年到38岁被击毙,只在监狱外生活了5年

“天生恶人”王厚军,从成年到38岁被击毙,只在监狱外生活了5年

年代回忆
2026-05-27 20:37:37
2026-05-28 07:36:49
报错免疫体
报错免疫体
一名在需求评审和数据异常中反复横跳的产品运营。
4051文章数 32关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

头条要闻

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

教育
时尚
健康
艺术
本地

教育要闻

数轴动点第1讲,一个视频学会!

这几件单品太火了,今年流行的风格都离不开它

打外泌体会比干细胞更安全吗

艺术要闻

蚂蚁新总部封顶了!大圆环到底有啥魔力,科技公司都抢着用?

本地新闻

用剪纸的方式,打开江苏扬州

无障碍浏览 进入关怀版