François Chollet最近出现在Y Combinator的播客里。这位Keras之父、ARC Prize创始人,现在正经营着一个叫NDI的实验室。他和主持人Garry Tan聊了两件事:AGI到底什么时候来,以及为什么他认为大语言模型这条路走不到终点。
Chollet给出了一个具体时间点:2030年左右。但他话锋一转,说现在的重点不是争论时间表,而是想清楚怎么"驾驭这股浪潮"。因为无论你怎么看,AI的发展势头已经挡不住了。
![]()
真正值得注意的,是他对NDI实验室的定位。这不是又一个做大模型的团队。Chollet说得直白:他们要做的是"与深度学习截然不同的基础架构",目标是直接跳到"最优解",而不是在现有技术栈上修修补补。他承认成功率可能只有10%到15%,但因为没人做、且意义重大,值得赌一把。
![]()
NDI的核心方向叫"符号程序合成"。别误会,这不是帮你写代码的Copilot。Chollet解释得很清楚:他们做的是底层工作,试图用"尽可能小的符号模型"替代神经网络里那些庞大的参数曲线。既然符号模型没法用梯度下降优化,他们就发明了一套新方法,叫"符号下降法"——相当于在符号空间里重建梯度下降的等价物。
为什么非要这么做?Chollet回溯到2016年他在Google Brain的经历。当时他想用深度学习做逻辑推理和定理证明,结果发现卡住的地方不是模型"表达能力"不够,而是梯度下降这个算法本身。它找不到能泛化的、具有"推理风格"的程序,只会陷入对训练数据的模式匹配和过拟合。
他承认GPT-4这类模型的进步令人惊讶,但指出了关键边界:在数学、代码这些"可形式化验证"的领域,模型能通过强化学习自我改进,因为环境能提供明确的奖励信号。但一旦进入法律文书这类无法自动验证的领域,进展就慢得多,模型只能依赖昂贵的人工标注数据。
这正是ARC基准系列的由来。Chollet在2017到2018年间想造一个"推理领域的ImageNet",核心思想是衡量"智能作为一种规模化获取技能效率的手段"。
2019年发布的ARC V1测试"流体推理":系统要根据输入输出网格推断底层规则。在2024年底o1这类推理模型出现前,即使模型规模扩大数万倍,基础语言模型的表现也接近零。o1带来的阶跃式提升,第一次证明了"推理"作为一种新能力的出现。
2025年,ARC V2被迅速攻破。基于代码的智能体通过"目标化训练"范式——生成类似任务、尝试解决、验证、根据成功路径微调、循环——让V2迅速饱和。Chollet认为这揭示了一个关键洞察:进步不在于模型本身"更聪明",而在于新的、可自动化的训练后范式。这也说明,当前很多成果依赖人类设计的"框架",离真正的AGI还很远,因为AGI应该能自主创建框架。
![]()
现在发布的ARC V3完成了从"建模"到"智能体"的跃迁。系统被扔进一个全新的交互式环境,没有指令、没有目标,必须通过试错自主探索、理解环境、发现目标、制定计划。关键指标是效率:几百到几千个行动步骤内解决,和人类首次接触时的水平相当。
V3的游戏库超过250个,由内部工作室专门开发,避免借用现有游戏的文化符号,只基于核心物理和主体性等"先天知识",防止通过记忆或针对性训练作弊。Chollet特意对比了DeepMind的Atari研究和OpenAI的Dota研究:那些是在相同环境里训练和测试,本质是记忆最佳策略;V3要求在首次遇到的游戏中评估,每一步探索都计入效率得分,真正测试"流体智力"。
他透露ARC V4将侧重"持续性学习"和更长尺度的课程学习,V5围绕"创新"展开。整个系列的终极目标是不断缩小前沿AI与人类学习效率之间的"可衡量差距",当差距消失时,就是AGI到来的时刻。
关于AGI的最终形态,Chollet的预测很具体:一个极小的"流体智能引擎"——可能只有几兆字节代码,甚至不到1万行——加上一个庞大的可扩展知识库。他认为这个核心引擎的原理可能几十年前就潜藏着,只是没被发现。
实现AGI的关键,是把人类从"改进循环"里尽可能剔除,让系统能自我改进且速度自我加速。当前LLM技术栈的优势正是能通过增加数据和计算扩展知识库,减少人工干预。但Chollet显然认为这还不够。
他把NDI的"符号程序合成"比作"科学的算法化":从大量观测数据中压缩出最简洁的符号规则。人类思维在高层次上也做着类似的因果建模和程序合成,只是人脑的低层实现是神经网络式的。NDI想做的,是找到那个更纯粹、更最优的上层结构。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.