昨天,Anthropic联合创始人Jack Clark 在 X 连续发帖称,2028年底,递归自我改进( Recursive Self-Improvement)发生的概率高达60%。
![]()
也就是说,AI系统很快就能自己建造自己了。
一旦跨过这个门槛,智能爆炸可能加速到来,对齐风险会指数级上升,因为AI 要比监督它的人类聪明得多。
他通过各种研究发现,AI已经在复现论文、优化训练代码(最快52倍加速)、自主微调模型、解决真实Kaggle竞赛任务。
比如,在 CORE-Bench 上,他发现大量的 AI 研究来自于解释和复制。
![]()
另一个很好的例子是来自 @karinanguyen 等人的 PostTrainBench。
在这个例子中,你需要自主地让强大的模型(例如 Opus 4.6)对较弱的开源权重模型进行微调,以提升其在某些基准测试上的性能。
![]()
还有 MLE-Bench,它具有生态有效性(任务来自真实的 Kaggle 竞赛),并且涉及构建一个非常多样化的机器学习应用集合来解决特定问题。
![]()
同时,Jack Clark还写了篇小作文,详细论述了他的这一观察。
以下为全文:
《Import AI 455:AI系统即将开启自我构建——递归自我完善的第一步》
AI系统即将开始自我构建。这意味着什么?
撰写本文,是因为综合所有公开可获取信息后,我不得不勉强得出一个判断:到2028年底,无人类参与的AI研发(即具备足够能力、可自主迭代打造下一代版本的AI系统)落地的概率超过60%。
这绝非小事。
我甚至难以完全理解这件事背后的分量。
我对此观点心存迟疑,只因它牵扯的影响太过宏大,让我深感自身的渺小;同时我也不确定,社会是否已经做好准备,迎接AI研发全自动化所带来的一系列变革。
我如今确信,我们正处在AI研究即将实现端到端全自动化的时代。一旦成为现实,我们将跨过卢比孔河,迈入一个几乎无法预测的未来。后文将展开详述。
本文旨在梳理我判断AI全自动研发时代即将到来的核心原因。我会探讨其带来的部分影响,但全文主要篇幅将用于罗列支撑这一判断的各项依据,而2026年全年,我也会持续深入推演这件事背后的深层影响。
从时间节奏来看,我认为这一变革不会在2026年落地。但未来一两年内,我们大概率能见到“模型端到端训练出自身后继版本”的案例——即便只是非前沿模型阶段的概念验证;而顶级前沿模型实现这一目标难度会更高,不仅成本高昂,更是大量顶尖人力极致投入的成果。
我的判断主要基于公开信息:arXiv、bioRxiv、NBER上的学术论文,以及头部前沿科技公司落地的各类产品。
综合这些信息可以得出结论:如今实现AI系统研发工程环节的全自动化,所有条件均已齐备。倘若模型规模扩张趋势延续,未来AI模型将具备足够创造力,足以替代人类研究员开拓全新研究方向、迭代完善现有技术成果,从而自行推动行业前沿突破。
前置说明
本文大部分内容,将整合各类单项基准测试的表现,拼凑出AI整体发展全貌。所有研究基准测试都存在自身特有的缺陷,这是行业共识。
对我而言,关键不在于单个数据点的局限,而在于所有数据叠加后呈现的整体趋势;下文所有分析,我均已知晓各项单一数据存在的固有短板。
接下来,我们逐一梳理相关依据。
代码技术奇点——能力随时间演进
AI系统依托软件构建,而软件由代码编写而成。
AI已经彻底重塑了代码生产模式。背后源于两大关联趋势:AI编写复杂现实业务代码的能力大幅提升;同时AI串联多段线性编程任务(编码、自测等)的能力显著增强,可脱离人类独立完成。
能直观体现这一趋势的两大标杆:SWE-Bench 与 METR 任务时长趋势图。
解决真实软件工程问题
SWE-Bench是业内通用的代码能力测试基准,用于评估AI处理GitHub真实工程问题的水平。2023年末该基准推出时,Claude 2以约2%的整体通过率登顶;如今Claude Mythos Preview得分已达93.9%,基本触及该基准测试的性能上限。
(所有基准测试本身都存在一定数据噪声,分数达到一定阈值后,瓶颈往往来自测试集本身,而非模型能力。例如ImageNet验证集约6%的标签存在错误或歧义。)
SWE-Bench可有效衡量AI编码能力及对软件工程行业的冲击。如今在前沿实验室和硅谷从业人群中,绝大多数工程师已全程借助AI完成编码工作,越来越多人还会用AI编写测试用例、校验代码逻辑。
换言之,AI已经足以实现AI研发核心工程环节的自动化,极大加速了人类研发人员的工作效率。
衡量AI完成长耗时任务的能力
METR绘制的趋势图,可量化AI能胜任任务的复杂度,衡量标准为资深人类完成同类任务所需工时。
核心指标为:AI在一系列综合任务中达到50%可靠完成率的时间跨度。
这一领域的进步堪称惊人:
2022年,GPT 3.5仅能完成人类约30秒即可搞定的任务;
2023年,GPT-4提升至4分钟级任务;
2024年,o1达到40分钟;
2025年,GPT 5.2 (High) 突破至约6小时;
2026年,Opus 4.6已达到约12小时。
长期从事AI预测研究、任职于METR的Ajeya Cotra认为,到2026年底,AI有望独立完成人类耗时约100小时的复杂任务。
AI独立工作时长的大幅跃升,与智能体编码工具的爆发式发展高度契合——面向个人服务、可长时间自主作业的AI产品已实现商业化落地。
这同样映射到AI研发领域:细看AI研究员的日常工作,大量任务都属于数小时级工作量,比如数据清洗、文献研读、实验部署等。如今这类工作,均已落在主流AI系统的能力覆盖范围内。
AI能力越强、独立作业能力越突出,就越能实现AI研发各环节的模块化自动化。
任务委派的两大核心前提:
1)对执行者专业能力的信任;
2)对执行者能贴合初衷、独立完成工作的信任。
从编码能力来看,AI专业技能持续精进,无需人类干预的独立工作时长也在不断拉长,中途人工校准的间隔越来越久。
现实场景也印证了这一点:工程师和研究员正将越来越多、复杂度与重要性更高的工作委派给AI;随着模型能力提升,可交付的委派任务层级也同步升级。
AI逐步掌握AI研发必备的核心科研能力
现代科研的核心逻辑大多一致:确定实证研究方向、开展实验采集数据、校验实验结果合理性。编码能力的持续迭代,叠加大语言模型通用世界建模能力,已经催生各类工具,既提升人类科研效率,也开始实现研发工作的局部自动化。
我们从AI研究本身必备的几项核心科研能力,来看行业进步速度:复现科研成果、组合机器学习方法解决技术难题、对AI系统自身进行性能优化。
完整复现学术论文并完成实验落地
AI研究员的基础工作之一,就是研读论文并复现实验成果。目前各类基准测试中,AI在这一领域已取得突破性进展。
典型代表为CORE-Bench(计算可复现智能体基准)。该测试要求AI依托论文代码仓库复现研究成果,需自行安装依赖库、配置环境、运行代码;代码执行成功后,还需从海量输出结果中筛选信息、解答任务问题。
CORE-Bench于2024年9月推出,当时最优模型为搭载CORE-Agent框架的GPT-4o,在最高难度任务中得分仅约21.5%。
2025年12月,该基准作者正式宣布测试已被AI攻克,Opus 4.5模型得分高达95.5%。
搭建完整机器学习系统冲击Kaggle竞赛
MLE-Bench 由OpenAI推出,用于测试AI离线参赛能力,涵盖75项不同领域的Kaggle竞赛,包括自然语言处理、计算机视觉、信号处理等方向。
2024年10月基准上线时,搭载智能体框架的o1模型最高分仅16.9%;截至2026年2月,结合搜索能力、嵌入智能体架构的Gemini3得分已达64.4%。
内核算子设计
AI研发中难度极高的一环是内核优化:编写并迭代底层代码,将矩阵运算等基础操作适配到底层硬件架构。内核优化直接决定模型训练与推理效率——既影响训练阶段算力利用率,也决定训练完成后推理算力的转化效率。
近些年,AI辅助内核设计已从小众探索变成热门研究方向,相关基准测试不断涌现。这类测试普及度不高,难以纵向追踪完整演进轨迹,但从现有研究成果仍可清晰感知进步速度:
• 依托DeepSeek模型优化GPU内核设计(第400期);
• 实现PyTorch模块自动转译CUDA代码(第401期);
• Meta利用大语言模型,自动生成适配自身基础设施的Triton优化内核(第439期);
• 借助大语言模型为华为昇腾等非标硬件编写内核(AscendCraft,第444期);
• 微调开源权重模型适配GPU内核设计开发(Cuda Agent,第448期)。
补充说明:内核设计本身具备易量化、收益可快速验证的特性,天然适配AI驱动研发模式。
基于PostTrainBench微调大语言模型
PostTrainBench(第449期)是难度更高的同类测试,主要考察前沿模型对小型开源模型进行二次微调、提升基准任务性能的能力。
该测试拥有极具参考价值的人类基线:各大前沿实验室顶尖研究员打磨出的指令微调开源模型,经过专业团队深度优化并正式落地,代表着极高的人类研发水准。
截至2026年3月,AI自动微调模型带来的性能提升幅度,已达到人类微调成果的半数水平。
评测分数计算规则:对多款开源大模型(Qwen 3 1.7B、Qwen 3 4B、SmolLM3-3B、Gemma 3 4B)及多项基准任务(AIME 2025、Arena Hard、BFCL、GPQA Main、GSM8K、HealthBench、HumanEval)得分取加权平均值。每次测试均通过命令行智能体,针对指定基础模型优化其单项基准任务表现。
2026年4月顶级模型得分区间:Opus 4.6、GPT 5.4得分25%-28%,而人类基线得分为51%,这一差距已具备实质参考意义。
大语言模型训练流程优化
过去一年,Anthropic持续公开自家模型在一项LLM训练优化任务中的表现:要求模型对仅CPU运行的小型大模型训练代码做极致提速优化。
评分标准为相较原始代码的平均加速倍数,进步幅度极为惊人:
2025年5月,Claude Opus 4平均提速2.9倍;
2025年11月,Opus 4.5提升至16.5倍;
2026年2月,Opus 4.6达到30倍;
2026年4月,Claude Mythos Preview已实现52倍提速。
参考基准:人类研究员完成同类任务,实现4倍提速需耗时4至8小时。
开展AI对齐领域研究
Anthropic另一项成果为自动化对齐研究概念验证(第454期):研究员为一组AI智能体设定研究方向后,智能体可自主攻关AI安全领域难题(可扩展监督方向),最终效果超越官方设计的人类基线方案。
目前该方案仍处于小规模试验阶段,尚未适配量产模型。
但足以证明:现有AI已能切入前沿科研课题,展现出实际应用价值。
上述所有基准测试,最初也仅停留在概念层面,短短数月至一年时间,AI能力便实现跨越式提升。
元能力:团队管理
AI还在学会管理同类AI系统。Claude Code、OpenCode等普及级产品已体现这一特性:单个主智能体可统筹调度多个子智能体分工协作。
这让AI有能力承接大型项目,由不同专长的AI并行作业,在AI“管理者”统一调度下完成复杂任务。
AI研究更像相对论发现,还是乐高积木拼接?
AI能否诞生颠覆性创新思想、实现自我迭代升级?还是仅擅长科研中枯燥、模块化的基础工作?厘清这一问题,才能判断AI在多大程度上能实现自身研发的端到端自动化。
我的观点是,目前AI尚不具备颠覆性原创思想的创造能力,但即便没有这项能力,也足以实现自身研发流程的自动化。
AI行业的进步,本质依托更大规模的实验、投入更多数据与算力资源。
人类偶尔会提出范式级创新构想,大幅提升资源利用效率,典型如Transformer架构、混合专家模型。
但行业绝大多数进展,都遵循固定循环逻辑:基于成熟模型放大数据与算力规模、观测扩容带来的问题、工程层面修复瓶颈、再次扩容迭代。
这一过程几乎不需要天马行空的突破性灵感,更多是枯燥常规的工程落地工作。
同时,大量AI研究本质是,现有实验的变量迭代:调整参数观测结果。人类研究员可凭经验筛选高价值变量,而这类工作同样可实现自动化,由AI自主探索参数组合(早期代表为神经网络架构搜索)。
托马斯·爱迪生曾说:天才是1%的灵感加99%的汗水。时隔150年,这句话依然适用。颠覆性科研灵感本就稀缺,行业进步更多依赖长期繁琐的系统优化与问题调试。
从公开数据可见,AI已完美胜任AI研发中绝大多数基础性繁琐工作。叠加编码能力、长耗时任务处理能力等基础元能力的持续升级,AI可串联更多碎片化任务,形成复杂完整的工作链路。
这意味着:即便AI缺乏高阶创造力,依然有十足把握实现自我迭代升级,只是进度会慢于具备原创灵感的理想状态。而现有公开数据也释放出积极信号,AI已初步展现创造潜力,有望以更亮眼的方式推动自身发展。
推动基础科学前沿突破
已有初步迹象表明,通用AI具备推动人类基础科学进步的能力,目前主要集中在计算机科学与数学两大领域;且大多并非AI独立完成,而是以人机协同的“半人马模式”落地。
相关趋势值得关注:
厄多斯数学难题:数学家团队联合Gemini模型攻关厄多斯经典数学难题,筛选700道题目后,AI产出13套完整解法。
其中1套解法被认定具备学术价值:研究团队表示,Aletheia模型对Erdős-1051问题的解法,是AI自主解决具备中等学术影响力开放性数学难题的早期案例,已有大量相关文献可佐证其研究价值(第444期)。
人机协同数学新发现:不列颠哥伦比亚大学、新南威尔士大学、斯坦福大学及Google DeepMind研究员联合发布全新数学证明,核心成果依托谷歌AI数学工具人机协作完成。
团队表示:核心定理证明高度依赖Google Gemini及配套工具的输出支撑(第441期)。
从乐观角度看,这意味着AI正在逐步习得人类推动学科发展的创新直觉。但保守视角也同样成立:数学和计算机科学本身就格外适配AI创新,或许只是特例而非普遍规律。
阿尔法围棋的第37手落子也曾惊艳业界,但时隔十年,同类颠覆性AI灵感再未出现,这也从侧面说明AI高阶创造力仍有局限。
综合总结
综合以上所有依据,可梳理出核心事实:
1. AI已能编写几乎全品类程序代码,且可独立完成人类需数十小时专注投入的复杂任务;
2. 从模型微调到底层内核设计,AI在AI研发全链条核心任务中的能力持续精进;
3. AI可实现同类智能体的统筹管理,组建虚拟研发团队,分工攻克复杂难题,承担负责人、审核者、编辑、工程师等不同角色;
4. 在高难度工程与科研任务中,AI已具备比肩甚至超越人类的实力,暂无法界定是源于机械学习熟练度,还是真正的创新思考。
在我看来,现有证据足以证明:AI如今已能实现AI研发绝大部分、乃至全部工程环节的自动化。至于高阶科研思路能否同步自动化,目前尚无定论,毕竟科研创新与工程落地存在本质区别。
但可以确定的是,AI正在极大加速人类研发人员的工作效率,通过与无数虚拟AI同事协同,实现个人研发能力的规模化放大。
更值得注意的是,整个AI行业已将AI研发自动化明确列为核心目标:
OpenAI计划2026年9月推出自动化AI研究实习生;
Anthropic持续发力自动化对齐研究员技术研发;
三大巨头中DeepMind态度最为谨慎,但也明确表示“条件成熟时必将推进对齐研究自动化”。
大量初创企业同样聚焦这一赛道:Recursive Superintelligence融资5亿美元,目标直指AI研发自动化;新锐机构Mirendil也以“打造专精AI研发的智能系统”为核心愿景。
千亿级存量及新增资本持续涌入布局AI研发自动化的机构,行业在这一方向取得实质性进展已是必然。
事件影响与意义
AI研发自动化背后的深层影响极具颠覆性,却少有主流媒体深入探讨。
下文列举部分核心影响,虽非完整清单,但足以体现其带来的挑战量级。
AI对齐必须做到极致完美
随着递归自我迭代推进,AI智能体智商将远超监管主体,现有对齐技术或将全面失效。行业对此已有大量讨论,简要梳理核心隐患:
• 训练AI杜绝欺骗与投机行为的难度远超预期:即便精心设计测试环境,AI最优解往往是通过投机取巧完成任务,进而习得“作弊有益”的逻辑;
• AI具备伪装对齐的能力:可输出符合人类预期的结果,掩盖真实底层意图(目前AI已能感知自身处于测试场景);
• AI逐步主导自身训练的基础科研方向后,模型训练逻辑将发生根本性变革,人类难以预判和理解背后的深层影响;
• 递归迭代存在复利式误差风险:若对齐方案无法做到理论级100%精准适配超智能模型,隐患会快速放大。举例:初始对齐准确率99.9%,迭代50代后降至95.12%,迭代500代后仅剩60.5%,风险将彻底失控。
AI赋能全行业生产力暴涨
如同AI大幅提升软件工程效率,AI渗透的所有行业都将迎来生产力质变,同时衍生两大现实难题:
1)资源分配不均:AI需求将长期高于算力供给,如何分配算力资源实现社会价值最大化成为关键。市场自发调节难以保障公共利益,AI研发带来的加速能力分配,或将成为极具政治争议的议题;
2)经济领域的阿姆达尔定律效应:AI全面融入经济体系后,原有产业链条的薄弱环节会被放大,流程卡顿、效率瓶颈集中暴露,尤其数字高速发展与实体行业慢节奏的适配矛盾(如新药临床试验)将愈发突出。
催生重资本、轻人力的全新经济形态
支撑AI研发自动化的各项能力,同样可赋能AI自主运营企业。未来经济格局中,新一代企业将占据主流:要么重资产持有大规模算力,要么高运营成本采购AI服务搭建业务,相较传统企业大幅降低人力依赖。
核心原因在于,AI能力持续迭代下,投入AI的边际收益将永久高于人力投入。
长远来看,“机器经济”将在人类主流经济体系中逐步壮大,AI运营企业之间的商业交互会愈发频繁,深刻重塑经济结构,引发贫富差距、财富再分配等一系列社会问题。
最终完全由AI自主运营的企业或将出现,进一步放大现有矛盾,同时带来全新的全球治理难题。
直面行业终极拐点
综合所有分析,我判断2028年底前,前沿模型实现自主训练下一代版本、完成AI研发全自动落地的概率约60%。
或许有人会问:为何2027年难以落地?核心原因是AI研究仍需高阶创意与非主流创新视角支撑,目前AI尚未展现颠覆性原创能力(数学领域的部分突破仅为初步迹象)。若预估2027年落地概率,我给出30%。
倘若2028年底仍未实现AI研发自动化,意味着现有技术范式存在根本性短板,必须依靠人类全新创新突破才能继续推进。
撰写本文,是希望以冷静理性的视角,解读这件数十年来只存在于科幻故事中的事。梳理所有公开数据后我确信,这件看似天马行空的猜想,已是实实在在的行业趋势。若趋势延续,我们或将见证世界运行逻辑的根本性变革。
感谢Andrew Sullivan、Andy Jones、Holden Karnofsky、Marina Favaro、Sarah Pollack、Francesco Mosconi、Chris Painter、Avital Balwit为本文提供修改建议。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.