![]()
他山石智库多年积累诸多顶级专家资源,精选推荐国内外人工智能领域重量级专家,2026年3月中旬皮埃罗教授和互联网思想家KK(凯文·凯利)、诺奖得主迈克尔莱维特即将访华,已开放合作邀约。如有出席活动、大会发言、企业探访等需求,请联系他山石智库。
当前AI存在一个根本性缺陷:缺乏人类般的自主学习能力。与儿童能灵活切换学习与行动模式不同,AI部署后学习模式便固定,其自主学习能力实质“外包”给了人类工程师团队,需人工介入数据准备、训练方案构建等环节。
近日,Meta、纽约大学等机构的研究者(含杨立昆)对当前AI范式提出批判,并给出一套受生物认知启发的学习架构,核心是整合两种学习模式与一个元控制系统,破解AI自主学习困境。
![]()
一、AI自主学习的4大结构性困境
研究指出,当前AI难以实现自学习,核心存在4个问题:高质量文本数据供给接近天花板;缺乏与环境真实交互,无法学习超越人类现有知识的内容;过度依赖语言,忽视空间感知、具身认知等;部署后停止自我改进,无法终身学习。
此外,还存在三大技术障碍:学习范式碎片化(各子领域方法缺乏整合)、学习能力外部化(依赖人类MLOps流水线)、缺乏规模化构建方法。
二、核心解决方案:A、B、M三系统架构
![]()
研究团队将学习拆解为两种基本模式,搭配中央元控制系统,实现动态协作,破解自主学习难题:
1. System A(观察学习):对应自监督学习,可处理大规模数据、提取抽象特征,迁移能力强,但依赖人工设计数据,学习成果难对接现实场景。
2. System B(行动学习):对应强化学习与控制理论,适用于实时自适应行为,能从试错中学习,但样本效率低,在高维动作空间表现欠佳。
两者双向支撑:System A为System B压缩状态表征、构建世界模型、提供内在奖励;System B为System A筛选有效数据、提供现实行为锚点。
3. System M(元控制):作为中央调度器,监控内部认知信号,动态调度A、B系统的协作,还能实现交流学习、想象学习等高阶模式,替代人工完成学习与数据过滤流程。
![]()
三、冷启动破解与实施难点
针对A、B、M三系统相互依赖的冷启动难题,研究团队借鉴生物进化与发育机制,提出双层优化框架:内层(发育尺度)中,A、B系统在M系统调控下更新参数;外层(进化尺度)优化系统初始元参数,仅需人工设计适应度函数与训练环境。
即便蓝图成型,实现仍面临多重障碍:模拟环境需兼顾真实与高效、缺乏适配通用Agent的评估体系、双层优化的可扩展性不足,以及自主性带来的伦理风险(如目标偏移、用户信任错位等)。
四、未来展望
目前,A、B系统的整合已在受限领域(如游戏、机器人运动)取得突破,但仍需人工固定学习方案。研究团队表示,距离完全自主的广域学习系统,可能还需数十年时间。
值得注意的是,自主学习并非AI的加分项,而是其在真实世界可靠运行的必要前提;同时,构建这类系统也能推动AI与认知科学的深度融合,为理解生物学习机制提供定量模型。
大会发言/企业内训/代言背书 欢迎联系
他山石智库 2015 年来商业合作数百位诺贝尔奖得主、图灵奖得主、两院院士、藤校牛剑院长教授、世界500强领导者、联合国高层及 openai 创始人等人工智能科学家、经济学家、企业家及《未来简史》作者赫拉利;世界首富马斯克母亲梅耶·马斯克等。为北京、上海、杭州、广州、深圳政府举办的国际化论坛、峰会提供演讲嘉宾;为阿里、腾讯、字节、百度等公司大会提供演讲嘉宾,并运营诺贝尔奖专家领衔的品牌代言背书和海外传播。他山石智库还桥等名校留学。创始团队来自国务院发展研究中心、财新、清华、麻省理工。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.