诺奖、名人邀约｜AI仍无法自主学习？「请诺奖院士就找他山石」|自主性|人工智能|埃隆_马斯克

诺奖、名人邀约｜AI仍无法自主学习？「请诺奖院士就找他山石」

分享至

他山石智库多年积累诸多顶级专家资源，精选推荐国内外人工智能领域重量级专家，2026年3月中旬皮埃罗教授和互联网思想家KK（凯文·凯利）、诺奖得主迈克尔莱维特即将访华，已开放合作邀约。如有出席活动、大会发言、企业探访等需求，请联系他山石智库。

当前AI存在一个根本性缺陷：缺乏人类般的自主学习能力。与儿童能灵活切换学习与行动模式不同，AI部署后学习模式便固定，其自主学习能力实质“外包”给了人类工程师团队，需人工介入数据准备、训练方案构建等环节。

近日，Meta、纽约大学等机构的研究者（含杨立昆）对当前AI范式提出批判，并给出一套受生物认知启发的学习架构，核心是整合两种学习模式与一个元控制系统，破解AI自主学习困境。

‍ 一、AI自主学习的4大结构性困境

研究指出，当前AI难以实现自学习，核心存在4个问题：高质量文本数据供给接近天花板；缺乏与环境真实交互，无法学习超越人类现有知识的内容；过度依赖语言，忽视空间感知、具身认知等；部署后停止自我改进，无法终身学习。

此外，还存在三大技术障碍：学习范式碎片化（各子领域方法缺乏整合）、学习能力外部化（依赖人类MLOps流水线）、缺乏规模化构建方法。

二、核心解决方案：A、B、M三系统架构

研究团队将学习拆解为两种基本模式，搭配中央元控制系统，实现动态协作，破解自主学习难题：

1. System A（观察学习）：对应自监督学习，可处理大规模数据、提取抽象特征，迁移能力强，但依赖人工设计数据，学习成果难对接现实场景。

2. System B（行动学习）：对应强化学习与控制理论，适用于实时自适应行为，能从试错中学习，但样本效率低，在高维动作空间表现欠佳。

两者双向支撑：System A为System B压缩状态表征、构建世界模型、提供内在奖励；System B为System A筛选有效数据、提供现实行为锚点。

3. System M（元控制）：作为中央调度器，监控内部认知信号，动态调度A、B系统的协作，还能实现交流学习、想象学习等高阶模式，替代人工完成学习与数据过滤流程。

三、冷启动破解与实施难点

针对A、B、M三系统相互依赖的冷启动难题，研究团队借鉴生物进化与发育机制，提出双层优化框架：内层（发育尺度）中，A、B系统在M系统调控下更新参数；外层（进化尺度）优化系统初始元参数，仅需人工设计适应度函数与训练环境。

即便蓝图成型，实现仍面临多重障碍：模拟环境需兼顾真实与高效、缺乏适配通用Agent的评估体系、双层优化的可扩展性不足，以及自主性带来的伦理风险（如目标偏移、用户信任错位等）。

四、未来展望

目前，A、B系统的整合已在受限领域（如游戏、机器人运动）取得突破，但仍需人工固定学习方案。研究团队表示，距离完全自主的广域学习系统，可能还需数十年时间。

值得注意的是，自主学习并非AI的加分项，而是其在真实世界可靠运行的必要前提；同时，构建这类系统也能推动AI与认知科学的深度融合，为理解生物学习机制提供定量模型。

大会发言／企业内训／代言背书欢迎联系
他山石智库 2015 年来商业合作数百位诺贝尔奖得主、图灵奖得主、两院院士、藤校牛剑院长教授、世界500强领导者、联合国高层及 openai 创始人等人工智能科学家、经济学家、企业家及《未来简史》作者赫拉利；世界首富马斯克母亲梅耶·马斯克等。为北京、上海、杭州、广州、深圳政府举办的国际化论坛、峰会提供演讲嘉宾；为阿里、腾讯、字节、百度等公司大会提供演讲嘉宾，并运营诺贝尔奖专家领衔的品牌代言背书和海外传播。他山石智库还桥等名校留学。创始团队来自国务院发展研究中心、财新、清华、麻省理工。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.