近日,图灵奖得主、强化学习领域主要奠基人理查德·萨顿教授与石景山企业他山科技在加拿大签约,双方将合作建设“机器人幼儿园”,计划落地在北京石景山首钢园。
何为“机器人幼儿园”?他山科技相关负责人介绍,可以理解为一种新型的机器人训练场,在这里,机器人不再跟着人类进行模仿,而是在放置各类真实物品的环境中自主探索、感知结果,并根据反馈调整行为,完成从身体自我认知到运用工具完成复杂任务的迭代进化。
这背后,是区别于大语言模型的另一条独立技术路径,即强化学习,其核心逻辑是让智能体通过与环境互动积累经验、从错误中学习,而非依赖海量标注数据进行模仿。2024年图灵奖获得者萨顿教授,正是这一领域公认的奠基人。
在萨顿看来,大语言模型聚焦于语言模仿与安全对齐,其能力上限受限于人类现有知识。他提出,未来人工智能范式的根本转折在于从“人类数据时代”跨入“经验时代”,智能体不再消费人类生产的数据,而是通过与环境的直接交互产生自身经验,并持续进化。
此次联手萨顿教授,双方将紧密围绕产线巡检、精密装配、柔性物流等真实产业场景,联合上下游企业将研究成果在真实或高保真仿真环境中快速测试与迭代,最终的成果通过开源、方案输出等方式向行业推广。(孙云柯)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.