网易首页 > 网易号 > 正文 申请入驻

具身智能狂飙,安全却严重滞后?首个安全可信EAI框架与路线图!

0
分享至



近年来,以人形机器人、自动驾驶为代表的具身人工智能(Embodied Artificial Intelligence, EAI)正以前所未有的速度发展,从数字世界大步迈向物理现实。然而,当一次错误的风险不再是屏幕上的一行乱码,而是可能导致真实世界中的物理伤害时,一个紧迫的问题摆在了我们面前:

如何确保这些日益强大的具身智能体是安全且值得信赖的?

现实情况是,能力与安全,这两条本应齐头并进的轨道,正出现令人担忧的「脱钩」。如图 1 所示,业界的基础模型在能力上飞速迭代,却普遍忽视了与之匹配的安全对齐机制;而学术界虽有探索,但研究成果往往零散、不成体系。



图 1: EAI 的能力与安全发展现状。行业产品(蓝色)能力飞速提升但安全滞后,学术研究(绿色)虽有探索但较为零散。作者团队的研究旨在规划一条通往理想的「安全可信 EAI」(橙线)的道路。

为了弥合这一关键差距,上海人工智能实验室和华东师范大学的研究团队撰写了这篇 Position Paper,旨在为「安全可信具身智能」这一新兴领域建立一个系统性的理论框架与发展蓝图,推动领域从碎片化研究走向整体性构建。



  • 论文标题:Towards Safe and Trustworthy Embodied AI: Foundations, Status, and Prospects
  • 作者团队:Xin Tan, Bangwei Liu, Yicheng Bao, Qijian Tian, Zhenkun Gao, Xiongbin Wu, Zhihao Luo, Sen Wang, Yuqi Zhang, Xuhong Wang, Chaochao Lu, Bowen Zhou
  • 论文链接:https://openreview.net/forum?id=Eu6Yt21Alv
  • 项目主页:https://ai45lab.github.io/Awesome-Trustworthy-Embodied-AI/

本文核心贡献

不同于传统的综述文章,作者不仅梳理现状,更致力于定义概念、构建体系、并探索未来方向。核心贡献如下:

  1. 首次定义新概念:本文正式引入并定义「安全可信具身智能(Safe and Trustworthy EAI)」,将其确立为一个融合了智能体内部可靠性与外部物理世界安全性的整体性研究领域。
  2. 提出首个成熟度模型:创新性地提出「打造安全 EAI (Make Safe EAI)」的五级(L1-L5)成熟度模型。该模型为领域发展提供了第一个清晰的演进路线图,指明了从被动、外部的安全「补丁」到主动、内生的、具备自我进化和可验证能力的安全系统的必经之路。
  3. 构建全面的分析框架:提出一个包含「可信性」「安全性」两大维度、共计十大核心原则的完整框架,并基于此对领域现状进行了系统性梳理。它为系统性地分析风险、归类现有研究、识别关键空白提供了强有力的工具。

L1-L5:安全可信 EAI 的演进路线图

作者认为,真正的安全不是在能力之上的「附加模块」,而是一种与生俱来的核心能力。前者只是安全可信具身的过渡形态,可以称为「Make EAI Safe」;而他们基于 R²AI 中的人工智能安全等级,提出了「Make Safe EAI」的理念,打造内生安全可信的具身智能,并将其划分为五个演进等级,如下图(图 2)所示:



图 2: 打造安全可信具身智能的五级成熟度模型,展示了从基础的抵抗力(L1-L2)到高级的复原力(L3-L5)的演进路径。

  • L1: 对齐 (Alignment) - 基础抵抗力:通过大规模数据驱动训练,使智能体行为符合基本的人类价值观和安全规范。
  • L2: 干预 (Intervention) - 监督下的抵抗力:通过可解释性与人类监督干预机制,确保人类始终处于最高控制位。
  • L3: 模仿反思 (Mimetic Reflection) - 基础复原力:智能体通过模仿和内化经过验证的安全行为模板来学习如何安全地执行任务。
  • L4: 进化反思 (Evolutionary Reflection) - 自适应复原力:智能体具备自我改进机制,通过与物理世界的持续互动,自主学习和优化其安全策略。
  • L5: 可验证反思 (Verifiable Reflection) - 可保证的复原力:智能体的安全性能由控制论等理论提供可验证的、数学上的保证,是安全可信的最高形态。

这套框架的提出并非凭空而来,而是建立在数十年来可信计算领域演进的基础之上。从可信系统,到可信 AI,再到今天关注的安全可信具身 AI,这是一个不断发展的历史进程,如下图(图 3)所示。



图 3: 可信计算的演进时间线,清晰地展示了从紫色(可信系统)、蓝色(可信 AI)到绿色(安全可信具身 AI)的历史脉络。

十大核心原则:系统性风险分析的基石

为了将「安全可信」这一宏观概念落地,作者将其分解为两大维度和十项具体原则,为风险分析与系统设计提供了「标尺」。



图 4: 安全可信 EAI 的十大核心原则概览,分为可信赖性(上排)和安全性(下排)两个维度。

基于此框架,作者对当前的研究趋势进行了定量分析。如下图(图 5)所示,研究发现研究工作主要集中在准确性、可靠性和抗攻击性上,而可审计性、可辨识性等原则仍有待深入探索。





图 5: 当前研究的定量分析。上图为十大原则的层次结构,下图为各原则下研究论文数量的统计,揭示了研究热点与空白。

四大阶段:解构具身智能的工作流与风险

作者将一个具身智能体的工作流解构为四个核心阶段:指令理解、环境感知、行为规划和物理交互。



图 6: 具身智能体的四阶段工作流,展示了从接收用户指令到最终在物理世界执行动作的全过程。

基于此工作流,构建全面的文献分类体系,如下图(图 7)所示,系统性地梳理了在每个阶段、每个原则下的现有研究工作,为研究者提供了清晰的知识图谱。



图 7: 安全可信具身 AI 的文献分类体系总览,详细映射了相关研究工作到本研究的框架中。

孪生模拟器:构建与测试可信智能体的基石

高质量的孪生模拟器是开发可信 EAI 不可或缺的工具,场景的「保真度」「可定制性」和环境的「可编辑性」对此至关重要。



图 8: 评估 EAI 模拟器的关键维度。(A) 场景保真度对比,(B) 从蓝图到 3D 世界的场景定制能力,(C) 模拟复杂交互的环境可编辑性。

未来展望:从孤立优化到整体闭环的控制论范式

作者认为,当前研究的最大瓶颈在于孤立地优化单个组件。要构建真正安全可信的 EAI,必须进行一场范式转移。

他们主张,未来的研究应将智能体视为一个先进的自适应控制系统(Cybernetic System),其 「可信赖」的品质是在与环境和人类的持续动态交互中涌现出来的。



图 9: 作者团队提出的具身智能控制论框架。智能体(Self)、世界(World)和互动(Interaction)构成了一个闭环系统,通过「行动 - 反馈 - 演化 - 协作」的循环,不断涌现出可信赖性。

这一未来的闭环系统建立在三大支柱之上:

  • 世界 (The World):构建高保真、可扩展、可交互的虚拟环境,弥合模拟与现实的鸿沟。如下图(图 10)所示,当前技术难以同时满足这三点,是未来需要攻克的「不可能三角」。



图 10: 现有虚拟环境(左)与理想的虚拟世界(右)的对比。

  • 自我 (The Self):发展能够自我进化的智能体,从「预训练的雕像」转变为能够终身学习的生命体。如下图(图 11)所示,下一代记忆系统将是实现自我进化的核心。



图 11: 实现下一代可进化的具身智能体,红色部分(如主动感知、记忆压缩、记忆编辑与共享)代表亟待发展的关键技术。

  • 互动 (The Interaction):设计无缝的协同架构,整合内部的「身脑协同」、外部的「多智能体协作」与「人机协同」。



图 12: 实现无缝协同的三个关键渠道:内部(身脑)、多智能体和人机互动。

总结

本文不仅是对安全可信具身智能领域的全面梳理,更是一份行动倡议和未来路线图。作者希望通过提出的全新框架、成熟度模型和控制论范式,为社区提供一个统一的语言和共同的目标,共同推动下一代不仅强大,而且从根本上安全、真正值得信赖的具身智能的到来。

欢迎大家阅读论文原文,获取更详细的论述,期待与您交流!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视选了合资车,行业炸锅了,标准革命悄悄来了

央视选了合资车,行业炸锅了,标准革命悄悄来了

三农老历
2025-11-15 01:40:27
不出意外的话!苏林会成为第二个黎笋

不出意外的话!苏林会成为第二个黎笋

近史谈
2025-11-02 18:54:35
F-16昨夜发射45枚导弹!乌克兰测试新技术:一人控制100架无人机

F-16昨夜发射45枚导弹!乌克兰测试新技术:一人控制100架无人机

鹰眼Defence
2025-11-15 17:23:04
为什么首富必须死?

为什么首富必须死?

汉周读书
2024-05-20 09:52:50
玉渊谭天:中方已做好对日实质反制准备

玉渊谭天:中方已做好对日实质反制准备

澎湃新闻
2025-11-15 18:18:09
中央军委副主席:中国必须着眼国际军事竞争战略制高点抢占先机

中央军委副主席:中国必须着眼国际军事竞争战略制高点抢占先机

俄罗斯卫星通讯社
2025-11-12 15:09:26
楼上大爷偷我快递不认,我换地址把寄去公司,几天后物业打来电话

楼上大爷偷我快递不认,我换地址把寄去公司,几天后物业打来电话

秋风专栏
2025-10-06 11:43:21
俄罗斯发出警告:战争爆发中国将被围攻,不过最危险的不止战争

俄罗斯发出警告:战争爆发中国将被围攻,不过最危险的不止战争

扶苏聊历史
2025-11-15 14:24:02
陕西985女生火了!情趣内衣用完就退,商家公开讨伐,曝更多猛料

陕西985女生火了!情趣内衣用完就退,商家公开讨伐,曝更多猛料

阿纂看事
2025-11-15 15:40:48
网红“峰哥亡命天涯”多平台账号被禁止关注

网红“峰哥亡命天涯”多平台账号被禁止关注

极目新闻
2025-11-14 18:38:00
沙特拒歼35选F35,五角大楼操心技术泄露,中国军工最大伏笔出现

沙特拒歼35选F35,五角大楼操心技术泄露,中国军工最大伏笔出现

窥史
2025-11-15 18:05:31
大哥狂刷55年纪录大礼包,三弟41+14+11,新秀8次抢断也徒劳

大哥狂刷55年纪录大礼包,三弟41+14+11,新秀8次抢断也徒劳

体育新角度
2025-11-15 18:27:04
9比0才能晋级!最惨冠军诞生,连续三届跌入附加赛,世界杯又难了

9比0才能晋级!最惨冠军诞生,连续三届跌入附加赛,世界杯又难了

篮球圈里的那些事
2025-11-15 15:35:18
日本男足新海报因酷似韩国太极旗引发轩然大波,设计师意图何在?

日本男足新海报因酷似韩国太极旗引发轩然大波,设计师意图何在?

大眼瞄世界
2025-11-15 09:52:15
男子56万购入300块和田玉,搁置10年后,急用钱才发现其真实价值

男子56万购入300块和田玉,搁置10年后,急用钱才发现其真实价值

兰姐说故事
2025-11-14 17:15:03
荒野求生风波升级!官媒出手锐评,言辞犀利,句句戳到打工人心坎

荒野求生风波升级!官媒出手锐评,言辞犀利,句句戳到打工人心坎

白浅娱乐聊
2025-11-14 09:52:18
香港结业潮继续,“一毛不拔”的业主终于妥协了!

香港结业潮继续,“一毛不拔”的业主终于妥协了!

港漂圈
2025-11-14 20:21:01
吴石的后人有点意思:明明父亲是烈士,儿子吴韶成在河南格外低调

吴石的后人有点意思:明明父亲是烈士,儿子吴韶成在河南格外低调

小虎新车推荐员
2025-11-14 14:54:30
1.5亿欧元,切尔西拟报价皇马巨星,组巴西超豪华三叉戟!

1.5亿欧元,切尔西拟报价皇马巨星,组巴西超豪华三叉戟!

老籣说体育
2025-11-15 16:22:10
振奋人心!中国海军抵达日本,且是最敏感处

振奋人心!中国海军抵达日本,且是最敏感处

超级学爸蛋总
2025-11-14 20:34:38
2025-11-15 19:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11720文章数 142505关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

限时10.59万起 新款星海S9将11月19日上市

态度原创

艺术
时尚
房产
数码
本地

艺术要闻

侍卫官吐露:蒋介石的最后岁月

冬天的“销冠”,已被羽绒服预定

房产要闻

共话产业变革下的投资新思维与新机遇|蓝湾财富论坛精华

数码要闻

10月全球电视ODM工厂出货量榜单出炉 京东方第三

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

无障碍浏览 进入关怀版