网易首页 > 网易号 > 正文 申请入驻

首篇具身智能机器人「安全」综述:LLM如何跨越物理鸿沟?

0
分享至


新智元报道

编辑:LRST

【新智元导读】最新综述首次系统探讨LLM控制机器人的安全威胁、防御机制与未来挑战,指出LLM的具身鸿沟导致其在物理空间可能执行危险动作,而现有防御体系存在逻辑与物理脱节等问题。

具身智能正在经历从实验室走向真实世界的范式转移。

大语言模型(LLM)赋予了机器人强大的逻辑推理与任务规划能力,但安全风险也随之单纯的「语义毒性」演变为真实的物理破坏。

最近,悉尼大学和德克萨斯大学圣安东尼奥分校联合发表了最新系统性综述 ,首次深入探讨了 LLM 控制下机器人的安全威胁、防御机制及未来挑战。


论文链接:https://arxiv.org/html/2601.02377v1

核心挑战:物理属性缺失的「具身鸿沟」

LLM控制机器人的底层困境在于具身鸿沟 (Embodiment Gap),传统的 LLM 安全机制聚焦于文本输出的合规性,具身智能则面临着「乱执行」的物理风险。

LLM具备卓越的抽象推理能力,却缺乏对物理定律和传感器数据的本质理解,这种脱节导致系统可能在口头拒绝恶意指令的同时,依然在物理空间执行了危险动作。

为了系统性应对这一挑战,研究团队构建了目前该领域最全的攻击与防御全景分类学:


具身智能安全攻击与防御全景分类

具身层面攻击分类学:三大向量

研究团队系统性地提出了针对具身智能的攻击分类方法 :

具身越狱 (Jailbreaking)利用提示词工程绕过安全过滤器 。攻击的关键在于确保恶意指令同时具备逻辑可执行性与物理约束适配性 。

后门攻击 (Backdoor)在模型中预埋特定触发器 。特定的环境视觉特征(如路边的小狗)可能诱发系统产生异常的控制指令 。

提示词注入 (Prompt Injection)通过污染感知层数据实施攻击 。伪造的 LiDAR 信息或中间人攻击能直接篡改机器人的高层决策逻辑 。

防御困境:碎片化与语义真空

目前的防御体系在逻辑保障与物理保障之间存在明显的断裂 。


fig2. LLM 控制机器人的多层防御体系

逻辑与物理脱节传统形式化方法(如 Safety Chip)能提供符号层面的逻辑验证,却难以覆盖复杂的连续动力学环境 。

状态相关性机器人的安全性具有极强的状态相关性 。相同的动作在不同物理语境(如平地 vs 悬崖边)下的安全性截然不同,静态内容过滤器无法理解这种动态语境 。

多模态风险当文字、图像、传感器数据交织在一起,单一的防御手段已不再可行 。

未来路线图

构建具身安全基石

研究团队提出了三位一体的防御演进方向 :

环境感知的安全对齐研究重心需从文本语义对齐转向物理后果的预测与对齐 。

全生命周期防御框架构建涵盖模型训练、供应链审计、运行时监控及形式化验证的闭环体系 。

标准化基准测试呼吁行业建立统一的评估标准,论文梳理了AGENTSAFEEIRAD以及SafeAgentBench等前沿基准,用于量化长时程环境下的系统稳健性 。

安全性不再是具身智能的附加组件,而是行业建立信任的底层基石 。

参考资料:

https://arxiv.org/html/2601.02377


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最大起飞重量500多吨,新一代运40,远超美俄,已成定局?

最大起飞重量500多吨,新一代运40,远超美俄,已成定局?

万里繁华
2026-01-20 11:46:50
殷秀梅:程志不是我的前夫,我的法国丈夫今年75岁

殷秀梅:程志不是我的前夫,我的法国丈夫今年75岁

顾史
2026-01-20 13:54:43
难怪鬼子不开战!日本议员:中国只要用导弹打东京,日本就会完蛋

难怪鬼子不开战!日本议员:中国只要用导弹打东京,日本就会完蛋

霁寒飘雪
2025-12-06 14:23:03
48年,邓华得知廖耀湘战败被抓捕后,立即说:给你一支好烟抽抽吧

48年,邓华得知廖耀湘战败被抓捕后,立即说:给你一支好烟抽抽吧

大运河时空
2026-01-19 20:00:03
官媒主动下场,53岁孟晚舟再掀天花板,让任正非与整个商界沉默了

官媒主动下场,53岁孟晚舟再掀天花板,让任正非与整个商界沉默了

牛牛叨史
2026-01-07 13:34:04
贺娇龙47岁生日照流出,手捧鲜花,头戴饰品,朋友圈首次曝光!

贺娇龙47岁生日照流出,手捧鲜花,头戴饰品,朋友圈首次曝光!

陈意小可爱
2026-01-21 01:34:29
吴石遗孀王碧奎 1950 年夫牺牲,台颠沛 30 年拒返赴美吐隐情

吴石遗孀王碧奎 1950 年夫牺牲,台颠沛 30 年拒返赴美吐隐情

磊子讲史
2026-01-06 11:48:34
郭文海会见广东电网公司董事长杨松楠:深化政企合作 共创“十五五”美好未来

郭文海会见广东电网公司董事长杨松楠:深化政企合作 共创“十五五”美好未来

林子说事
2026-01-20 09:00:00
12月70城房价:一二三线城市环比总体下降、同比降幅扩大

12月70城房价:一二三线城市环比总体下降、同比降幅扩大

华尔街见闻官方
2026-01-19 10:00:39
国家终于出手了!不仅是李梓萌被牵连,就连全红婵张文宏也没逃过

国家终于出手了!不仅是李梓萌被牵连,就连全红婵张文宏也没逃过

巧手晓厨娘
2025-12-26 21:34:40
聂卫平遗产2亿!若无遗嘱由现任妻子+3子女平分 两任前妻分文没有

聂卫平遗产2亿!若无遗嘱由现任妻子+3子女平分 两任前妻分文没有

念洲
2026-01-20 10:10:42
同事第4次让我替他做表,我直接下班,第二天领导要结果,他懵了

同事第4次让我替他做表,我直接下班,第二天领导要结果,他懵了

温情邮局
2026-01-07 16:16:09
科大智能冲刺港股:9个月营收19亿,期内利润7348万黄明松套现2亿

科大智能冲刺港股:9个月营收19亿,期内利润7348万黄明松套现2亿

雷递
2026-01-20 13:52:13
王石邀请众人到家打牌聚餐!三位美女暗送秋波,比田朴珺还要潇洒

王石邀请众人到家打牌聚餐!三位美女暗送秋波,比田朴珺还要潇洒

小椰的奶奶
2026-01-21 01:50:10
张本智和彻底翻脸!拒交四成奖金,自掏腰包组建六人“对抗军”

张本智和彻底翻脸!拒交四成奖金,自掏腰包组建六人“对抗军”

破镜难圆
2025-12-29 22:38:09
香港又一家老字号倒闭!发哥星爷都爱,曾接待撒切尔夫人...

香港又一家老字号倒闭!发哥星爷都爱,曾接待撒切尔夫人...

港港地
2026-01-19 10:02:00
海康威视2025年营收925.18亿元

海康威视2025年营收925.18亿元

北京商报
2026-01-20 20:35:05
中央批准跨省履新后,副部级张迎春有新职!同日一地副省长被免去职务

中央批准跨省履新后,副部级张迎春有新职!同日一地副省长被免去职务

上观新闻
2026-01-20 13:05:20
中国的小偷为什么直线下降?网友的评论太真实了

中国的小偷为什么直线下降?网友的评论太真实了

夜深爱杂谈
2026-01-20 18:46:49
越媒详细分析U23国足战术:防守极为稳固,进攻潜力不容小觑

越媒详细分析U23国足战术:防守极为稳固,进攻潜力不容小觑

懂球帝
2026-01-20 23:06:21
2026-01-21 04:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14372文章数 66520关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

丹麦首相:主权不谈判 准备贸易战

头条要闻

丹麦首相:主权不谈判 准备贸易战

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

家居
健康
艺术
数码
公开课

家居要闻

隽永之章 清雅无尘

血常规3项异常,是身体警报!

艺术要闻

陈丹青:困扰几代人的中国写实油画

数码要闻

行业唯一!红魔电竞平板3 Pro GOLDEN SAGA发布:镀金VC、24GB+1TB存储

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版