网易首页 > 网易号 > 正文 申请入驻

效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

0
分享至

来源:市场资讯

(来源:机器之心Pro)


实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜力,但其发展受制于一个根本性瓶颈:高质量操作数据的获取。

ByteDance Seed 团队最新的研究论文《End-to-End Dexterous Arm-Hand VLA Policies via Shared Autonomy》[1],针对这一关键问题提出了解决方案。

该研究的核心贡献在于提出了共享自主 (Shared Autonomy) 框架,通过合理划分人类操作员与自主 AI 系统的控制职责——人通过 VR 遥操作控制机械臂 (负责高层定位和避障),DexGrasp-VLA 自主控制灵巧手 (负责精细抓握),消除了同时遥操作臂和灵巧手的需求,大幅降低操作员认知负荷,有效解决了机器人部署中最关键的数据采集成本问题。通过将数据采集效率提升至可规模化的水平,它为灵巧操作技术从实验室走向工业应用奠定了基础。


Data collection and training pipeline for DexGrasp-VLA policy and arm-hand VLA policies.[1]

基于共享自主框架的端到端机械臂 - 灵巧手 VLA 策略学习:通过 DexGrasp AI 进行高效遥操作:


https://mp.weixin.qq.com/s/g2mk5elCiAhnjZ5A8dLbeQ

一、四大核心:实现了从数据采集到策略优化的闭环

论文的核心问题在于如何为高自由度灵巧手 + 机械臂系统高效地采集高质量的演示数据,以训练出具备通用操作能力的 VLA 策略。高自由度五指灵巧手的控制复杂度远超传统的两指夹爪,对数据质量和控制精度提出了更高的要求。


该研究构建了一个由四大核心模块组成的完整技术体系,实现了从数据采集到策略优化的闭环。

1. 核心策略: DexGrasp-VLA,打造共享自主框架的基石

DexGrasp-VLA 是一个专为灵巧手设计的自主抓取策略,是本文共享自主框架的基石。它是一个多模态 VLA 模型,其输入不仅包括语言指令、视觉和本体感知,更关键的是集成了触觉反馈。

该策略的实现得益于其所搭载的灵巧手 - 星动纪元星动 XHAND1 的硬件能力。星动 XHAND1 是一款全直驱 12 自由度的五指灵巧手,其指尖集成了高分辨率的触觉传感器。这些传感器能够提供合力向量和空间接触分布(环绕指端 270 度,120 点空间触觉阵列)两种关键触觉特征。DexGrasp-VLA 正是利用这些高保真度的触觉数据,实现了力适应性抓取 (Force-Adaptive Grasping),能够根据物体的形态而动态调整握力,从而在不捏碎易碎品的同时稳固抓取重物。


Tactile-based DexGrasp-VLA for hand control [1]

在杂乱桌面场景中使用 DexGrasp-VLA 进行清桌操作。


https://mp.weixin.qq.com/s/g2mk5elCiAhnjZ5A8dLbeQ

2. 人机臂手协同共享框架,高效采集高质量操作数据

共享自主框架将控制任务按照运动域进行拆分:


Fully manual teleoperation versus the proposed Shared Autonomy [1]

这样的设计源于臂与手在运动学本质上的巨大差异 —— 机械臂强调稳定、连续、较长时间尺度的轨迹控制,而灵巧手则必须处理柔顺接触、快速响应与高频细节动作。正因如此,将复杂度最高的手部控制交由 AI 自动处理,可以显著减轻人类操作者的认知及操作负担。操作者无需再时刻处理每一根手指的微小动作,只需专注于大方向和策略性决策。

最终,这套分工机制让系统能够更高效地采集高质量的臂手协同演示数据,为后续训练具备通用操作能力的 VLA 策略打下稳定基础。

3. 臂手特征增强模块,实现更自然、更鲁棒的宏观 - 微观动作协调

为了解决臂手协调这一复杂问题,论文提出了臂手特征增强 (Arm-Hand Feature Enhancement) 模块。


Arm-hand feature enhancement for the VLA policy [1]

该模块旨在建模和融合臂和手在运动学上的差异特征。它采用三流架构:共享任务表示、手臂专用编码器和手部专用编码器。这种解耦设计避免了传统单体架构模型对臂手差异的忽视,使得最终的策略能够实现更自然、更鲁棒的宏观 - 微观动作协调。

4. 持续优化机制:纠正性人机闭环,让机器人能够从失败中学习

该研究引入了纠正性人机闭环 (Corrective Human-in-the-Loop) 机制,让机器人能够从失败中学习。当机器人抓取失败时,人类操作员可以立即接管并演示正确的操作方法。系统会自动记录这次失败的过程和人类纠正后的成功过程,并将这两段数据作为「难题案例」加入训练集。

通过这种方式,策略能够不断迭代优化,逐步学会应对各种边缘案例 (corner cases), 变得越来越聪明和可靠。


Corrective human-in-the-loop teleoperation system [1]

端到端的机械臂 - 灵巧手 VLA 策略


https://mp.weixin.qq.com/s/g2mk5elCiAhnjZ5A8dLbeQ

二、星动 XHAND1 全直驱 + 触觉显著提升策略的协调性和鲁棒性


Hardware setup of the integrated robotic system.[1]




Representative cases of grasping cylindrical and spherical objects, visualizing the distribution of surface contacts measured by tactile sensors at fingertips.[1]


三、灵巧操作高质量数据采集效率提升 25%

该研究通过提出共享自主框架,推动了灵巧操作领域高质量数据采集效率提升 25%,使单人每小时可采集更多条数据,并将完整开发 - 部署周期压缩至一天以内,从根本上解决了 VLA 模型训练的数据瓶颈问题。

该研究通过在超过 50 种物体上实现约 90% 的抓取成功率这一接近工业标准的性能水平,推动了灵巧操作技术从概念验证向实际部署的关键跨越,为机器人在柔性制造、智能物流和服务机器人等领域的大规模应用铺路。


Grasping diverse objects with variations in size, color, and material properties.[1]

未来工作

论文展望了三个主要的未来研究方向。当前框架主要在抓取任务上得到了验证,未来可以通过引入更多专用的 AI 辅助控制器 (VLA Copilot 模块),将其拓展至物体重定向、精密插放和长时程操作等更复杂的场景。

虽然触觉反馈对抓取稳定性至关重要,但在端到端臂手控制中仍面临噪声干扰和时序错位等挑战,因此需要探索更智能的融合机制,例如根据任务阶段动态调整触觉、视觉和本体感受的权重。

此外,当前的纠正机制仍需人工介入,这在一定程度上限制了系统的可扩展性。未来可以借助强化学习实现系统的自主错误识别和恢复,并利用视觉 - 语言模型感知任务复杂度和环境风险,智能地决定何时独立运行、何时请求人类协助,最终实现从人机协作向完全自主的平滑过渡。

参考文献

[1] End-to-End Dexterous Arm-Hand VLA Policies via Shared Autonomy: VR Teleoperation Augmented by Autonomous Hand VLA Policy for Efficient Data Collection. ByteDance Seed. 2025.(https://arxiv.org/pdf/2511.00139)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陶氏化学:再裁员4500人!

陶氏化学:再裁员4500人!

马后炮化工
2026-01-30 19:21:55
航母就位,狠话“刷屏” 专家:美已错过最佳打击时间,目前主要是逼伊“核让步”

航母就位,狠话“刷屏” 专家:美已错过最佳打击时间,目前主要是逼伊“核让步”

红星新闻
2026-01-29 18:13:29
大布妻子每月零花钱100万刀,富豪岳父认为小贝没给儿子足够支持

大布妻子每月零花钱100万刀,富豪岳父认为小贝没给儿子足够支持

云隐南山
2026-01-30 11:40:07
奔驰车大量积压 经销商集体“造反”

奔驰车大量积压 经销商集体“造反”

中车网评
2026-01-29 19:20:17
编译 | 伊斯兰大会党“杀回”政坛,孟加拉国会走向伊斯兰化吗?

编译 | 伊斯兰大会党“杀回”政坛,孟加拉国会走向伊斯兰化吗?

南亚研究通讯
2026-01-29 23:15:35
贵州一博士生意大利访学期间失联已10天,父母一夜急白了头,因经济拮据陷跨国寻亲困境

贵州一博士生意大利访学期间失联已10天,父母一夜急白了头,因经济拮据陷跨国寻亲困境

大风新闻
2026-01-30 18:07:12
王岳伦发文声明,离谱了

王岳伦发文声明,离谱了

听风听你
2026-01-28 22:40:00
全了!各年龄段血压、血糖、血脂、尿酸对照表,果断收藏

全了!各年龄段血压、血糖、血脂、尿酸对照表,果断收藏

华人星光
2026-01-12 13:14:21
国人对二战有个错误的认知,认为当时日本国力强大,其实并非如此

国人对二战有个错误的认知,认为当时日本国力强大,其实并非如此

文史达观
2026-01-30 06:45:06
人一过60,永远不要在熟人面前,说以下几句话,谁说谁后悔,切记

人一过60,永远不要在熟人面前,说以下几句话,谁说谁后悔,切记

枫红染山径
2026-01-02 14:59:55
杨鸣揭秘球员转会!张镇麟选择上海,周琦有特权,赵继伟也要走?

杨鸣揭秘球员转会!张镇麟选择上海,周琦有特权,赵继伟也要走?

体坛大事记
2026-01-30 11:01:10
一家独大的英超,让欧足联相当尴尬!

一家独大的英超,让欧足联相当尴尬!

达文西看世界
2026-01-30 14:16:55
又一艘驱逐舰抵达,美国在中东部署至少10艘军舰

又一艘驱逐舰抵达,美国在中东部署至少10艘军舰

界面新闻
2026-01-30 07:25:02
长城汽车定制车机字体“长城共享体”面向全球免费开放商用

长城汽车定制车机字体“长城共享体”面向全球免费开放商用

IT之家
2026-01-30 18:15:09
TVB前花旦激罕復出64歲狀態曝光,圈中老公曾戀梅艷芳終情歸太太

TVB前花旦激罕復出64歲狀態曝光,圈中老公曾戀梅艷芳終情歸太太

粤睇先生
2026-01-30 15:42:48
慈禧嘴里那颗8亿的夜明珠,下落已经查明:被宋美龄卖给一位大亨

慈禧嘴里那颗8亿的夜明珠,下落已经查明:被宋美龄卖给一位大亨

谈史论天地
2026-01-26 12:30:03
看到中方接机代表,斯塔默心里就有底了,这次中英想到一块儿了?

看到中方接机代表,斯塔默心里就有底了,这次中英想到一块儿了?

马浵在解说
2026-01-29 20:04:17
完成北伐2个目标后,快船迎来魔鬼赛程,刚好对阵西部前6对手

完成北伐2个目标后,快船迎来魔鬼赛程,刚好对阵西部前6对手

摸神drose
2026-01-30 23:14:19
杭州市地铁集团一日收两张罚单,涉及施工许可、监督手续等问题

杭州市地铁集团一日收两张罚单,涉及施工许可、监督手续等问题

齐鲁壹点
2026-01-30 10:35:21
澳网首冠诞生!10年来首个卫冕组合!张帅明天冲击澳网第二冠!

澳网首冠诞生!10年来首个卫冕组合!张帅明天冲击澳网第二冠!

篮球看比赛
2026-01-30 13:58:23
2026-01-31 01:31:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057548文章数 5303关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

特朗普警告称中英、中加合作是"危险的" 外交部回应

头条要闻

特朗普警告称中英、中加合作是"危险的" 外交部回应

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

艺术
旅游
时尚
公开课
军事航空

艺术要闻

惊艳!越南摄影师镜头下的妩媚女子!

旅游要闻

“先回家再出游” 火了!春节错峰旅行,省钱还不挤

今日热点:《闪灵》今日上映;保险公司确认金晨方曾放弃索赔……

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

新西兰拒绝特朗普:不加入"和平委员会"

无障碍浏览 进入关怀版