Nature Sensors第一篇论文:不惧跑步和海浪,新一代“抗干扰”手势控制来了
在当下从虚拟现实到智能机器人不断加速演进的时代,人机接口早已不再满足于“能识别”,而是要做到“随时随地、任意姿态都能识别”。然而现实世界并不温柔:IMU 传感器对任何震动、摆臂、姿态变化都高度敏感,噪声的频率和幅度往往与手势本身重叠,让动作信号在真实环境中如同“淹没于海啸之中”。传统的硬件稳固、滤波算法或多传感器补偿都有局限,尤其是在跑步、骑行、震动或水下环境中,要从伪影中“挖出真正的手势”几乎是不可能任务。这种挑战使得当前很多人机界面都还停留在实验室条件,难以走入真实场景。
在此,美国加州大学圣地亚哥分校的徐升教授团队联合Joseph Wang教授用一种深度学习增强的可穿戴传感器系统,让这个不可能任务出现了突破。他们开发出一种深度学习增强的可穿戴人机接口系统,通过 IMU + EMG 多模态采集、复合数据集训练、卷积神经网络识别,以及可拉伸可穿戴的集成设计,实现了在跑步、震动、姿态变化甚至海浪干扰中依然保持高精度、实时手势识别。更令人惊喜的是,它不仅能稳定识别动作,还能精确控制机械臂完成抓取、倒液等操作,仿佛为人机界面装上了“抗噪声盔甲”和“智能大脑”。这项技术让未来的 VR 操作、户外人机交互甚至水下机器人控制都看到了全新可能。相关成果以“A noise-tolerant human–machine interface based on deep learning-enhanced wearable sensors”为题发表在《Nature Sensors》上,Xiangjun Chen, Zhiyuan Lou, Xiaoxiang Gao, Lu Yin为共同第一作者。
值得一提的是,这是Nature新创大子刊《Nature Sensors》发表的的第一篇文章!
![]()
高度集成、可穿戴、可拉伸的人机界面系统
在系统的硬件设计中,作者把一个完整的动作识别与无线通信平台压缩到只有 1.8 × 4.5 cm²、厚度 2 mm 的小巧贴肤设备中(图1a)。它像一片轻薄的电子贴片,却包含了六通道 IMU、肌电(EMG)模块、蓝牙 MCU 以及一颗可拉伸 Zn/Ag₂O 电池。IMU 捕捉加速度与角速度,EMG 负责识别抓握动作,而蓝牙模块则将处理后的信号实时发往后台控制端。整个电路采用多层结构堆叠(图1b),柔软基底与蛇形互连共同保证器件能承受超过 20% 的拉伸而不失效。同时,为了确保长期稳定工作,研究者自制了一颗耐弯折、可拉伸且循环性能稳定的电池,它在弯折、拉伸条件下仍能保持约 25 mAh 的容量(图1c)。无线通信方面,蓝牙信号在 20 米内稳定传输(图1d),而在连续运行 30 分钟后,设备表面温度也仅维持在 27.7°C(图1e),佩戴安全无虞。
![]()
图1:系统整体结构与性能
真实世界的“混乱数据”,让模型学会在噪声中识别动作
为了让系统学会在复杂环境中识别动作,研究团队没有只采集理想条件下的手势,而是构建了一个包含“噪声真实面貌”的数据集(图2a)。首先,他们采集了 19 种基本前臂动作的 IMU 信号,每个动作仅持续约 1 秒。随后,他们加入海量真实伪影:例如在姿态变化时,引力分量变化造成的基线漂移(图2b);在高频振动中,按摩枪产生的剧烈扰动(图2c);以及跑步过程中手臂自然摆动叠加身体震动的复合扰动(图2d)。这些扰动不仅幅度大,还在频率、波形上与手势信号高度重叠,正是现实中 IMU 最难处理的部分。与此同时,EMG 信号被用来区分抓握与松开(图2e),即便在跑步或振动中其信噪比显著下降,但仍保留着独特的肌肉激活结构。
![]()
图2:19 种动作的 IMU 信号及三类典型噪声
卷积神经网络让动作“脱离噪声”,迁移学习让新用户即刻上手
在这样复杂的数据条件下,研究者构建了一个结构优化的一维卷积神经网络(CNN),对 IMU 六通道信号进行融合与分层特征提取(图3c)。与全连接网络与循环网络相比,CNN 在召回率、精度、F1 值等指标上全面胜出(图3b),显示它对复杂噪声具有更强的特征分离能力。模型训练采用了复合数据集,即把手势信号与不同阶段的跑步、振动、姿态变化噪声叠加在一起,使模型学会在最混乱的情况下捕捉手势的稳定特征。
考虑到不同人的手势幅度与噪声模式可能差异巨大,研究团队还引入了参数级迁移学习,让系统具有“面向个人快速适配”的能力(图3d)。模型先在五个人的大规模数据集上预训练,而面对新用户时,只需要每个动作提供 2 条信号(坐着一条、躺着一条),模型就能在极少数据下迅速调整参数,使识别准确率从 51% 一举提升到 92%(图3e)。为了实现实时识别,他们还加入滑动窗口机制(图3f),每隔 0.25 秒基于 1 秒窗口进行一次预测,使系统在动作连续变化中也能平稳输出,不会出现“动作断点”。
![]()
图3:卷积神经网络架构、迁移学习流程、不同模型对比、混淆矩阵与滑动窗口机制
跑步、高频振动、姿态变化下仍可稳定操控机械臂
系统的最终检验来自真实任务:控制机械臂执行动作(图4a)。在传统 IMU 系统中,跑步或高频振动会让加速度与角速度信号剧烈跳动,几乎无法提取有效手势指令;但在深度学习处理后,这些噪声被模型“消化”掉,最终输出的手势分类依旧清晰稳定。研究者在跑步机上边跑边操作,机械臂依然能够平稳执行取液并倒入烧杯的动作(图4b),没有因为噪声而出现抖动或动作错误。更难能可贵的是,不论用户是在高频振动下、姿态变换中,还是在“跑步 + 振动”的极端组合场景下,系统仍能连续识别动作并驱动机械臂无缝操作。结合 EMG 判断抓取动作后,机械手甚至能在噪声干扰下实现精准的抓取与松开。这标志着该系统从单纯的“动作识别”真正跨越到“任务控制”,具备进入现实世界的稳定性。
![]()
图4:在跑步、高频振动等干扰下实时控制机械臂执行抓取与倒液动作
即使在海浪的周期干扰中,也能准确识别动作
为了挑战极端环境,研究者将设备放入海气模拟器中,模拟不同波长、不同波高的海浪扰动(图5a,b)。海浪的周期性与不规则叠加会让 IMU 输出产生极其复杂的“海浪噪声”,这是 IMU 信号处理中最棘手的干扰之一。但在深度学习模型训练后,系统能够从“海浪 + 手势”的叠加信号中依然分离出动作特征,实现稳定高精度识别(图5c)。令人意外的是,在海水环境中,EMG 电极与皮肤的界面阻抗更低,反而提升了抓握信号的稳定性。这意味着未来潜水员可以在海浪起伏的环境中,通过简单的手势操控水下机器人进行探测、采样、打捞等任务,为海洋工程开辟新的操作方式。
![]()
图5:海浪环境下的 IMU 信号采集与模拟海波干扰下的动作识别表现
小结
这项研究以系统级设计解决了可穿戴动作识别的核心瓶颈——对复杂动态噪声的高度敏感性。从硬件的柔性集成,到真实噪声采样构建的复合数据集,再到迁移学习加持的卷积神经网络,最终实现了在跑步、震动、姿态变化与海浪干扰下依然可靠的实时识别与动作控制。未来,通过更短窗口、更复杂动作、多模态融合以及更强的水下通信能力,这种抗噪声、高鲁棒性的可穿戴人机接口有望成为智能可穿戴设备、软体机器人、VR 手势控制、医疗康复乃至水下机器人操控的关键技术基础。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.