当前,可穿戴传感器设计面临一个根本性矛盾:既要保证佩戴舒适、设备轻便,又需实现高分辨率、大面积的传感能力,以获取准确的生物信息。这种矛盾在肌电图(EMG)监测领域尤为突出,传统的高密度电极阵列虽然能精确捕捉肌肉活动细节,但往往体积庞大、佩戴不便,限制了其日常应用。
近日,斯坦福大学鲍哲南院士团队开发出一种名为“生成式肌电网络”(GenENet)的自监督生成表征学习框架,并将其与一款新型可穿戴传感器结合。该技术能够从有限的传感器输入中推断并重建传感器未覆盖区域的肌肉活动,从而使用更紧凑、电极数量大幅减少的设备,获得与高密度EMG传感器网络等效的信息,且不牺牲性能。例如,一款基于低阻抗聚合物电极、仅使用6个通道的EMG设备,在经过32通道数据集训练后,在预测手语和步态动力学方面的准确性可与32通道设备相媲美。这项研究为健康监测、假肢控制、体育运动和人机界面等多个领域更舒适、高效的可穿戴设备铺平了道路。相关论文以“A simplified wearable device powered by a generative EMG network for hand-gesture recognition and gait prediction”为题,发表在
Nature Sensors上。
![]()
研究的关键始于一个高质量的数据采集基础。团队首先设计并制造了一个完全可拉伸的32通道柔性EMG传感器阵列,用于收集初始训练数据。该设备采用多层结构,包括PDMS基底、耐溶剂NBR保护层、液态金属EGaIn电极、高导电性PEDOT:PSS凝胶以及SBS封装层。这种设计确保了设备与皮肤的高度贴合,并能承受拉伸,同时PEDOT:PSS凝胶的加入显著降低了皮肤接触阻抗,减少了运动伪影,从而获得了更高信噪比(SNR)的低噪声信号,为后续生成式算法提供了高质量的数据库。
![]()
图1 | 用于手语和步态预测的GenENet。 a. 使用32通道可拉伸设备通过GenENet进行表征学习,随机掩蔽输入信号以重建原始数据。 b. 使用更小的6通道设备,其中预训练网络预测未覆盖区域的肌肉活动。参考电极和接地电极置于右侧。 c. 后训练网络,使预训练模型能够迁移到不同应用和用户。 d-f. 分别展示与a-c各阶段对应的设备实物图。无线模块由柔性印刷电路板构成。
![]()
图2 | 用于生成高质量数据集的可拉伸传感器阵列。 a. 32通道可拉伸阵列的分解视图,显示封装层、传感电极、互连线和基底。 b. 32通道设备的侧视图。 c. 设备原始状态与拉伸状态的对比。 d. 32通道设备通过柔性扁平电缆连接到定制无线模块。 e. 含有与不含有PEDOT:PSS的水凝胶的电化学阻抗谱。 f. 在100%应变下的阻抗耐久性图。小图显示PEDOT互连线在0%和100%应变下的状态。Z和Z0分别表示应变下和无应变状态下的阻抗。 g. 使用测力计(电极附着于前臂)比较PEDOT凝胶与相同尺寸Ag/AgCl电极的韦尔奇功率谱密度估计。 h, i. 在非可拉伸聚酰亚胺基底上制作的设备与在可拉伸基底上制作的设备的信噪比箱形图,显示可拉伸基底在32个通道上具有更高的平均信噪比。
基于这个高质量的32通道数据集,研究者训练了核心的GenENet模型。该模型基于去噪自编码器框架,采用掩码自监督学习策略。具体流程是:首先将处理后的32通道EMG信号(计算均方根值并构建为张量)随机掩蔽掉约81%的“区块”,然后将掩蔽后的不完整数据输入模型。模型的编码器将部分可见信号转换为潜在表征,解码器则负责从这些表征中重建出被掩蔽的原始信号。通过训练,模型学会了从残缺信息中推断整体肌肉活动时空模式的能力。训练过程中,生成信号与原始信号之间的误差逐渐减小,最终能够高保真地重建出完整的EMG信号图。
![]()
图3 | GenENet的预训练过程。 a. 32通道可拉伸设备在任意手指运动和行走时,从手腕或小腿捕获肌肉激活信号。 b, c. 信号经过增强和均方根处理。 d. 对后处理张量进行随机掩蔽,训练GenENet以最小化生成信号与原始信号之间的均方误差损失。E和D分别表示GenENet的编码器和解码器模块。 e. 样本1的代表性信号,展示训练周期中被掩蔽、原始和生成的信号。右侧图表显示训练期间均方误差的下降。 f. 训练过程中生成信号的详细图示。 g. 训练450个周期后,样本2和样本3的结果。
将预训练好的GenENet模型与一个简化的6通道无线EMG“手表”结合,便实现了强大的应用功能。在手语识别任务中,佩戴在手腕上的6通道设备采集信号,经过与预训练阶段相同的处理后,输入GenENet编码器获得潜在向量,再经由长短期记忆网络(LSTM)分类器进行处理,最终能够以高达93.6%的验证准确率识别26个美式手语字母。研究还通过定义“品质因数”(FOM)来平衡准确性与传感器总面积,发现6通道配置在此项任务中达到了最佳平衡点。模型展现出良好的泛化能力,即使传感器在手腕原始佩戴区域附近改变位置或方向,识别准确率也仅受微小影响。通过梯度归因图可视化,还能观察到不同通道的肌肉活动特征对特定手语姿势预测的贡献度。
![]()
图4 | 使用GenENet设备预测美式手语。 a. 通过六通道设备捕获的手语输入信号。 b. 与预训练相同的后处理步骤(不包括数据增强)。 c. 后处理张量输入GenENet,连接至CNN、LSTM和密集层。解码器和CNN的虚线部分仅在回归建模时激活。 d. 手语手势分类。 e. 通过平衡模型准确性和总传感器面积测量的品质因数。 f. 品质因数在六通道区域达到峰值,增加通道数提高准确性但也增大了传感器面积。 g. 使用六电极EMG阵列进行手指运动识别时,预训练GenENet与非参数化GenENet的验证准确性比较。 h. 设备在手腕不同位置和方向上的适应性,显示准确性差异可忽略。I.1–I.7表示电极阵列附着的不同位置和方向。 i. 使用来自6通道EMG输入的数字值进行手语预测。 j. 代表字母A、N和R的批次归因图,以及相应的EMG信号和归因图。
GenENet的适应性不仅限于上肢。研究团队还将设备佩戴于小腿,用于步态动力学预测。通过同时采集6通道EMG信号和由测力台测量的地面反作用力数据,并结合OpenCap视频捕捉进行逆动力学分析以计算膝关节力矩和力,对模型进行后训练。结果表明,仅使用6通道EMG输入,模型就能成功预测整个步态周期中连续的地面反作用力,预测值与真实值之间的确定系数R²高达0.975。模型还能预测与膝关节骨关节炎发展相关的膝内收力矩。这一系统使得以往需要在专业实验室进行的复杂步态动力学分析,有望通过轻便的可穿戴设备在日常环境中实现。
![]()
图5 | 使用GenENet设备预测步态动力学。 a. 实验设置,涉及走过三个测力板并同时进行视频捕捉。后训练网络用于预测地面反作用力,而膝关节垂直力和力矩则基于视频数据通过逆动力学计算,并入动力学后训练数据集。 b. 附着在小腿上的六通道EMG设备示意图。 c. 步态周期中的地面反作用力预测,显示预测值与从视频数据获得的真实值密切匹配的五个不同阶段。 d. 肌肉骨骼模型上实时预测地面反作用力的快照。 e. 地面反作用力预测的确定系数R²为0.975。 f. 对不同个体的适应性,显示他们之间一致的R²系数。 g. 地面反作用力和膝内收力矩向量方向的示意图。 h. 在特定时间间隔内预测的膝关节Y轴力和膝内收力矩。
这项研究成功展示了一种将生成式表征学习算法与可穿戴硬件相结合的新范式。它使得仅用极少电极的紧凑、低功耗阵列就能预测原本需要大面积、多电极系统才能获取的信号,在保持性能的同时,显著减少了传感器数量、设备尺寸和数据传输功耗。展望未来,这一平台有望扩展到其他需要高密度传感阵列但信号间存在相关性的领域,如应变、温度、心电图、脑电图乃至化学传感。通过进一步集成惯性测量单元、优化个性化校准以及开发片上信号处理能力,该系统将朝着更强大、更普适、更便捷的可穿戴健康监测与人机交互解决方案迈进。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.