网易首页 > 网易号 > 正文 申请入驻

破解工业信号异构难题!首个“搭积木式”统一基座模型FISHER开源

0
分享至

始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。

近年来,越来越多的工业设备被安装上传感器以监控工作状态。然而安装传感器容易,如何高效分析工业信号却很难,因为不同传感器采集的工业信号具有极大的异质性。本文中,我们将其总结为M5问题:多模态、多采样率、多尺度、多任务和少故障。

受到M5问题影响,现有方法大多只分析小范围的工业信号,例如基于振动的轴承故障诊断,所采用的模型也均为在小数据集上训练的小模型。然而这些模型未能发掘大数据训练的优势,也未能利用不同模态之间的互补性。另一方面,对于工业运维的每个子问题,都需要单独开发和部署专门的模型,大大增加了实际应用的复杂度

尽管工业信号在表面上差异显著,但其内在特征和语义信息却存在诸多相似之处:从语义信息来看,这些信号都反映着相同的健康状态;就产生机理而言,像声音(源于鼓膜震动)与振动这类信号实则同根同源;在分析手段上,基本都采用谱分析方法;而故障模式方面,由于设备均由零件构成,不同设备之间具有一定的借鉴性;此外,在任务特征上也存在共享性,即一个特征向量能够表征多个健康管理任务。

基于此,我们认为是可以使用单一模型对异质工业信号进行统一建模的。由于信号内部存在相似性,通过scaling,可以让模型逐渐学会这些相似性,进而迸发出更为强大的表征能力,实现里程碑式提升。

由此,来自清华大学、上海交通大学、北京华控智加科技有限公司和华北电力大学的研究者联合发布首个多模态工业信号基座模型FISHER,采用搭积木的方法对异质工业信号进行统一建模。已上线始智AI-wisemodel开源社区,欢迎大家前去体验。

模型地址

https://wisemodel.cn/models/jiangab/FISHER-tiny-0723

https://wisemodel.cn/models/jiangab/FISHER-mini-0723

https://wisemodel.cn/models/jiangab/FISHER-small-0723

01.

模型能力

FISHER模型是首个面向多模态工业信号的基座模型。它以子带为建模单元,通过堆积木的方式表征整段信号,可处理任意采样率的工业信号。详细介绍如下:

子带建模

谱分析是语音和信号分析常用的手段。与语音模型常采用的Mel谱不同的是,FISHER采用短时傅里叶变换(STFT)作为信号输入特征,这是由于1)故障分量往往出现在高频 2)对于旋转类机械,倍频关系往往很重要。为保证不同采样率下时频分辨率相同,FISHER中的STFT采用固定时长的窗长和帧移。

当数据量增大时,多采样率是模型必须要应对的问题。之前方法将信号全部重采样至固定采样率(例如16 kHz),从而丢失了关键的高频信息,特别是对于44.1 kHz及以上的高带宽信号。在FISHER中,我们不再进行重采样,而是利用信号在不同采样率下的特点进行建模。如下图所示,对同一信号源使用不同采样率进行观测时,共有频带基本一致,而高采样率会有额外的高频子带,也就是说高采样率的增益来源于更多子带信息。而另一方面,工业信号常见的采样率有16 kHz,32 kHz,44.1 kHz和48 kHz,这些采样率近似存在公约数(如2 kHz和4 kHz),故STFT谱可视作多个固定宽度子带的拼接。

因此FISHER采用固定宽度的子带作为建模单元,将子带信息用搭积木的方式拼接成整段信号的表征。具体而言,STFT谱被切分为固定宽度的子带,每个子带被模型单独处理。最终的信号表征是每个子带表征的拼接。

模型架构

FISHER包括1个ViT Encoder和1个CNN Decoder,采用“老师-学生”自蒸馏预训练。具体而言,老师Encoder是学生Encoder的指数滑动平均(EMA),仅学生Encoder和学生Decoder具有梯度。切分后的子带的80%被mask,未被mask的20%送入学生Encoder,处理后再与被mask部分按原位置拼接,送入学生Decoder。老师Encoder则输入整个子带,输出则作为蒸馏的目标。自蒸馏过程分别在[CLS]层次和patch层次进行监督。预训练结束后,仅保留学生Encoder用于后续评估。

我们目前开源了FISHER的3个不同尺寸:tiny(5.5M),mini(10M)和small(22M)。所有模型均在1.7万小时的混合数据集上进行预训练。

RMIS基准介绍

为评估模型在各种健康管理任务上的性能,我们提出了RMIS基准。RMIS基准包含5个异常检测数据集和13个故障诊断数据集,涵盖4个模态。这里异常检测为正常/异常 2分类问题,但训练集不包含异常;故障诊断为多分类问题,训练集和测试集均包含所有类别。为检验模型固有的性能,模型在所有数据集上均使用相同的KNN配置进行推断,不进行微调。

02.

实验结果

我们先在RMIS基准上对常见预训练模型进行筛选,然后采用5个最好的模型作为基线,涵盖了5M到1.2B的多个尺寸。由于语音模型的效果普遍偏差,故我们并未对比。

基准得分

在RMIS基准上,FISHER的3个版本分别较基线至少提升了3.91%,4.34%和5.03%,展现出强大的泛化能力。按任务分析,在异常检测任务上,FISHER仅略低于BEATs;而在故障诊断任务上,FISHER大幅超过BEATs在内的所有基线,这主要得益于FISHER能利用完整的频带,而基线模型只能利用到16 kHz。此外,目前开源的FISHER模型最大也只有22M,远小于基线常见的90M。

Scaling 效果

上图对比了各个模型的RMIS得分随模型大小变化的曲线。可以看到FISHER的曲线远高于基线系统的曲线,即使是最小的FISHER-tiny也能超过所有基线系统。这说明FISHER的预训练模式更优越,scaling更有效。

另一方面,我们观察到100M 似乎是scaling 曲线的分界点。我们猜测这是由于工业信号重复度较高,现有大规模数据集中的工业信号去重后至多支持100M 模型的训练。因此训练信号基座模型时,数据的配比需要增大,数据清洗将是scaling up的关键。此外,考虑到FISHER的成功,Test-Time Scaling 似乎也是可行的方向。

变切分比

对于12个不提供官方切分的数据集,我们首先绘制了模型在变切分比场景下的工作曲线,然后估计了曲线下面积。如上表所示,FISHER具有最大的曲线下面积,说明其在变切分比场景下依旧具有卓越的性能。

----- END -----

wisemodel相关:

系统升级:

系列活动:

系列模型:

关于wisemodel更多

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个多月内,青岛两名市委常委相继落马

一个多月内,青岛两名市委常委相继落马

中国青年报
2026-04-20 22:08:12
混到我这个地步,已经没什么救了~

混到我这个地步,已经没什么救了~

果粉之家
2026-03-27 14:56:34
劳伦斯11大奖项揭晓:网球包揽男女最佳!巴黎获年度团队 中国0奖

劳伦斯11大奖项揭晓:网球包揽男女最佳!巴黎获年度团队 中国0奖

我爱英超
2026-04-21 06:25:56
一个收入不高的人,可以伪精致到什么程度?网友:天天为账单发愁

一个收入不高的人,可以伪精致到什么程度?网友:天天为账单发愁

另子维爱读史
2026-04-20 09:36:56
比哈弗茨更该走人!阿森纳昔日核心彻底下滑,沦为新版津琴科

比哈弗茨更该走人!阿森纳昔日核心彻底下滑,沦为新版津琴科

澜归序
2026-04-21 06:09:10
说走就走、撤得干干净净的人,终究还是回来了。

说走就走、撤得干干净净的人,终究还是回来了。

小光侃娱乐
2026-04-20 12:40:03
三方重磅交易!欧文奔赴森林狼联手华子 独行侠血赚 快船补强内线

三方重磅交易!欧文奔赴森林狼联手华子 独行侠血赚 快船补强内线

钱说体育
2026-04-21 06:36:36
勇士队内部人士:库里目前合同剩1年6260万美元,计划今夏续约2年

勇士队内部人士:库里目前合同剩1年6260万美元,计划今夏续约2年

好火子
2026-04-21 00:24:13
代总统领头 委内瑞拉发起全国反美制裁游行

代总统领头 委内瑞拉发起全国反美制裁游行

看看新闻Knews
2026-04-20 20:48:04
央美同学抄袭博主作品参加服设大赛,博主发声:原封不动抄袭,非常震惊;组委会回应:已取消参赛资格

央美同学抄袭博主作品参加服设大赛,博主发声:原封不动抄袭,非常震惊;组委会回应:已取消参赛资格

扬子晚报
2026-04-20 21:52:59
马蹄露自荐做团长后续!张敬轩粉丝不忍了,开始发文攻击了

马蹄露自荐做团长后续!张敬轩粉丝不忍了,开始发文攻击了

小徐讲八卦
2026-04-19 11:27:40
5月1日起严查!退休人员注意这3件“人情事”,碰了就可能涉刑

5月1日起严查!退休人员注意这3件“人情事”,碰了就可能涉刑

复转这些年
2026-04-20 17:25:56
以牙还牙!中国052D直接冲入横当水道,从日本导弹眼皮底下过!

以牙还牙!中国052D直接冲入横当水道,从日本导弹眼皮底下过!

阿龙聊军事
2026-04-20 19:13:31
太揪心!女星流产5次痛失7子,试管圆梦后,43岁执意再拼二胎

太揪心!女星流产5次痛失7子,试管圆梦后,43岁执意再拼二胎

一盅情怀
2026-04-20 14:43:07
小资金做大的最好方式,“月线看趋势,周线看上下,日线看买卖”

小资金做大的最好方式,“月线看趋势,周线看上下,日线看买卖”

一方聊市
2026-04-19 20:25:03
世锦赛第四日战况:希金斯10-7力克卡特,囧哥七连鞭淘汰未来新星

世锦赛第四日战况:希金斯10-7力克卡特,囧哥七连鞭淘汰未来新星

金木原创
2026-04-21 07:58:38
55岁上海炒股冠军罕见发声:如果本金有20W,建议死磕这五条铁律

55岁上海炒股冠军罕见发声:如果本金有20W,建议死磕这五条铁律

股经纵横谈
2026-04-19 19:03:09
这个90后女演员凭什么击败章子怡、马丽,夺得金像影后桂冠

这个90后女演员凭什么击败章子怡、马丽,夺得金像影后桂冠

新民周刊
2026-04-20 11:37:22
中东,突传大消息!特朗普最新发声!原油跳水,黄金、白银突变!

中东,突传大消息!特朗普最新发声!原油跳水,黄金、白银突变!

证券时报e公司
2026-04-21 07:44:39
同样是一线城市,北京和上海差距太大,4个真实感受,越想越明白

同样是一线城市,北京和上海差距太大,4个真实感受,越想越明白

娱乐圈见解说
2026-04-21 00:53:31
2026-04-21 08:28:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
471文章数 16关注度
往期回顾 全部

头条要闻

特朗普两天三次反转 伊朗学习特朗普玩起"极限施压"

头条要闻

特朗普两天三次反转 伊朗学习特朗普玩起"极限施压"

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

科技要闻

重磅官宣:库克卸任,特努斯接任苹果CEO

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

旅游
游戏
健康
教育
军事航空

旅游要闻

阎锡山故居:一座都督府,半部民国史

简直就是欺诈!玩家怒批索尼PS商店明目张胆割韭菜

干细胞抗衰4大误区,90%的人都中招

教育要闻

加权费马点模型,一个视频学明白!

军事要闻

特朗普:美舰向伊朗货船开火炸出个洞

无障碍浏览 进入关怀版