网易首页 > 网易号 > 正文 申请入驻

北大提出数据质量评估新标准,破解无线感知领域合成数据质量难题

0
分享至

北京大学许辰人教授团队与美国匹兹堡大学高伟教授合作,系统性地定义了无线感知领域合成数据的质量评估指标,提出了 SynCheck 框架。研究人员设计了具有普适性的、即插即用的数据筛选机制,能够确保训练过程中仅纳入高质量的合成样本。

该框架突破了智能家居或工业监测等小数据场景的瓶颈化难题。另一方面,其在跨场景泛化领域,具有更低的部署成本,更高的精度和更强的环境适应性。该研究为无线感知的实际落地,提供了一种在真实数据有限场景下的解决方案,并有望在数据合成后的质量验证接口、任务模型训练、场景适配等环节产生价值。

审稿人认为这项工作填补了现有研究的空白,且实验评估全面有力,对实际应用具有重要指导意义。其对该研究评价称:“这项研究针对合成无线数据质量评估这一独特而重要的问题,创新性地提出了亲和性与多样性的评估框架,并通过技术扎实的半监督学习框架有效提升了合成数据在下游任务中的实用性。”


(来源:该团队)

日前,相关论文以《数据自证其质:面向无线合成数据的质量导向利用方法》(Data Can Speak for Itself: Quality-guided Utilization of Wireless Synthetic Data)为题发表在预印本网站 arXiv[1],并获得了移动计算领域顶会 MobiSys 2025 的最佳论文奖。论文作者包括北京大学博士生龚晨、梁博、美国匹兹堡大学高伟教授和北京大学许辰人教授。


图丨相关论文(来源:arXiv)

与 AI 领域的丰富数据相比,无线感知领域的高质量开源数据集相对较少。主要原因在于:一方面,研究人员采集真实数据需要实际测量需要特定的设备;另一方面,数据受时间、空间变化等物理因素的影响,因此在有限场景下的实测难以覆盖真实世界的长尾分布。

随着技术的发展,生成模型(如 GAN、Diffusion Models)等新技术在图像和文本领域已展现出强大的能力。此前,已有研究者尝试将生成模型应用在无线感知领域,尝试用合成数据来补充真实数据。

然而,他们在直接应用生成模型时,面临领域特定的挑战:无线信号需要更强的物理可解释性,必须符合电磁波传播规律,例如菲涅尔区效应、多普勒频移等。因此,目前尚未有系统性的评估框架来量化合成数据的质量,以及它们在感知任务中的有效性,更缺乏与真实信号物理一致性的理论保障。


图丨对无线合成数据的质量评估和质量引导的利用(来源:arXiv)

研究团队希望通过建立可量化的无线领域数据质量标准,来解决将合成数据用于模型训练的可靠性问题。SynCheck 框架的核心思路是,在训练过程中动态优化合成数据的质量,而不是进行单次的筛选过滤。

具体来说:

首先进行半监督学习,将真实数据作为有标签数据,合成数据作为无标签数据,共同放入模型中训练。这样既能兼顾真实数据的准确性,又能发挥合成数据的规模优势。

第二步是动态评估和过滤。在训练过程中,模型会迭代地实时判断哪些合成数据是可信的。研究人员筛选出这些质量高的合成数据,并且只用这些数据参与监督式训练。同时,他们会及时删除那些标签错误或分布偏差较大的样本。


(来源:arXiv)

SynCheck 框架的主要创新点在于,训练和迭代筛选优化过程是同步进行的,可动态地对数据进行筛选和优化质量。它不依赖额外的人工规则,而是根据任务模型的置信度来进行判断。同时,也适用于不同的感知任务,并兼容各种各样的生成模型。

值得关注的是,该团队创新性地提出了亲和性(affinity)与多样性(diversity)两个指标,以将任务模型作为桥梁来衡量合成数据能增强真实数据的具体程度。具体来说,亲和性关注的是合成数据在每个类别内部是否足够接近真实数据,而多样性则关注合成数据是否足够广泛地覆盖真实数据的分布。

龚晨对 DeepTech 解释说道:“这是一种在无线感知领域不依赖于人工设计规则,且比较具有普适性的质量评估方法。我们不需要去理解这些信号的含义,它们直接面向需要合成数据的最终目标,适用于不同的感知任务,也不需要针对不同的生成模型做调整,最终提升目标任务的性能。”


图丨合成数据的质量量化(来源:arXiv)

传统方法由于直接使用合成数据,容易引起数据质量方面的缺陷。研究人员通过实验对比,发现在传统方法模型训练性能下降 13.4% 情况下,采用 SynCheck 框架仍能实现性能提升 4.3%。其核心差异在于,该框架通过动态去噪和智能化筛选,有选择性地利用这些数据,其性能提升本质上是通过数据筛选解决了合成数据的可靠性问题。

总体来说,该研究为生成式模型在无线感知领域的可靠应用开辟了新路径,使其真正成为扩展数据边界的有效工具,为无线大模型实现“数据自由”开启了一个好的开端。

许辰人团队的重点研究方向是多模态感知赋能科学与工程智能。未来,研究团队将聚焦在两个关键方向:一方面,他们计划进一步直接优化生成模型,把这些质量评估指标反向地指导生成模型的训练,从而直接改善生成模型;另一方面,他们还希望深度整合物理仿真器,构建基于电磁传播原理的仿真引擎,以减少对真实标注数据的依赖程度。

参考资料:

1.https://arxiv.org/abs/2506.23174

2.https://github.com/MobiSys25AE/SynCheck

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
很多人只看到了"老头乐起诉小米"的荒诞感,却没看到雷军不敢恋战背后的“惶恐”

很多人只看到了"老头乐起诉小米"的荒诞感,却没看到雷军不敢恋战背后的“惶恐”

新浪财经
2026-03-28 00:31:15
殡葬新规3月30日起施行,禁止将居民住宅专门用于安放骨灰

殡葬新规3月30日起施行,禁止将居民住宅专门用于安放骨灰

闻识
2026-03-28 22:30:56
苹果新品突然上架,3月27日,全面开售

苹果新品突然上架,3月27日,全面开售

科技堡垒
2026-03-27 13:34:57
张雪峰家族信托没完成,员工回应其二婚传闻,曝付幸离异带一儿子

张雪峰家族信托没完成,员工回应其二婚传闻,曝付幸离异带一儿子

壹月情感
2026-03-28 11:33:24
《我是特种兵》演员徐佳近况!和程愫任柯诺等聚会,满满的回忆

《我是特种兵》演员徐佳近况!和程愫任柯诺等聚会,满满的回忆

小徐讲八卦
2026-03-27 14:26:56
冲突加剧,日本援兵赶到,中方直接封海四天,越南警告中国别造岛

冲突加剧,日本援兵赶到,中方直接封海四天,越南警告中国别造岛

云上乌托邦
2026-03-24 14:50:45
打不赢伊朗,特朗普急调兵,美国又想侵略下一国,果然是中国朋友

打不赢伊朗,特朗普急调兵,美国又想侵略下一国,果然是中国朋友

吴欣纯Deborah
2026-03-07 16:12:19
朝鲜有5条奇葩规矩,千万不能碰!一不小心就“小命不保”?

朝鲜有5条奇葩规矩,千万不能碰!一不小心就“小命不保”?

一丝问别
2026-03-28 13:18:44
2026款保时捷卡宴无伪装现身,矩阵光源大灯加持,运动气场拉满!

2026款保时捷卡宴无伪装现身,矩阵光源大灯加持,运动气场拉满!

西莫的艺术宫殿
2026-03-24 20:26:05
周恩来想调兵却调不动?毛主席当年定下的规矩,让他晚年说出这番话

周恩来想调兵却调不动?毛主席当年定下的规矩,让他晚年说出这番话

文史明鉴
2026-03-23 16:47:14
毛主席有多高明?不顾尹先炳战功赫赫,毅然坚持要开除他的党籍

毛主席有多高明?不顾尹先炳战功赫赫,毅然坚持要开除他的党籍

大运河时空
2026-03-27 15:05:03
62岁老人查出阴茎癌!他的坏习惯为所有人敲响警钟!值得借鉴

62岁老人查出阴茎癌!他的坏习惯为所有人敲响警钟!值得借鉴

路医生健康科普
2026-03-27 17:42:19
以国防部大楼被击中!英媒:美以拦截弹月末将耗尽,真拦不住了!

以国防部大楼被击中!英媒:美以拦截弹月末将耗尽,真拦不住了!

记录天下风云
2026-03-29 02:50:39
日媒:给中国30年也造不出日本发动机!马斯克:中国车企值得尊敬

日媒:给中国30年也造不出日本发动机!马斯克:中国车企值得尊敬

好贤观史记
2026-01-09 17:43:17
年度最佳科幻片,有点稳了

年度最佳科幻片,有点稳了

虹膜
2026-03-24 20:48:38
不服就干!比利时打响反华第一枪,通告全球,断的就是中方退路

不服就干!比利时打响反华第一枪,通告全球,断的就是中方退路

鲸探所长
2026-03-28 16:55:12
江西女硕士失踪,被发现时已在教授实验室待6年,魔鬼真的存在

江西女硕士失踪,被发现时已在教授实验室待6年,魔鬼真的存在

灿烂夏天
2025-02-10 20:20:13
大风追踪|分手求和遭拒,湖南永州17岁男子杀害14岁少女,一审被判无期

大风追踪|分手求和遭拒,湖南永州17岁男子杀害14岁少女,一审被判无期

大风新闻
2026-03-28 18:18:15
户外一姐唐艺惊现意外走光,粉丝为何越看越上头?

户外一姐唐艺惊现意外走光,粉丝为何越看越上头?

娱乐领航家
2026-03-12 22:00:04
88年核武专家张宪义携全家叛逃美国,为何30年后却被世人赞为英雄

88年核武专家张宪义携全家叛逃美国,为何30年后却被世人赞为英雄

兴史兴谈
2026-03-28 23:47:25
2026-03-29 04:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16500文章数 514805关注度
往期回顾 全部

科技要闻

华为盘古大模型负责人王云鹤确认离职

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

陈牧驰陈冰官宣得子 晒一家三口握拳照

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

本地
家居
旅游
艺术
军事航空

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

家居要闻

曲线华尔兹 现代简约

旅游要闻

泰安市岱岳区:赏梨花 看村晚 万亩梨园迎客来

艺术要闻

不可思议的芭蕾之美,竟让人屏息凝视!

军事要闻

美军中东基地损失最新披露

无障碍浏览 进入关怀版