来源:市场资讯
(来源:计算机视觉研究院)
计算机视觉研究院
![]()
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
https://pmc.ncbi.nlm.nih.gov/articles/PMC12656552/pdf/sensors-25-07088.pdf
计算机视觉研究院专栏
Column of Computer Vision Institute
本文提出的RMH-YOLO模型,在保持轻量高效的同时,大幅提升航拍小目标检测精度。
PART/1
痛点
无人机航拍视角下的小目标(通常<32×32 像素)检测,面临四大核心挑战:
- 像素极少:目标特征微弱,传统模型难以提取有效信息
- 尺度剧变:飞行高度、角度动态变化,目标大小跨度大
- 背景复杂:植被、建筑、道路等干扰强,目标易被淹没
- 光照多变:强光、阴影、弱光环境大幅降低特征辨识度
现有 YOLO 系列模型在这类场景下,漏检、误检问题突出,且难以兼顾精度与嵌入式部署的轻量化需求。
PART/2
创新
RMH-YOLO 以 YOLOv8n 为基线,通过4 项核心改进,专为无人机航拍小目标优化,实现特征增强、高效融合、轻量推理、精准定位。
![]()
【RMH-YOLO 模型结构】
精细特征模块 RFM融合通道 + 空间双注意力机制,嵌入骨干网络,强化小目标弱特征表达,保留上下文信息,解决低分辨率下特征丢失问题。
多尺度聚焦扩散 MFFD 网络替代传统 PAFPN,通过聚焦 - 扩散双路径,保留浅层高分辨率空间细节,将细粒度信息传递到深层语义特征,杜绝小目标特征稀释。
轻量 CS-Head 检测头采用参数共享卷积,去除冗余计算,适配无人机嵌入式平台,在不损失检测能力的前提下,大幅降低参数量与计算量。
优化损失函数组合NWD 归一化瓦瑟斯坦距离与InnerCIoU,解决小目标框回归不稳定、定位不准的问题,提升复杂场景下的框精度。
PART/3
实验
实验验证:精度飙升,轻量高效
团队在VisDrone2019(无人机主流检测数据集)与TinyPerson(超小目标数据集)上完成全面验证,结果亮眼:
1. 核心指标对比 YOLOv8n
![]()
【整体模块消融实验结果】
精度:53.0%(+8.8%)
召回率:40.4%(+7.4%)
mAP50:42.4%(+9.2%)
mAP50:95:25.7%(+6.4%)
参数量仅1.3M,计算量 16.7G FLOPs,极致轻量化
2. 完胜主流 YOLO 系列
![]()
【与 YOLO 系列模型对比】
RMH-YOLOv8n/v8s 在精度、召回、mAP 全维度超越 YOLOv8/10/11/12,同时参数量更低,兼顾性能与部署性。
3. 可视化效果:复杂场景稳准检测
![]()
【各场景检测结果对比】
复杂背景、远距离密集目标、低光 / 强光场景下,RMH-YOLO 漏检率远低于基线,小目标识别更稳定。
![]()
【模型注意力热力图对比】
热力图显示,模型能精准聚焦小目标区域,不受复杂背景、光照干扰,注意力分配更合理。
PART/4
总结
RMH-YOLO 实现了高精度 + 轻量型的完美平衡,完美适配无人机机载嵌入式部署,可广泛应用于:
城市交通巡检:行人、非机动车小目标精准识别
应急救援:复杂环境下人员、物资快速定位
安防监控:高空全域小目标实时监测
基建巡检:小型缺陷、隐患精准捕捉
该模型为无人机航拍小目标检测提供了全新解决方案,兼顾学术创新与工程落地价值,推动无人机视觉监测向更精准、更高效方向发展。
有相关需求的你可以联系我们!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.