网易首页 > 网易号 > 正文 申请入驻

改进YOLOv3 | IA-YOLO让恶劣天气的目标检测起飞了!!!

0
分享至

虽然基于深度学习的目标检测方法在传统数据集上取得了良好的效果,但在恶劣天气条件下从低质量图像中定位目标仍然具有挑战性。现有的方法要么难以平衡图像增强和目标检测任务,要么往往忽略有利于检测的潜在信息。

为了缓解这一问题,本文提出了一种新的图像自适应YOLO (IA-YOLO)框架,可以对每张图像进行自适应增强,以提高检测性能。针对YOLO探测器的恶劣天气条件,提出了一种可微分的图像处理(DIP)模块,并利用小型卷积神经网络(CNN-PP)对其参数进行预测。

IA-YOLO以端到端的方式学习CNN-PP和YOLOv3,这确保CNN-PP可以学习适当的DIP,以弱监督的方式增强图像进行检测。

本文提出的IA-YOLO方法可以在正常和恶劣天气条件下自适应处理图像。实验结果证明了IAYOLO方法在雾天和弱光情况下的有效性。

1

所提方法

在恶劣天气条件下拍摄的图像,由于特定天气信息的干扰,能见度较差,导致目标检测困难。为了解决这一挑战,本文提出了一种图像自适应检测框架,通过去除特定天气信息并揭示更多潜在信息。如图2所示,整个管道由一个基于cnn的参数预测器(CNNPP)、一个可微分图像处理模块(DIP)和一个检测网络组成。首先调整输入图像的大小为256x256,并将其输入到CNN-PP,以预测DIP的参数。然后,将经过DIP模块滤波后的图像作为YOLOv3检测器的输入。作者提出了一种端到端的混合数据训练方案,该方案具有检测损失,使CNN-PP能够学习适当的DIP,以弱监督方式增强图像的目标检测。

图像滤波器的设计应遵循可微性、分辨率独立的原则。对于基于梯度的CNN-PP优化,滤波器应该是可微的,以允许通过反向传播训练网络。由于CNN在处理高分辨率图像(如4000×3000)时会消耗大量的计算资源,所以在本文中,从下采样的大小为256×256的低分辨率图像中学习滤波器参数,然后将相同的滤波器应用到原始分辨率的图像中。因此,这些过滤器需要独立于图像分辨率。

我们提出的DIP模块由六个可微滤波器组成,具有可调超参数,包括Defog、White Balance(WB)、Gamma、Contrast、Tone和Sharpen。标准的颜色和色调操作符,如WB、Gamma、Contrast和Tone,可以表示为像素级滤波器。因此,设计的滤波器可以分为雾化、像素化和锐化。在这些滤波器中,除雾滤波器是专门为大雾场景设计的。具体情况如下。

1、像素级滤波器

像素级滤波器映射一个输入像素值 转换为输出像素值 ,其中 分别表示红、绿、蓝三个颜色通道的值。表1列出了四个像素级过滤器的映射函数,其中第二列列出了在本文的方法中要优化的参数。WB和Gamma是简单的乘法和功率变换。显然,它们的映射函数对于输入图像和参数都是可微的。

设计了可微对比度滤波器,输入参数设置原始图像和完全增强图像之间的线性插值。所示表1,映射函数中 的定义如下:

这里将tone 滤波器设计为一个单调的分段线性函数。用 参数学习tone 滤波器,用 表示,tone 曲线的点记为 ,其中 。此外,映射函数用可微参数表示,这使得函数对于输入图像和参数都是可微的,如下所示

图像锐化可以突出图像的细节。就像未锐化掩模技术(Polesel, Ramponi, and Mathews 2000),锐化过程可以描述如下:

其中 为输入图像, 为高斯滤波器, λ为正缩放因子。这个锐化操作对于 和 λ都是可微的。注意,锐化程度可以通过优化 λ调优目标检测性能。

3、除雾滤波器

基于暗通道先验方法设计了一个具有可学习参数的除雾滤波器。基于大气散射模型,朦胧图像的形成可以表述为:

其中 为雾天图像, 为场景亮度。A为全球大气光, 为介质透射图,定义为:

其中 β为大气的散射系数, 为场景深度。

为了恢复干净图像 ,关键是获取大气光A和透射图 。为此,首先计算暗 通道图,并选择最亮的1000个像素。然后,对雾霾图像 的1000个像素平均估计A。

根据上式 ,可以推导出 的近似解如 下:

进一 步介绍一个参数 除雾程度控制方 法如下:

由于上面的操作是 可微的,可以优化 通过反向传播使除雾滤波器更有利于雾天图像的检测。

CNN-PP Module

在相机图像信号处理(ISP)管道中,通常使用一些可调滤波器进行图像增强,其超参数由经验丰富的工程师通过视觉检查手动调整。

通常,这样的调优过程是非常笨拙和昂贵的,以找到合适的参数,广泛的场景。为了解决这一局限性,建议使用一个较小的CNN作为参数预测器来估计超参数,这是非常有效的。

以雾天场景为例,CNN-PP的目的是通过了解图像的全局内容,如亮度、颜色和色调以及雾的程度来预测DIP的参数。因此,下采样图像足以估计这些信息,可以大大节省计算成本。对于任意分辨率的输入图像,我们简单地使用双线性插值将其采样到256×256分辨率。如图2所示,CNN-PP网络由5个卷积块和2个全连接层组成。

每个卷积块包括一个带有stride=2的3 × 3卷积层和一个LeakyRelu。最后的全连接层输出DIP模块的超参数。这5个卷积层的输出通道分别为16、32、32、32和32。的当参数总数为15时,CNN-PP模型只包含165K个参数。

Detection Network Module

在本文中,选择one-stage检测器YOLOv3作为检测网络。与之前的版本相比,YOLOv3基于ResNet的思想设计了darknet-53,由连续的3×3和1×1卷积层组成。通过对多尺度特征图进行预测,实现多尺度训练,从而进一步提高检测精度,特别是对小目标的检测精度。采用了与原来相同的网络结构和损失函数。

Hybrid Data Training

为了在正常和恶劣天气条件下都能达到理想的检测性能,采用了IA-YOLO混合数据训练方案。算法1总结了提出方法的训练过程。

在输入到网络进行训练之前,每一幅图像都有2/3的概率被随机添加某种雾或被转换为微光图像。无论是普通的还是合成的低质量训练数据,整个过程都是端到端训练,使用YOLOv3检测损失,确保IA-YOLO中的所有模块都可以相互适应。

因此,CNN-PP模块在不手动标注GT真实图像的情况下,受到检测损失的弱监督。混合数据训练模式确保IA-YOLO可以根据每张图像的内容自适应处理图像,从而实现较高的检测性能。

2

实验

指标如下:

可视化结果

[1].Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
每秒可击落30多只蚊子 众筹超250万美元 中国造“激光灭蚊神器”海外爆单

每秒可击落30多只蚊子 众筹超250万美元 中国造“激光灭蚊神器”海外爆单

封面新闻
2026-05-27 15:24:09
病历和裸检视频被泄露!医生群聊晒30厘米黄金肛塞合照

病历和裸检视频被泄露!医生群聊晒30厘米黄金肛塞合照

北京郑律师
2026-05-28 12:03:28
卫健委已将左氧氟沙星列为重点监控药物!提醒:服用千万注意

卫健委已将左氧氟沙星列为重点监控药物!提醒:服用千万注意

健康科普365
2026-05-25 22:15:03
景甜急卖1.5亿江景房!疑似为筹钱还富豪男友,难怪突然不爆料了

景甜急卖1.5亿江景房!疑似为筹钱还富豪男友,难怪突然不爆料了

萌神木木
2026-05-27 11:42:30
央视赚翻!4亿拿下美加墨世界杯,不到2周已签2家分销,进账32亿

央视赚翻!4亿拿下美加墨世界杯,不到2周已签2家分销,进账32亿

十点街球体育
2026-05-27 16:14:22
为胜利干杯!古井贡酒倾情助力东北超四城八队揭幕战

为胜利干杯!古井贡酒倾情助力东北超四城八队揭幕战

铑财
2026-05-28 11:16:48
新华社力挺!耿同学再爆猛料!“学术委员会”为啥先慌了?

新华社力挺!耿同学再爆猛料!“学术委员会”为啥先慌了?

大江看潮
2026-05-28 07:34:37
解放军还是手软了,荷兰军舰闯西沙时的一个动作,本该被当场击沉

解放军还是手软了,荷兰军舰闯西沙时的一个动作,本该被当场击沉

阿龙聊军事
2026-05-28 10:14:28
同事婆婆去世,请假要上传证明!她把婆婆灵堂、亡身都上传了...人事半夜审核,魂儿吓没了

同事婆婆去世,请假要上传证明!她把婆婆灵堂、亡身都上传了...人事半夜审核,魂儿吓没了

医脉圈
2026-05-27 20:42:28
战事满三月:霍尔木兹枪声再起,美伊卡在3个“硬骨头”

战事满三月:霍尔木兹枪声再起,美伊卡在3个“硬骨头”

上游新闻
2026-05-28 12:28:06
高志凯:目前人民币全球交易结算占比只有2.5%-3% 建议提高至30%

高志凯:目前人民币全球交易结算占比只有2.5%-3% 建议提高至30%

凤凰网财经
2026-05-27 19:54:21
全新一代问界M9正式上市!余承东:我不是很谦虚 它是地球上性能最强SUV

全新一代问界M9正式上市!余承东:我不是很谦虚 它是地球上性能最强SUV

快科技
2026-05-27 17:10:27
Here we go!罗马诺:安东尼-戈登超8000万欧加盟巴萨

Here we go!罗马诺:安东尼-戈登超8000万欧加盟巴萨

懂球帝
2026-05-28 02:33:26
湖北大娘硬讹收割机后续!大批车主逃离,小麦烂地里,也没人敢去

湖北大娘硬讹收割机后续!大批车主逃离,小麦烂地里,也没人敢去

老猫观点
2026-05-28 07:26:11
入侵前兆!荷兰战舰海空一体强闯中国领土,我军罕见使用电磁压制

入侵前兆!荷兰战舰海空一体强闯中国领土,我军罕见使用电磁压制

叹为观止易
2026-05-28 05:57:08
09年,留美博士朱海洋表白学妹遭拒,当众将其砍首,判了终身监禁

09年,留美博士朱海洋表白学妹遭拒,当众将其砍首,判了终身监禁

莫地方
2026-05-27 00:50:07
真能应验?穆杰塔巴称以色列将在15年内不复存在,给出两个依据

真能应验?穆杰塔巴称以色列将在15年内不复存在,给出两个依据

流史岁月
2026-05-27 20:10:03
死亡人数高达31人,我们低估了这场暴雨

死亡人数高达31人,我们低估了这场暴雨

凤凰WEEKLY
2026-05-27 17:06:50
“晾了三天,终于臭了”!不少人连夜抢购,已卖爆

“晾了三天,终于臭了”!不少人连夜抢购,已卖爆

深圳晚报
2026-05-27 08:23:58
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
2026-05-28 13:59:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7310文章数 20754关注度
往期回顾 全部

科技要闻

台积电3纳米下半年涨价15% 明年或再涨10%

头条要闻

民进党发言人称受不了国台办 陈斌华回应时战术性喝水

头条要闻

民进党发言人称受不了国台办 陈斌华回应时战术性喝水

体育要闻

如果雷霆拼图是这水平 马刺确实打不过

娱乐要闻

曝大嫂冒充七七同学,林俊杰删掉合照

财经要闻

长鑫科技IPO过会,市值会到几万亿?

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

旅游
健康
手机
房产
游戏

旅游要闻

博主“硬刚”稻城亚丁:景区截断38公里省道 必须交120元坐观光车进入 当地多部门已介入调查

打外泌体会比干细胞更安全吗

手机要闻

苹果+三星季季垄断,国产唯小米能上桌,友商加油!

房产要闻

突发重磅!三亚新机场公司正式成立!

V社官宣掌机涨价1千6!黑心商人割韭菜还是心里苦?

无障碍浏览 进入关怀版