网易首页 > 网易号 > 正文 申请入驻

ECCV 2024 | 代码开源&方法简单,探索基于相机RAW图像的High-level视觉任务:RAW-Adapter

0
分享至

本文探索了RAW图像在高层视觉任务(如目标检测、语义分割)中的潜力。尽管RAW-to-RGB的ISP已取得显著进展,但RAW图像由于保留了丰富的光照信息和规律的噪声分布,在低光照和过曝光场景下具有优势。其主要挑战是缺乏大规模数据集和预训练模型,本文尝试结合RAW图像与sRGB预训练权重,提出了初步探索,指出未来该领域有待进一步研究和优化。

论文链接: RAW-Adapter: Adapting Pre-trained Visual Model to Camera RAW Images 文章链接: https://arxiv.org/abs/2408.14802 代码链接: https://github.com/cuiziteng/ECCV_RAW_Adapter

一、前言

目前已有的工作中,探索RAW-to-RGB的ISP,不管是传统ISP还是DL-based的ISP,都已经取得了不错的效果和泛化性能,也是各大手机厂商竞争的火热卖点,但是基于RAW图像的high-level vision tasks还探索寥寥,RAW图像优势在其尚未经过ISP的丰富的光照储存信息(higher bit depth),更广的色域范围(wider gamut range),规律的noise distribution(成像每一个阶段的噪声都有可解释性),让RAW在低光照场景和过曝光等不良光照场景存在着很大的优势。

然而针对high-level vision tasks (如目标检测,语义分割的任务)其一大劣势在于目前并没有针对RAW的大规模数据集和pre-train models,因此如何更好的把RAW图像和sRGB pretrain权重结合成了一个有待探索的topic,本文针对这个motivation给出了初步探索,后续提升还需大家一起多多努力~

基于RAW图像的视觉任务,黄线是没有利用sRGB预训练权重,紫色和蓝色的线是利用sRGB预训练权重,可以看出sRGB预训练权重在基于RAW的视觉task中有着很重要的作用

二、相关工作

ISP是相机内部很复杂专业的流程,对这方面感兴趣的同学,建议阅读Micheal s Brown发在ECCV 2016的那篇经典之作[A Software Platform for Manipulating the Camera Imaging Pipeline] (ps. 这篇论文对小白收获价值很大,堪称入门必读,本人也是读了好几遍,而且基本每次写paper都会引用这篇工作,Brown教授也是我在这个领域非常喜欢与欣赏的一位学者),或者他在ICCV 2023上的tutorial,了解一下相机ISP的相关步骤和背景知识(Demosacing, Denosing, WB, CCM, gamma ...)。

ISP本身的设计和design是为了满足人眼视觉更好的感知,传统的ISP算法每一个step往往都需要prior knowledge,比如白平衡前需要估计光源。每一家厂商的ISP也都有自己的特点,比如Sony和华为他们的自家ISP流程的CCM以及LUT参数肯定不同,同时每家的ISP基本都是黑盒,我们很难获取里面具体的step。ISP针对人眼设计的特性也导致了,这些ISP算法并不一定能很好的满足machine vision,尤其是在对于一些下游计算机视觉任务检测,分割的时候,针对人眼设计的ISP并不一定能够符合mAP,IOU等指标,这一表现在低光场景尤为明显。

这也就派生了一系列的工作,machine vision oriented ISP,设计ISP模型来更好的满足机器视觉性能,如检测分割等task,这一系列工作在普林斯顿的Felix Heide那边探索的比较多,他们的工作旨在于把一些ISP参数变得可以学习(Hardware-in the loop),或者通过一个UNet类型的网络(Dirty Pixel),还有一些其他组的工作比如通过NAS来选择合适的ISP参数,或者设计更新的网络来当成encoder,在这里就不一一论述了,感兴趣的可以看一下我们paper的related works部分。这里特别一提的是,利用网络搭建一个pre-encoder的工作,会大大加重网络负担,尤其在高分辨率输入场景尤为明显。

然而,此前的工作都缺乏对于sRGB pretain权重和RAW视觉任务的关系,在sRGB pretain权重愈发重要的今天,我们没有足够量的RAW data来做大规模预训练,因此如何利用好sRGB Pre-train权重的优势来设计轻量Adapters给RAW图像,成为了研究的关键。

三、模型结构

我们的方法设计了两组Adapters,一组是用来把RAW图像处理到网络输入阶段的Input-level Adapter, 另一组是链接ISP阶段特征和后续网络的Model-level Adapter,更多细节请见原文。

整体的模型结构中,Input-level Adapter这里大致包括四个步骤: (1). 预处理 + denoise/ gain/ sharpen (2). 白平衡 (3). CCM矩阵以及(4) Implicit 3D LUT。每一个步骤的初心目的就是把ISP参数变成可学习的,动态参与到模型的反向传播过程,同时让这些ISP参数可以自适应的配合到不同图像&光照&数据集。

Model-level Adapter这里则是更多借鉴了ViT-Adapter的设计,希望能把ISP阶段的中间特征作为Guidance融合的后续的网络backbone中。

其中 Input-level Adapter的设计中,我们采用了利用Attention模块的方式来直接估计ISP参数,比如去噪模糊核,白平衡Parameters以及相机CCM矩阵,这部分是直接用我之前[BMVC 2022 IAT] 的attention动态学习参数来设计的 (ps, 终于让IAT这篇ECCV 2022的拒稿,登上了ECCV 2024的舞台),动态学习ISP参数的优势,在于可以更具具体的图像,具体的光照场景,来更好的自适应调节参数。更多的模型细节可以参考我们原文。

四、实验设置

实验在检测分割任务中做了测试,包括检测的PASCAL RAW数据集,LOD数据集,分割的合成数据集ADE20K-RAW以及真实数据集iPhone XSmax。证明了我们方法相比于ISP算法和此前joint-training方法的有效性。其中我们在PASCAL RAW/ ADE20K-RAW上额外合成了低光照和过曝光的场景情况,发现RAW在异常光照下存在着独到优势,更多细节结论请见原文。

我们把PASCAL RAW数据集生成了三种光照情况,来更好的研究RAW图像对光照泛化性的优势

ADE20K-RAW表现

LOD以及PASCAL RAW表现


五、未来方向

我个人对RAW-Adapter的定义还是一个初步的起步工作,相比已经卷成一片红海的RGB,未来基于RAW图像的high-level视觉任务还有很大的空间可以做,也是一个广大硕博们能发论文的宝藏方向。希望RAW-Adapter能够成为这个方向大家的垫脚石,让广大研究者在这个方向一步步探索走下去,在未来的direction上,一些个人见解是此前基于RGB的探索都可以结合RAW试一下,比如自监督,预训练,DA ......

当然RAW-Adapter本身也存在着一定缺陷,比如kernel-based densoing过于简单,在一些复杂噪声情况也许无效,比如impilcit3D LUT并不是image-adaptive的,这部分改成image-adaptive也许会更好,还有model-level adapter肯定还有更好的特征融合方式,每个部分探索空间都很大,希望与大家共勉,一起进步。

来源:【知乎】https://zhuanlan.zhihu.com/p/717363887

llustration From IconScout By IconScout Store

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
尺度惊艳,这部新剧太生猛了

尺度惊艳,这部新剧太生猛了

i书与房
2026-03-16 08:54:35
卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

阿腩讲娱乐
2026-03-16 11:16:08
申城传奇教练,曾获5运会金牌,当过申花上港主帅,69岁仍不退休

申城传奇教练,曾获5运会金牌,当过申花上港主帅,69岁仍不退休

寒士之言本尊
2026-03-16 15:21:21
北京存款真相:400万现金存款,就是百里挑一的金字塔尖

北京存款真相:400万现金存款,就是百里挑一的金字塔尖

次元君情感
2026-03-16 08:22:44
反转了?张艺兴工作室正式回应,归国四子几近全塌房

反转了?张艺兴工作室正式回应,归国四子几近全塌房

姩姩有娱
2026-03-14 14:41:47
悲哀!34岁体制女生有房有车,10年无人问津,网友发帖称令人费解

悲哀!34岁体制女生有房有车,10年无人问津,网友发帖称令人费解

火山詩话
2026-03-15 15:31:46
“当心砸了你儿子的饭碗”,无知母亲晒公务员儿子做农活,被群嘲

“当心砸了你儿子的饭碗”,无知母亲晒公务员儿子做农活,被群嘲

妍妍教育日记
2026-02-24 18:13:37
日本网友炮轰:张本美和夺冠全场寂静没掌声,这是极其失礼的行为

日本网友炮轰:张本美和夺冠全场寂静没掌声,这是极其失礼的行为

杨华评论
2026-03-15 20:57:06
当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

当你接触的人多了,你会明白:如果一个人还在穿5年前的衣服,只说明3个问题

LULU生活家
2026-01-16 18:51:53
云南发现4万“野人”,衣不蔽体靠吃野果为生,到底是什么人?

云南发现4万“野人”,衣不蔽体靠吃野果为生,到底是什么人?

风信子的花
2026-03-15 22:30:48
老了才明白:父母一旦超过77,立刻停止几种行为,要注意

老了才明白:父母一旦超过77,立刻停止几种行为,要注意

荆医生科普
2026-03-02 19:20:08
亚足联调整!中国女足vs澳大利亚队半决赛有变,赛前收2坏1好消息

亚足联调整!中国女足vs澳大利亚队半决赛有变,赛前收2坏1好消息

大秦壁虎白话体育
2026-03-15 17:30:12
可怕的不是国乒女单丢冠,是4人输日本!孙颖莎的含金量还在上升

可怕的不是国乒女单丢冠,是4人输日本!孙颖莎的含金量还在上升

青烟小先生
2026-03-16 17:41:50
和父母同住后我才明白:再孝顺,也不能对年过70的父母做这3件事

和父母同住后我才明白:再孝顺,也不能对年过70的父母做这3件事

小马达情感故事
2025-12-21 17:55:03
林诗栋世界排名掉至第5,无缘澳门世界杯种子位

林诗栋世界排名掉至第5,无缘澳门世界杯种子位

懂球帝
2026-03-16 17:05:10
救苏宁一命,张近东搭上全部身家

救苏宁一命,张近东搭上全部身家

派代
2026-03-15 19:25:31
一颗3元鸡蛋被检出“合成色素”,到底超标没?黄天鹅、胖东来纷纷“硬刚”打假人

一颗3元鸡蛋被检出“合成色素”,到底超标没?黄天鹅、胖东来纷纷“硬刚”打假人

新浪财经
2026-03-16 17:50:22
青岛宣传部长刘升勤落马:她的人生寒冬终至,选人用人引人深思

青岛宣传部长刘升勤落马:她的人生寒冬终至,选人用人引人深思

十为先生
2026-03-15 20:47:23
曾经世界上最大的城市,差点取代北京成为中国首都,如今怎样?

曾经世界上最大的城市,差点取代北京成为中国首都,如今怎样?

抽象派大师
2026-03-14 14:00:04
郭德纲成都开业不请李伯清,反邀王迅引热议,圈内人却看懂深意

郭德纲成都开业不请李伯清,反邀王迅引热议,圈内人却看懂深意

草莓解说体育
2026-03-14 10:56:41
2026-03-16 18:31:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2311文章数 596关注度
往期回顾 全部

科技要闻

“龙虾”当道,五位养虾人探讨人类出路

头条要闻

因捐赠日军侵华相册与中国结缘 埃文凯尔官宣定居中国

头条要闻

因捐赠日军侵华相册与中国结缘 埃文凯尔官宣定居中国

体育要闻

那个送老奶奶去医院的球员 成了队史第一人

娱乐要闻

姚晨曹郁发离婚声明 多年前已结束婚姻

财经要闻

梁文锋推迟V4,是为根治龙虾的健忘症?

汽车要闻

大众全球首款9系旗舰SUV 上汽大众ID.ERA 9X首秀

态度原创

教育
亲子
艺术
手机
公开课

教育要闻

松下集团2026 (春招)招聘!

亲子要闻

幼儿园孩子该不该活在“楚门的世界”里?| 新京报快评

艺术要闻

吴冠中:春如线

手机要闻

OPPO ColorOS三月更新升级AI通话防诈,支持10+诈骗话术检测

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版