摘要
针对网络模型参数量大、下采样过程丢失影像建筑物细节信息的问题,受轻量级网络的启发,设计了一种融入深度可分离残差块和空洞卷积的建筑物提取网络(SD-BASNet)。首先,在深度监督编码器预测模块中设计了一个深度可分离残差块,将深度可分离卷积引入主干网络ResNet中,避免卷积核过大,减少网络的参数量;其次,为防止网络轻量化带来的精度下降,将空洞卷积融入后处理优化模块的编码层,增大特征图的感受野,从而捕捉更广泛的上下文信息,提高建筑物特征提取的准确性。在WHU建筑物数据集上进行实验,在不同尺度建筑物提取中均表现较好,其平均交并比和平均像素精度分别为92.25%和96.59%,其召回率、精确率和F1指标分别达到96.50%,93.79%和92.61%。与PSPNet,SegNet,DeepLabV3,SE-UNet,UNet++等语义分割网络相比,SD-BASNet网络提取精度得到了显著提升,且提取的建筑物完整度更好;与基础网络BASNet相比,SD-BASNet网络的参数量与运行时间也有所减少,证实了该文提出的SD-BASNet网络的有效性。
引用
朱娟娟, 黄亮, 朱莎莎. 面向高分辨率遥感影像建筑物提取的SD-BASNet网络 [J]. 自然资源遥感, 2025, 37(5): 122-130.
引言
本文在深度可分离卷积(depthwise separable convolution,DSC)的启发下,基于BASNet提出了SD-BASNet网络。该网络在BASNet的基础上设计了一个深度可分离残差模块(depthwise separable residual module,DSRM),降低了模型的参数量、缩短了网络运行时间;其次,为防止网络轻量化带来的精度下降,将空洞卷积(dilated convolution,DC)融入BASNet优化模块的编码层,在不增加卷积核大小的情况下,增大特征图的感受野,从而捕捉更广泛的上下文信息,提高建筑物提取的精度。
本文在BASNet网络的基础上进行了改进,提出了一种基于高分辨率遥感影像(high spatial resolution remote sensing images,HSRRSI)的建筑物提取网络SD-BASNet。该网络在BASNet网络的深度监督编解码(Encoder-Decoder)结构中设计了DSRM,将DSC引入其主干网络,避免了卷积核过大,减少模型的参数量;同时在优化模块的编码层中加入DC,目的是增大特征图感受野,解决因为编码层下采样过程中所导致的信息丢失问题,旨在实现建筑物的精细化提取同时使得网络参数量有所下降。
本文提出的SD-BASNet结构如图1所示。原BASNet网络主要由深度监督的Encoder-Decoder模块和残差优化模块组成。深度监督的Encoder-Decoder模块是一个分割目标预测模型,该结构捕获语义信息以提高建筑物提取精度,然后将提取到的特征图传入优化模块,改善影像区域的不确定性和边缘粗糙问题。但由于在网络训练过程中网络模型较为复杂,所产生的参数量不容小觑。因此,本文在BASNet网络的基础上进行改进,提出一种面向HSRRSI建筑物提取的SD-BASNet网络。
主要图表
![]()
图1SD-BASNet网络结构
![]()
图2标准卷积与DSC对比
![]()
图3DSRM结构
![]()
图4不同扩张率的感受野示意图
![]()
图5不同场景下建筑物示例图
![]()
图6小尺度建筑物提取结果
![]()
图7多尺度建筑物提取结果
![]()
图8大尺度建筑物提取结果
![]()
图9消融实验对比结果
结束语
从上述实验结果与分析中可得出,SD-BASNet与其他几种网络相比,精度和可视化结果均有较大的提升,验证了其对HSRRSI建筑物提取的有效性和可行性。而对比基础网络BASNet,本文网络的DSRM模块能简化网络结构,降低模型的参数量;在优化模块加入DC后,能更好地提取目标特征、增强模型的表征能力,说明设计DSRM与加入DC对网络模型训练有一定的积极影响。同时,在建筑物小尺度、多尺度、大尺度的背景下,SD-BASNet与其他网络相比依旧能取得较好结果,证明了所提网络的实用性与优越性。
本文利用所提出的网络SD-BASNet,降低了基础网络BASNet的参数量,同时实现了建筑物提取精度的提升。该网络为避免卷积核过大,在预测网络中设计了DSRM模块,有效减少了模型的参数量;又在优化模块的编码层中加入DC以增大特征图感受野,解决编码层下采样过程中所导致的信息丢失问题。在WHU建筑物数据集上对网络进行了实验测试。结果表明:与基础网络BASNet相比,SD-BASNet中DSRM模块的设计与DC的集成使得参数量和运行时间分别减少了25.10×106和0.36 h,且在不修改网络结构的情况下提高了其精度;相较于其他6种对比网络,其精度指标及可视化效果为总体最佳。
然而本文网络在召回率指标的提取上,依旧低于基础网络BASNet。在后续研究中,针对此问题需综合考虑样本类别的平衡问题。同时进一步优化网络结构,可尝试将语义分割算法与目标检测任务进行融合,提升网络在训练过程的精度,使其在复杂场景中达到更好的提取效果。
来源:测绘学术资讯
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.