图像分割任务里,像素级分类一直是硬骨头。传统方法靠手工特征,遇到复杂场景就抓瞎。
这篇工作把全卷积网络(FCN)往深了做,堆了几十层卷积。深层网络能抓多尺度特征,小物体和大背景都能照顾到。
![]()
关键改动在两点:一是用空洞卷积(dilated convolution)扩大感受野,不丢分辨率;二是砍掉全连接层,全程卷积保空间信息。
实验在PASCAL VOC和Cityscapes上跑,mIoU比当时主流方法高出5-8个点。推理速度也没崩,单卡能实时处理高清图。
![]()
这思路后来成了语义分割的基线。现在看,"全卷积+超深网络"的配方依然能打。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.