网易首页 > 网易号 > 正文 申请入驻

自动驾驶中常提的卷积神经网络是个啥?

0
分享至

[首发于智驾最前沿微信公众号]在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像素排列成的二维网格。

卷积神经网络可以概括为“从局部入手,逐步抽象”的一项技术,即通过一系列可学习的运算,让网络能够自动从原始像素中识别出边缘、角点、纹理等基础特征,再逐步组合成更高级的语义信息,最终完成类似“识别出一只猫”这样的感知任务。



图片源自:网络

和传统的全连接网络相比,CNN不仅参数更少,还能更好地适应图像中物体的平移变化,因此在计算效率和泛化能力上的表现会更加出色。



核心组件和工作原理

想理解清楚CNN,要抓住“卷积核滑动”与“层层抽象”两个要点。卷积操作就像拿着一个小窗口在图像上逐格滑动,每次将窗口内的像素值与一组可训练的权重(也就是卷积核或滤波器)做点乘并求和,得到输出特征图上的一个数值。

这样训练的目的,正是调整这些卷积核的参数,让它们能提取出有用的特征。由于卷积核远小于整张图像,并且在整个图像上共享参数,这种“局部连接”和“参数共享”的设计,大大减少了网络的参数量。

卷积层后面通常会接一个如ReLU这样的非线性激活函数,它的作用是把负数值置零,从而引入非线性,让网络能够表达更复杂的关系。之后就会进行如最大池化这样的下采样操作,它在局部区域中选取最大值输出,这样不仅能降低数据维度、压缩信息,还能增强网络对平移的鲁棒性。

通过多个卷积层和池化层的堆叠,网络会逐层把低级特征信息(如边缘、纹理)组合成中级特征信息(如角点、局部形状),再进一步抽象为高级特征信息(如物体部件或语义概念)。在网络的末端,这些特征会被“展平”,再输入到全连接层或经过全局池化处理,最终通过分类器(如softmax)输出每个类别的概率。



图片源自:网络

卷积并不局限于二维图像。它可以扩展到一维数据(如语音、时间序列)和三维数据(如医学影像中的体积数据)。对于多通道输入(例如彩色图像的RGB三个通道),卷积核也会为每个通道配备一组权重,分别计算后再求和,生成单通道的特征图。而为了提取不同类型的特征,可同时使用多个卷积核,以便得到多个特征图(也称为输出通道)。



训练、优化与常见技巧

训练CNN的基本流程与其他神经网络类似,即先定义损失函数(分类任务常用交叉熵损失),再通过反向传播计算梯度,最后使用优化器(如随机梯度下降SGD或Adam)更新网络参数。在卷积层中,反向传播本质上是对卷积运算求导,分别计算卷积核和输入数据的梯度并更新。

在卷积神经网络的训练过程中,学习率、批次大小和权重初始化等超参数的选择至关重要,它们共同决定了训练过程的稳定性和模型的最终性能。为了抑制过拟合、提升模型的泛化能力,可综合运用以下几种实用技巧。

数据增强是非常有效的一种方法。通过对训练图像进行随机翻转、裁剪、旋转或调整亮度对比度等操作,可以显著增加数据的多样性,这能迫使模型学习更加鲁棒,而不是仅仅记住训练集中的特定样本。

权重衰减(L2正则化)和Dropout(随机屏蔽部分神经元)等正则化手段也是一种有效方式,不过在卷积层中使用Dropout通常会低于全连接层。批量归一化如今已成为训练深层网络的标准配置,它通过对每批数据进行规范化处理,有效稳定了训练过程,加快了收敛速度,并允许我们使用更大的学习率。此外,在训练过程中动态调整学习率的策略,以及根据验证集表现适时停止训练的“早停法”,也都是防止模型过拟合的常用手段。

除了上述训练技巧,模型架构层面的改进也会对训练结果产生深远影响。残差连接的引入是一项关键突破,它通过允许信息跨层直接传递,有效缓解了深层网络中的梯度消失问题,使得训练上百层的超深网络成为可能。



图片源自:网络

深度可分离卷积则从计算效率入手,将标准的卷积操作拆解为逐通道卷积和逐点卷积两个步骤,从而大幅降低了计算量和参数数量,这一设计对于在手机等移动设备上部署模型尤为关键。在实际的工程部署中,还会进一步运用模型压缩、量化等技术,对训练好的网络进行优化,以确保其在资源受限的环境中也能高效运行。

重要架构演进与设计选择

回顾卷积神经网络的发展历程,可以清晰地了解其设计思想的演变。早期的LeNet成功地将卷积思想应用于手写数字识别,证明了其有效性。随后,AlexNet在大规模图像分类竞赛中取得突破性成果,极大地推动了深度学习的热潮。VGG网络则通过反复堆叠小巧的3x3卷积核,构建起结构规整而深厚的网络,证明了深度的重要性。Inception系列则另辟蹊径,采用并行结构来同时捕捉不同尺度的特征。ResNet引入的残差连接,从根本上解决了深度网络的训练难题。近年来,为了在准确率和效率间取得平衡,出现了像MobileNet(使用深度可分离卷积)和EfficientNet(复合缩放模型深度、宽度和分辨率)这样的轻量级架构。

卷积神经网络在计算机视觉领域的应用已经非常广泛,从基础的图像分类,到目标检测、语义分割、人脸识别、姿态估计,乃至图像生成和检索,都能看到它的身影。

当然,CNN也有局限性,它在捕捉图像中的长距离依赖及全局关系方面,天生不如基于自注意力机制的Transformer模型灵活。虽然可以通过加深网络或使用大卷积核来扩大感受野,但这会带来计算成本的急剧上升。此外,其引以为傲的平移不变性,在某些需要精确定位(如实例分割)的任务中,也需要额外的机制来辅助。

最后的话

卷积神经网络通过“局部感知、参数共享、层次化抽象”这一核心思想,为处理图像等网格数据提供了一个强大而高效的框架。卷积神经网络的优势,源于它与生俱来的合理结构。它采用“从小范围入手”的策略,通过局部连接和权重共享,一层层地从图像中提取特征,从简单的边缘、纹理,逐步组合成复杂的物体部件和整体概念。这种设计不仅极大地减少了需要计算的参数数量,更让它天生就擅长处理图像这类数据。这使CNN在拥有出色识别能力的同时,也保证了很高的计算效率,成为计算机视觉领域坚实的技术基石。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宫鲁鸣,你看错人了?全场7中1+4失误,葬送冠军,这哪是扛旗人?

宫鲁鸣,你看错人了?全场7中1+4失误,葬送冠军,这哪是扛旗人?

南海浪花
2025-11-16 08:25:12
苹果五连冠,华为第五,荣耀第六

苹果五连冠,华为第五,荣耀第六

科技锋说
2025-11-15 07:13:06
2-1,24岁阿森纳旧将一剑封喉,53岁波切蒂诺率世界杯东道主2连胜

2-1,24岁阿森纳旧将一剑封喉,53岁波切蒂诺率世界杯东道主2连胜

侧身凌空斩
2025-11-16 08:04:52
全运会乒乓女单决赛:孙颖莎不敌王曼昱,2次世界第1出局

全运会乒乓女单决赛:孙颖莎不敌王曼昱,2次世界第1出局

精彩不容错过
2025-11-15 21:43:29
“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

“家里已经供不起我上班了!”父母无奈哭诉,成2025年最大的笑话

妍妍教育日记
2025-11-09 10:44:07
率队完成大爆冷!广东女篮主帅郑薇:没有人相信我们能拿到冠军

率队完成大爆冷!广东女篮主帅郑薇:没有人相信我们能拿到冠军

狼叔评论
2025-11-16 01:14:03
小姐姐紧身运动裤搭宽松蓝色T恤太好看,把休闲与精致巧妙糅合

小姐姐紧身运动裤搭宽松蓝色T恤太好看,把休闲与精致巧妙糅合

小乔古装汉服
2025-11-16 08:21:46
你闯过最大的祸是什么?网友:只要不是我同事,我就觉得很好笑

你闯过最大的祸是什么?网友:只要不是我同事,我就觉得很好笑

带你感受人间冷暖
2025-11-14 00:20:07
真嗑药了?40岁菲尔普斯已老态龙钟:现身悉尼 奥运23金+资产7亿

真嗑药了?40岁菲尔普斯已老态龙钟:现身悉尼 奥运23金+资产7亿

风过乡
2025-11-14 08:03:19
“战时大老虎”,被查前离境出走了

“战时大老虎”,被查前离境出走了

中国新闻周刊
2025-11-16 09:20:27
曝2大离婚瓜!国民男星夫妻反目分居2年,钟嘉欣7年抱仨遭骗婚

曝2大离婚瓜!国民男星夫妻反目分居2年,钟嘉欣7年抱仨遭骗婚

萧佉影视解说
2025-11-15 16:51:53
章泽天在英国和一帮富商共进晚餐,她的打扮一言难尽,肋骨外翻。

章泽天在英国和一帮富商共进晚餐,她的打扮一言难尽,肋骨外翻。

草莓解说体育
2025-11-07 12:39:22
杨振宁离世不到1个月,三大历史争议被扒,原来他并非想象中那样

杨振宁离世不到1个月,三大历史争议被扒,原来他并非想象中那样

春秋论娱
2025-11-14 07:38:47
WC!莫兰特完了!灰熊最快速度交易

WC!莫兰特完了!灰熊最快速度交易

技巧君侃球
2025-11-15 23:07:48
震惊!日本动画电影破纪录,退票率近20%,《哪吒2》可以松口气了

震惊!日本动画电影破纪录,退票率近20%,《哪吒2》可以松口气了

影视高原说
2025-11-15 09:08:59
见完美方后,郑丽文送两岸一句话,岛内民调变天,大陆要拔7钉子

见完美方后,郑丽文送两岸一句话,岛内民调变天,大陆要拔7钉子

虎哥闲聊
2025-11-15 11:36:22
歼-35也行!四川舰开启海试,央视展示弹射10架攻击-21壮观场景!

歼-35也行!四川舰开启海试,央视展示弹射10架攻击-21壮观场景!

烽火观天下
2025-11-15 23:40:28
喝了3次鸽子汤,才算懂得食补的快乐!鲜到舔碗,做法超简单!

喝了3次鸽子汤,才算懂得食补的快乐!鲜到舔碗,做法超简单!

江江食研社
2025-11-15 07:30:05
当陈松伶和小李琳同框,才发现女人到中年,幸不幸福都写在脸上

当陈松伶和小李琳同框,才发现女人到中年,幸不幸福都写在脸上

喵喵娱乐团
2025-11-14 16:05:23
网友公认四川第一美人!这颜值真是绝了!

网友公认四川第一美人!这颜值真是绝了!

乡野小珥
2025-11-16 01:43:05
2025-11-16 09:48:49
智驾最前沿
智驾最前沿
自动驾驶领域专业的技术、资讯分享平台。我们的slogan是:聚焦智能驾驶 ,紧盯行业前沿。
266文章数 12关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

媒体:叫嚣武力介入台海 日本全国都有沦为战场的风险

头条要闻

媒体:叫嚣武力介入台海 日本全国都有沦为战场的风险

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

手机
艺术
数码
旅游
时尚

手机要闻

iOS 26.2又有新变化:部分车型CarPlay扩展小组件栏位

艺术要闻

她从教师岗位退休,却在画布上开始了第二次人生!

数码要闻

Apple Watch涉专利侵权:苹果被裁定赔偿Masimo约6.34亿美元

旅游要闻

2025上海郊区红叶地图发布,秋色秘境藏不住了

今年冬天最流行的4组叠穿,让你美出新高度!

无障碍浏览 进入关怀版