网易首页 > 网易号 > 正文 申请入驻

CV | 目标检测中的常用评价指标总结[比率类+曲线类+图像类+速度类]

0
分享至

比较popular的目标检测算法,如RCNN,SSD等,需要使用评价指标来衡量其算法性能。

01

目标检测问题

目标检测问题输入为单张图像;输出为图像中的若干个目标分别的①类别class及其②位置坐标bounding box

为了检验目标检测算法的性能,需要引入全面的评价指标来比较算法优劣性。

02

基本概念T,F,P,N与混淆矩阵(Confusion Matrix)

P,N,T,F概念

预测值为正例,记为P(Positive)
预测值为反例,记为N(Negative)
预测值与真实值相同,记为T(True)
预测值与真实值相反,记为F(False)

混淆矩阵

混淆矩阵又被称为错误矩阵, 在每个类别下,模型预测错误的结果数量,以及错误预测 的类别和正确预测的数量都在一个矩阵下面显示出来,方便直观的评估模型分类的结果。

混淆矩阵中的横轴是模型预测的类别数量统计,纵轴是数据真实标签的数量统计。对角线,表示模型预测和数据标签一致的数目,所以对角线之和除以测试集总数就是准确率。对角线上数字越大越好,在可视化结果中颜色越深,说明模型在该类的预测准确率越高。如果按行来看,每行不在对角线位置的就是错误预测的类别。总的来说,我们希望对角线越高越好,非对角线越低越好,可视化对角线时可以归一化处理。

混淆矩阵(Confusion Matrix)

03

比率类指标:Accuracy + Precision + Recall + TPR + FPR + F指标 + Error rate

04

曲线类指标:PR曲线(AP值+mAP值) + ROC曲线(AUC值+ EER值)

由上节的一些比率类指标可以得到一些曲线,由曲线走势及其面积可以描述算法性能。

PR曲线和ROC曲线

05

图像类指标:IoU(Intersection over Union)和NMS(Non-Maximum Suppression)

IoU(Intersection over Union)交并比

IoU这一值,可以理解为系统预测出来的框与原来图片中标记的框的重合程度。 计算方法即检测结果Detection Result与 Ground Truth 的交集比上它们的并集,即为检测的 准确率。 IoU正是表达这种bounding box和ground truth的差异的指标,即用来衡量预测的物体框和真实框的重合程度,即两个框的交并比,评价一个算法的时候,一种常见的方法是先设置一个IOU的阈值,只要算法找到的IOU大于这个阈值,就是一个有效的检测,把记过拿出来计算mAP作为最终的评价指标。 一般可以设置当IoU的值大于0.5的时候,则可认为检测到目标物体。

NMS(Non-Maximum Suppression)

非极大值抑制

非极大值抑制虽然一般不作评价指标,但是也是目标检测中一个很重要的步骤。 对于目标检测问题,为了提高召回率,在模型计算中间过程会生成许多候选框(bounding box),使用NMS从堆叠的边框中挑出最好的一个。

  • 输入:图像经过算法产生的某个类的所有候选框 (每个候选框 = 5维数组:框的坐标:X_max,X_min,Y_max,Y_min,对应分类下的置信度:confidence score)+ IoU阈值:th

  • 输出:图像某个类筛选后的若干个候选框(为输入边框的子集,也是5维数组)

  • 步骤:对每一类目标都进行如下步骤,如果是多目标问题,Non-Maximum Suppression一次处理一个类别,如果有N个类别,Non-Maximum Suppression就需要执行N次。

  • 第一步:

    • 对所有符合置信度阈值的bounding box根据置信度从大到小排序,

    • 得到当前集合CurrentSet:所有符合的bounding box

    • 得到当前集合CurrentSet内置信度最高的boundingbox:MaxScoreBB;

    • 设置一个集合MaxSet

  • 第二步:

    • 更新MaxSet:MaxScoreBB从CurrentSet移入MaxSet;

    • 更新CurrentSet:对所有CurrentSet中的boundingbox与MaxScoreBB求IoU,从CurrentSet中删掉IoU>th的boundingbox

    • 判断:

      • 如果CurrentSet为空,停止;

      • 如果CurrentSet不为空,更新MaxScoreBB:得到当前集合CurrentSet内置信度最高的boundingbox:MaxScoreBB;重复第二步

  • 第三步:

    • 输出MaxSet

举例:
对于dog class,得到若干个bounding box,
其中置信度>0.3的有bb1,bb98,bb23,bb41,bb20五个; 置信度分别为0.4,0.5,0.7,0.6,0.8
第一步:
- 对符合bounding box根据置信度从大到小排序: bb20(0.8)>bb23(0.7)>bb41(0.6)>bb98(0.5)>bb1(0.4)
- 得到当前集合CurrentSet:[ bb20, bb23, bb41, bb98, bb1]
- 得到当前集合CurrentSet内置信度最高的boundingbox:MaxScoreBB:bb20(0.8)
- 设置一个集合MaxSet: []
第二步:
- 更新MaxSet:MaxScoreBB从CurrentSet移入MaxSet:[bb20]; CurrentSet [bb23, bb41, bb98, bb1]
- 更新CurrentSet:
IoU(bb23,bb20)>th 从CurrentSet删掉
IoU(bb41,bb20)IoU(bb98,bb20)IoU(bb1,bb20)>th 从CurrentSet删掉
CurrentSet:[bb41, bb98]
- 判断CurrentSet不为空,重复第二步
重复第二步:
- 更新MaxSet:MaxScoreBB从CurrentSet移入MaxSet:[bb20,bb41]; CurrentSet [bb98]
- 更新CurrentSet:
IoU(bb41,bb98)>th 从CurrentSet删掉
CurrentSet:[]
- 判断CurrentSet为空,停止
第三步:
输出MaxSet:[bb20,bb41]

06

速度类指标:fps和FLOPs

不同的目标检测技术往往会有不同的mAP和检测速度,目标检测技术的很多实际应用在准确度和速度上都有很高的要求,如果不计速度性能指标,只注重准确度表现的突破,但其代价是更高的计算复杂度和更多内存需求,对于全面行业部署而言,可扩展性仍是一个悬而未决的问题。

fps:检测器每秒能处理图片的张数

评价模型性能:同时使用mAP指标和fps指标

FLOPs检测器处理每张图片所需要

的浮点操作数

FLOPs:floating point operations 指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。不同网络,处理每张图片所需的FLOPs(浮点操作数)是不同的,所以同一硬件处理相同图片所需的FLOPs越小,相同时间内,就能处理更多的图片,速度也就越快,处理每张图片所需的FLOPs与许多因素有关,比如你的网络层数,参数量,选用的激活函数等等,这里仅谈一下网络的参数量对其的影响,一般来说参数量越低的网络,FLOPs会越小,保存模型所需的内存小,对硬件内存要求比较低,因此比较对嵌入式端较友好。【计算方法:阿柴本柴:CNN 模型所需的计算力flops是什么?怎么计算?】

区别于FLOPS (floating point operations per second):意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。同一硬件,它的最大FLOPS(每秒运算浮点数代表着硬件性能)是相同的。

来源:知乎

作者:计算机小学生

深延科技|

深延科技成立于2018年1月,中关村高新技术企业,是拥有全球领先人工智能技术的企业AI服务专家。以计算机视觉、自然语言处理和数据挖掘核心技术为基础,公司推出四款平台产品——深延智能数据标注平台、深延AI开发平台、深延自动化机器学习平台、深延AI开放平台,为企业提供数据处理、模型构建和训练、隐私计算、行业算法和解决方案等一站式AI平台服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“让整个文明在今晚灭绝!”特朗普模仿尼克松“发疯策略”,为何不灵了?

“让整个文明在今晚灭绝!”特朗普模仿尼克松“发疯策略”,为何不灵了?

红星新闻
2026-04-10 16:02:14
儿科专家林晓洁:多煮这碗“长高汤”,孩子少生病、个子往上蹿!

儿科专家林晓洁:多煮这碗“长高汤”,孩子少生病、个子往上蹿!

大明爱养生
2026-04-08 14:36:52
暴增2285%!商业航天+卫星通信+火箭回收,锁定下一个航发神话?

暴增2285%!商业航天+卫星通信+火箭回收,锁定下一个航发神话?

Thurman在昆明
2026-04-10 03:51:13
负电价席卷欧洲,德国创下-2585元/兆瓦时最低记录

负电价席卷欧洲,德国创下-2585元/兆瓦时最低记录

环球零碳
2026-04-09 20:00:45
张雪这老板真会玩!庆功宴直接在食堂和投资人开整

张雪这老板真会玩!庆功宴直接在食堂和投资人开整

阿废冷眼观察所
2026-04-10 12:03:29
Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸

Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸

新智元
2026-04-09 19:19:58
连丢两局止步!梁王组合输掉国羽内战,无缘亚锦赛男双四强

连丢两局止步!梁王组合输掉国羽内战,无缘亚锦赛男双四强

全景体育V
2026-04-10 18:31:54
央视《西游记》重拍!王一博出演唐僧?孙悟空全国寻找戏曲演员

央视《西游记》重拍!王一博出演唐僧?孙悟空全国寻找戏曲演员

枫尘余往逝
2026-04-08 09:01:14
5年来首派商务代表团,印度羞答答走向对华解冻之路 | 京酿馆

5年来首派商务代表团,印度羞答答走向对华解冻之路 | 京酿馆

新京报评论
2026-04-10 12:26:41
高圆圆的脚是我见过最漂亮的脚丫子。

高圆圆的脚是我见过最漂亮的脚丫子。

别人都叫我阿螫
2026-04-09 17:29:15
黎以华盛顿和谈在即!内塔尼亚胡:目标是让黎巴嫩真主党解除武装

黎以华盛顿和谈在即!内塔尼亚胡:目标是让黎巴嫩真主党解除武装

小武侃风云
2026-04-10 19:37:48
不止打伊朗!美以发动斩首行动同时,对中国电网下手,动作曝光

不止打伊朗!美以发动斩首行动同时,对中国电网下手,动作曝光

心灵得以滋养
2026-04-09 18:36:32
刚做了8个菜,公公全打包给小姑子,我抢过来全倒了,他愣住了

刚做了8个菜,公公全打包给小姑子,我抢过来全倒了,他愣住了

热心市民小黄
2026-04-10 16:23:19
西部第3至5的排名 还有很大变动可能性 火箭首轮打掘金的概率不小

西部第3至5的排名 还有很大变动可能性 火箭首轮打掘金的概率不小

大话火箭队
2026-04-10 14:45:04
郑丽文抵达北京,见到了想见的人,她想要的,大陆给的很爽快

郑丽文抵达北京,见到了想见的人,她想要的,大陆给的很爽快

林子说事
2026-04-10 17:59:27
以军在教室开枪,打死正在上课的9岁加沙女孩

以军在教室开枪,打死正在上课的9岁加沙女孩

潇湘晨报
2026-04-10 14:59:14
中国乒协主席王励勤曾言:从我本人角度,非常希望樊振东为国征战

中国乒协主席王励勤曾言:从我本人角度,非常希望樊振东为国征战

鲸鲱鱼体坛
2026-04-09 22:32:05
ST股涨跌幅放宽至10%!

ST股涨跌幅放宽至10%!

观察者网
2026-04-10 19:15:23
老妪的“妪”怎么读?不读òu,也不读yú或qū ,90%的人都读错了

老妪的“妪”怎么读?不读òu,也不读yú或qū ,90%的人都读错了

未央看点
2026-04-05 15:48:09
“枭龙”战机高光时刻!巴空军进入伊朗领空,正式为伊朗战斗护航

“枭龙”战机高光时刻!巴空军进入伊朗领空,正式为伊朗战斗护航

负面黑洞
2026-04-10 14:35:20
2026-04-10 20:04:49
深兰深延AI
深兰深延AI
让AI赋能更简单!
71文章数 0关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

73岁骑友抄近路摔倒身亡 女儿:赔偿问题无法达成共识

头条要闻

73岁骑友抄近路摔倒身亡 女儿:赔偿问题无法达成共识

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

创业板改革制度落地 增设第4套上市标准

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

旅游
健康
家居
教育
亲子

旅游要闻

“让大雪山变致富山!”户外风吹进胆扎村 村民有了新期盼

干细胞抗衰4大误区,90%的人都中招

家居要闻

复古风格 自然简约

教育要闻

直播预告|利楚教科“智慧校园·预见未来”发布会,定档4月16日!

亲子要闻

产后修复顺序分五个阶段,每个生娃的妈妈都走过,你也不例外

无障碍浏览 进入关怀版