网易首页 > 网易号 > 正文 申请入驻

你算个什么鸟?AI十级“找茬”选手诞生

0
分享至

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
杨净 丰色 发自 凹非寺
量子位 报道 | 公众号 QbitAI

你算个什么鸟?

面对上面这两张图,一个AI发出了灵魂拷问。

左边桃面牡丹鹦鹉,右边费氏牡丹鹦鹉

一眼识破的它早就看到左边的鸟的喙部和眼圈与右边的不一样。

不行,再来!再来看这组。(文末揭晓答案)

好,我放弃了。

这个来自浙大计算机学院和阿里安全的“找茬”选手,识别准确率达到了91.3%,已经是业内最优水平。研究成果已被多媒体国际顶会ACM MM 2021收录。

不光鸟,阿猫阿狗也能行,甚至花草植物也能行。

看看这连两张照片,吉娃娃还是英国玩具梗?

再来看这一波,羊驼还是美洲驼?驴还是骡?玫瑰还是羽衣甘蓝?

AI好眼力!那到底是如何练成的?

AI如何练就的一副好眼力?

实际上,这涉及到计算机视觉领域一个经典问题——细粒度图像识别,让AI一眼锁定类别之间的细微差异。

看起来简单,实际不简单,就比如下面左边这俩。

对于AI来说,区域注意力的定位和放大是保证识别准确率一个重要因素,此前大量基于CNN的探索发现,CNN的感受野有限,且缺乏全局依赖关系的建模能力

感受野:网络内部的不同位置的神经元对原图像的感受范围

研究人员认为,与CNN相比,图像序列化是一种全新的方式。

他们把目光转向了最近在CV领域取得了非常多研究进展的视觉Transformer(ViT)。

一开始,研究人员引入了ViT中的自注意力机制,提取图像中的长距离依赖关系。

不过ViT的感受野大小相对固定,对图像中的每个patch的关注程度没有产生区分,也就给细粒度图像识别带来了性能局限。

既然如此,那该如何让AI找准“重点”呢?

研究人员决定使用注意力权重的强度来衡量对应于原始图像的patch重要性,提出了多尺度循环注意力的Transformer(RAMS-Trans)。

它利用Transformer的自注意力机制,以多尺度的方式循环地学习判别性区域注意力。

团队成员之一,阿里安全图灵实验室算法专家炫谦介绍道:

我们方法的核心是动态patch建议模块 (DPPM)引导区域放大,以完成多尺度图像patch模块的集成。
DPPM从全局图像开始,迭代放大区域注意力,以每个尺度上产生的注意力权重的强度为指标,从全局到局部生成新的patch块。

具体来说,首先提取ViT每层的自注意力机制,并进行归一化,然后采取累乘的方式对自注意力整合。

然后,得到了整合后的自注意力均值分布矩阵,由于细粒度图像识别任务的关键因素在于局部注意力,其往往存在于图像的局部区域,如鸟的尾部、喙和蛙类的头部等。

因此研究者需要通过设定阈值的方式来“过滤”不需要的部位,增强对局部判别性区域的识别能力。

最后,研究者通过插值算法将选定的patch块放大到原图像的尺寸,通过共享参数的模型,重新进行训练,整体结构对应于文章所提的多尺度循环机制。

下图为RAMS-Trans在识别鸟类时根据注意力权重生成的注意图(attention map)。

△第二、三行分别为从原始和重新训练过的注意权重生成

扩展到更多动物身上的效果:

战绩如何?

RAMS-Trans只需要ViT本身附带的注意力权重,就可以很容易地进行端到端的训练。

实验表明,除了高效的CNN模型外,RAMS-Trans的表现比同期进行的工作更好,分别在CUB-200-2011(鸟类识别)、Stanford Dogs(狗类识别)、iNaturalist2017(动植物识别)获得SOTA。

分别达到91.3%、68.5%、92.4%的识别准确率。

在不同种类动植物的细粒度判别时,RAMS-Trans可以聚焦到类别的独特特征区域。

△第二、四、六行分别为放大到原图像尺寸的的patch块

针对不同类别识别准确率不同,甚至还有较大的区别,一作浙大博士胡云青解释道,主要有两方面的因素。

一是因为Stanford Dogs本身的类别数比其他两个数据集都要小。只有120分类(CUB是200,而iNaturaList更是达到了5089)。

类别数越多,通常意味着该数据集的细粒度问题越严重,因此RAMS-Trans在更细粒度的数据集上取得的提升相对明显。

二则因为在某个类别上大部分样本具有相似的特征,而不同种类间的狗也具有明显的判别性特征。

比如大部分博美都有相似的毛色和头型;德牧和金毛之间,人眼就可以做到明显区分。

通过消融实验发现,当分辨率为320、阈值为1.3、patch方案为DPPM、patch块大小为16x16时,模型效果最好。

接下来,团队还将在两个方面进行优化:

  • 提高定位能力。

目前,RAMS-Trans在原图上以patch为最小单位进行判别性区域定位和放大的过程,对于细粒度图像识别来说,这个较为“精细”的任务来说还是相当粗犷。

  • 动态网络的引入,包括动态训练和动态推理等。

另外,已经有了可预见的应用场景,比如野生动物保护治理、山寨商标的识别。

浙大&阿里安全

这项研究主要由浙江大学计算机学院、阿里安全图灵实验室共同完成。

其中第一作者胡云青,目前浙江大学计算机学院DMAC实验室博士在读,师从张寅教授。此外还是阿里安全图灵实验室实习生。

论文链接:
https://arxiv.org/abs/2107.08192

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5轮差8个瓜帅:和阿森纳净胜球差距太大了,他们即能进又不丢

5轮差8个瓜帅:和阿森纳净胜球差距太大了,他们即能进又不丢

直播吧
2024-04-26 15:23:01
江西一少女与43岁民工私奔,生下一儿一女,3年后报应惨痛

江西一少女与43岁民工私奔,生下一儿一女,3年后报应惨痛

莉雅细细谈
2023-12-22 19:15:30
A股:下周或将大级别的下跌

A股:下周或将大级别的下跌

生活中的栗子
2024-04-26 16:19:52
刚刚!确认牺牲,他才28岁啊!留下一对年幼儿女…

刚刚!确认牺牲,他才28岁啊!留下一对年幼儿女…

金湾通
2024-04-26 01:12:47
黑龙江省省长梁惠玲:做到投诉处理“不过夜”,切实保护游客权益

黑龙江省省长梁惠玲:做到投诉处理“不过夜”,切实保护游客权益

新京报政事儿
2024-04-26 11:48:38
人最大的教养,不是礼貌,不是客气,而是……

人最大的教养,不是礼貌,不是客气,而是……

闻心品阁
2024-04-25 23:25:30
詹姆斯怒砸更衣室!拉塞尔低迷原因曝光,湖人拒绝被掘金0-4横扫

詹姆斯怒砸更衣室!拉塞尔低迷原因曝光,湖人拒绝被掘金0-4横扫

小马哥谈体育
2024-04-26 14:01:12
4月26俄乌:美国再宣布60亿援乌计划,新战略达成,一切为时不晚

4月26俄乌:美国再宣布60亿援乌计划,新战略达成,一切为时不晚

山河路口
2024-04-26 17:42:04
女子遭两男子当街殴打 路过市民帮忙报警被砍成重伤 律师:如判决确认事实或属见义勇为

女子遭两男子当街殴打 路过市民帮忙报警被砍成重伤 律师:如判决确认事实或属见义勇为

封面新闻
2024-04-26 15:09:32
皇马是欧冠获得冠军次数最多的球队,欧冠获得亚军次数最多的是谁

皇马是欧冠获得冠军次数最多的球队,欧冠获得亚军次数最多的是谁

宝哥精彩赛事
2024-04-26 17:18:16
特斯拉在国内取消所有应届毕业生offer

特斯拉在国内取消所有应届毕业生offer

南方都市报
2024-04-24 17:32:11
一场北京车展,照出来了多少妖魔鬼怪

一场北京车展,照出来了多少妖魔鬼怪

户外小阿隋
2024-04-26 12:09:13
周鸿祎吐槽800多万劳斯莱斯库里南:车牌值750万,40万国产车随便秒杀它!贵得伤天害理

周鸿祎吐槽800多万劳斯莱斯库里南:车牌值750万,40万国产车随便秒杀它!贵得伤天害理

和讯网
2024-04-24 10:28:45
美国霸权倒计时?决胜来临,中国必须战略清醒与胆识

美国霸权倒计时?决胜来临,中国必须战略清醒与胆识

兵国大事
2024-04-26 09:13:55
谷爱凌与姚明现最萌身高差,朱婷小鸟依人,成龙站桌上踮脚矮半头

谷爱凌与姚明现最萌身高差,朱婷小鸟依人,成龙站桌上踮脚矮半头

湘楚风云
2024-04-24 01:38:20
汪小菲父亲被曝突然赴台,疑为孙子孙女改姓一事,结果已经很明确

汪小菲父亲被曝突然赴台,疑为孙子孙女改姓一事,结果已经很明确

西瓜爱娱娱
2024-04-25 16:29:19
刚刚!山西地震了!

刚刚!山西地震了!

山西老乡俱乐部
2024-04-26 06:07:48
大侠纪云浩还不懂的道理:小人物奉命去干坏事,最忌讳加戏,加戏就是加码

大侠纪云浩还不懂的道理:小人物奉命去干坏事,最忌讳加戏,加戏就是加码

金水路7号站
2024-04-26 08:38:15
关于死亡,这可能是一篇颠覆你认知的文章!

关于死亡,这可能是一篇颠覆你认知的文章!

尚曦读史
2024-04-05 10:52:47
特殊信号!一天发生四件大事:菲律宾可能要对国内的中国人下手了

特殊信号!一天发生四件大事:菲律宾可能要对国内的中国人下手了

清欢渡语
2024-04-25 21:49:17
2024-04-26 20:26:44
量子位
量子位
追踪人工智能动态
9321文章数 175242关注度
往期回顾 全部

游戏要闻

《剑星》曾尝试和饮料厂合作 对百事感兴趣

头条要闻

耶伦就"制裁与俄罗斯进行贸易的中国银行"最新表态

头条要闻

耶伦就"制裁与俄罗斯进行贸易的中国银行"最新表态

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

贾跃亭,真他娘是个人才

科技要闻

车展观察|德系日系绝不能放弃中国市场

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

教育
本地
健康
旅游
手机

教育要闻

心理专家:家长越俎代庖,可能让孩子失去自己解决问题的机会

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

这2种水果可降低高血压死亡风险

旅游要闻

白俄,中国人的快乐福地?

手机要闻

OPPO Find X7 Ultra 512GB卫通版突然上架:6799元

无障碍浏览 进入关怀版