网易首页 > 网易号 > 正文 申请入驻

探索NLP模型可解释性的7种姿势

0
分享至

每次看badcase时,都会怀疑自己的能力,是我哪里做的不对吗? 这都学不会?

幸运的话,会找到一批有共性的问题,再有针对性地加入训练数据或者改动模型解决。 而不幸的话,就是这儿错一个那儿错一个,想改动都无从下手。

今天,给大家推荐一篇香侬科技出品的「NLP模型可解释性综述」,帮大家寻找模型预测结果的根据所在,从而更有针对性地进行优化。

论文 : Interpreting Deep Learning Models in Natural Language Processing: A Review 论文链接: https://arxiv.org/abs/2110.10470

这篇文章描述的「可解释性」,旨在理解模型为什么给出当前的预测结果。从预测结果根据的出处来看,作者把可解释性方法分为三类:

1.Training-based: 从训练数据找根据,比如某条训练样本使得模型将当前测试样本预测为A类

2.Test-based: 从测试数据本身找根据,比如某个词、某个片段

3.Hybrid-based: 同时从训练数据和测试数据找根据

从可解释性方法的使用来看,又可以分为两种:

1.Joint methods: 把负责可解释性的模块加入到模型中一起训练

2.Pos-hoc methods: 在训练后加入可解释性模块

接下来的梳理主要以第一种分类体系为主线,不过作者也同时给出了每个方法的使用方式:

一、Training-based

Influence Functions

这类方法主要通过一个函数,来衡量训练样本 z 对于测试样本 x 的影响。最naive的方法就是去掉 z 再训练一个模型,但这样测完的时候就可以领盒饭走人了。不过我们有数学呀!于是在计算训练loss的时候,我们可以给样本 z 的loss加一个扰动,然后就能计算出 z 对于模型权重的影响,再把 x 输入进去,就能计算出每个 z 对每个 x 的影响情况。

由于公式太复杂,我就不列出来杀大家的脑细胞了。其中有个问题是Hessian矩阵比较难算,对于深度模型简直是灾难。于是又有学者提出了更简单的方法:Turn over dropout。

该方法的核心思想是,在训练完模型后,得到每个样本的一个mask矩阵 m(z) ,应用mask之后可以分离出那些不受样本 z 影响的神经元。于是我们可以应用矩阵得到两个子网络,再输入 x 后预测,就能计算出预测的diff。

KNNs Based Interpretation

基于KNN的方法旨在通过测试样本的隐层表示找到相近的训练样本。

这个方法理解起来就容易多了,而且很实用。比如我们在做分类任务时,有的测试样本置信度没那么高,这时就可以通过KNN的方法去找相近的TopK个训练样本,根据它们的label分布来帮助预测:

Kernel based Interpretation

这类方法比较老了,参考文献都是18、19年的。具体做法是,先用核函数对预测样本 x 和多个训练样本 l 计算相似度 K(x,l) ,之后把相似度矩阵投影成更高维的表示,再输入神经网络进行预测。之后再利用LRP(Layerwise Relevance Propagation)反向计算每层、每个神经元的相关性分数,传导回训练样本那一层就能知道每个样本对测试数据的影响了。

在训练时,Kernel和投影层都是一起训练的,所以这种方法既需要在训练时加入,又需要训练后的计算。

二、Test-based

Saliency-based Interpretation

这种方法的核心思想是利用一些metric计算测试样本中token、spen的重要程度。作者列出了很多种可以用的metirc:

Attention-based Interpretation

这个相信大家都熟悉了,就是通过观察attention矩阵来分析token的重要程度

但有意思的事,作者也在参考文献中发现了一些质疑的声音:Attention确实能给可解释性提供帮助吗?

在一篇19年的工作《Attention is not explanation》中,该作者提到,如果注意力权重真的能提供可解释性,那它应该具备两个性质

1. 注意力权重应该和基于特征的Saliency-based方法有很高的相关性

2. 改变注意力权重会影响预测结果

但是之后,该作者通过一系列的实验,证实attention不具备上述两个性质。所以直到现在(2021年11月),注意力机制是否能提供可解释性这个问题还处于争论之中。

不过该工作的实验是基于BiLSTM+Attention的,仍然有很多基于BERT的实验表明,注意力机制确实学到了不少的语言知识。

Explanation Generation

这个方法就有意思了,上述我们介绍的可解释性方法,对于人类来说可读性都比较弱。而这类方法就要求输出对人类更友好的「解释」。比如:

1.Extractive/Abstractive Rationale: 通过抽取或者生成的方式,把样本中对结果影响大的部分输出出来

2.Concept-based: 将预测样本联系到一些抽象概念上,比如在对餐厅的评价中,哪些词语是形容口味的、环境的等等,相当于给出了推理过程

3.Hierarchical: 自底向上分别给句子的每个token、span打分,哪个片段是正向、哪个是负向,也相当于给出了推理过程

三、总结

可解释性算是一个没那么热的方向,首先是深度模型确实太复杂了、太随机了,有时候自己想的一堆idea都没用,一个bug反而有提升。到了解释的时候全靠猜,可能是哪里分布不一致?或者是模型已经足够强了,我加的输入知识它不需要?其次是大部分人都是结果导向,有时间研究不确定的可解释性,不如花心思在指标提升上。

要说可解释性重不重要,那肯定是重要的。如果对模型的了解更深入,就可以避免一些高风险的badcase。比如风控领域,一个反动内容可能会灭了一家公司,再比如医疗领域,一个错误的预测可能影响患者的生命。

论文的结尾,作者列出了很多的开放问题等待大家探索:

1. 到底怎样才算可解释?

2. 如何评估这些探究可解释性的方法?

3. 是为算法工程师提供解释,还是为看到结果的用户提供解释?

4. 目前的可解释性方法大多研究分类任务,而其他任务呢?

5. 很多可解释性方法提供的结果不一致

6. 是否要牺牲性能获取更高的可解释性?

7. 可解释性方法如何应用?它的价值有多少?

那么最后,深度模型是否真的可解释?这个问题我也没有想清楚,世上无法解释的东西太多了。


本文来自:公众号【李rumor】 作者:rumor

Illustrastion by Pixel True from Iconscout

-The End-

扫码观看!

本周上新!

高质量活动太密集?我们帮你梳理!

近期活动

11.22(周一)

11.23(周二)

11.23(周二)

11.24(周三)

11.25(周四)

11.28(周日)

11.30(周二)

11.30(周二)

淘系技术直播③内容新电商

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白嫖190元榴莲事件再升级!女子出狱后恶意报复,商家要起诉到底

白嫖190元榴莲事件再升级!女子出狱后恶意报复,商家要起诉到底

奇思妙想草叶君
2026-05-25 20:31:36
安吉发现新记录植物!为浙江省首次发现

安吉发现新记录植物!为浙江省首次发现

三农老历
2026-05-25 15:09:52
25分钟仅拿1分!赛后却获主教练力捧,他防住了对方头号得分手

25分钟仅拿1分!赛后却获主教练力捧,他防住了对方头号得分手

老叶评球
2026-05-26 22:41:33
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

三农老历
2026-04-13 17:10:06
扔吸管女子暴怒原因曝光,警方已对其拘留五日罚款五百

扔吸管女子暴怒原因曝光,警方已对其拘留五日罚款五百

映射生活的身影
2026-05-26 02:21:04
霍思燕这画技,可以跟王诗龄一较高下了

霍思燕这画技,可以跟王诗龄一较高下了

娱你同欢
2026-05-04 22:13:39
无能狂怒:查尔斯国王再送夏洛特“珠宝”,梅根下一步怎么应对?

无能狂怒:查尔斯国王再送夏洛特“珠宝”,梅根下一步怎么应对?

陈意小可爱
2026-05-26 19:30:38
黄圣依直播杨子狂刷礼物成榜一大哥,黄圣依助理吐槽:追妻火葬场

黄圣依直播杨子狂刷礼物成榜一大哥,黄圣依助理吐槽:追妻火葬场

观鱼听雨
2026-05-26 23:50:20
美股存储概念持续拉升,西部数据涨幅扩大至9.5%,闪迪涨超8.5%

美股存储概念持续拉升,西部数据涨幅扩大至9.5%,闪迪涨超8.5%

每日经济新闻
2026-05-26 22:31:16
傅斯年痛批苏联集万恶之大成,赞那些敢向苏联开炮的中国硬汉

傅斯年痛批苏联集万恶之大成,赞那些敢向苏联开炮的中国硬汉

鉴史录
2026-05-26 19:10:08
湛江一男子25年前被殴致死:3名从犯陆续判刑,另有4人疑因超追诉期未被批捕

湛江一男子25年前被殴致死:3名从犯陆续判刑,另有4人疑因超追诉期未被批捕

澎湃新闻
2026-05-26 07:48:28
帅气中国小伙在德国去世,朋友透露更多,父亲:儿子性格内向乖巧

帅气中国小伙在德国去世,朋友透露更多,父亲:儿子性格内向乖巧

千言娱乐记
2026-05-26 11:46:21
属虎人,5月28-30日家里将有人离开,别哭!是老天帮你清除负担

属虎人,5月28-30日家里将有人离开,别哭!是老天帮你清除负担

白浅娱乐聊
2026-05-26 20:43:46
那些看起来"没事"的女人,其实早就耗空了

那些看起来"没事"的女人,其实早就耗空了

月亮打烊了发
2026-05-26 00:07:26
意甲新规:欧战决赛球队不再踢争冠附加赛

意甲新规:欧战决赛球队不再踢争冠附加赛

体育硬核说
2026-05-27 01:06:52
韬定律改变规则,华为再为国内产业争了口气:任总的远见少有人及

韬定律改变规则,华为再为国内产业争了口气:任总的远见少有人及

老方
2026-05-26 09:38:50
3分钟倾家荡产?年入千亿“精神鸦片”,正精准掏空中国人的钱包

3分钟倾家荡产?年入千亿“精神鸦片”,正精准掏空中国人的钱包

趣文说娱
2026-05-12 19:53:22
一觉醒来,昨晚家中"大爆发"!上海人崩溃:鸡皮疙瘩掉一地!更炸裂的是,今晚继续…

一觉醒来,昨晚家中"大爆发"!上海人崩溃:鸡皮疙瘩掉一地!更炸裂的是,今晚继续…

新浪财经
2026-05-26 07:02:00
卖地收入又降27%,地方政府怎么办?

卖地收入又降27%,地方政府怎么办?

料道new
2026-05-24 22:34:27
50亿年内地球会被烧成灰烬,而它或许会成为“第二颗地球”

50亿年内地球会被烧成灰烬,而它或许会成为“第二颗地球”

宇宙时空
2026-05-25 18:30:09
2026-05-27 02:44:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2389文章数 596关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

本地
亲子
家居
手机
公开课

本地新闻

用云锦的方式,打开江苏南京

亲子要闻

儿科医生提醒, 平时给孩子吃药一定要看时间~

家居要闻

生与命相依 旧公寓改造

手机要闻

荣耀600系列线下上手:体验之后,说说真实感受

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版