网易首页 > 网易号 > 正文 申请入驻

ACL 2020 | 词嵌入性别偏见难以避免?“双硬去偏”新方法来了!

0
分享至

  本文介绍的是 ACL 2020 论文《 Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation》,论文作者来自弗吉尼亚大学、salesforce。

  编译 | 龚 倩

  编辑 | 丛 末

  Paper: https://arxiv.org/abs/2005.00965

  Github: https://github.com/uvavision/Double-Hard-Debias

  1

  研究背景

  源自人为生成的语料库的词嵌入,具有很强的性别偏见,而且这种性别偏见会被下游模型进一步放大。我们发现语料库的规律性如词频等,会对现有的事后比较去偏算法(post-hoc debiasing algorithms)的性能产生负面影响,于是我们提出在推断和去除性别子空间之前,根据语料库的规律性对词嵌入进行净化处理。

  1、词嵌入中的性别偏见

  词嵌入是指用有意义的数字向量表示词汇表中的单词,它们能够捕捉单词的语义和句法意义以及与其他单词的关系。尽管词嵌入向量在自然语言处理任务中得到了广泛的应用,但它还是被批判:从训练语料库中继承了无意识的性别偏见。

  正如论文《Man is to Computer Programmer as Woman is to Homemaker? Debiasing Word Embeddings》中所讨论的那样,当一个词的语义是中性而学到的词嵌入却更偏向特定的性别时,就暴露出了性别偏见的问题。例如,在下图中,x坐标表示的是对嵌入的单词“he”(他)和“she”(她)之间的差异,而y坐标表示捕获性别中立的嵌入过程中学到的倾向,中性的单词在x轴之上,而特定性别的单词在x轴之下。尽管“brilliant”(聪明)和“genius”(天才)在定义上是中性的,但它们的嵌入更接近“he”(他)。同样,“homemaker”(操持家务者)和“sewing(”缝纫)与“she”(她)更接近。

  2、为什么性别偏见是一个严重的问题?

  词嵌入中的性别偏见确实是一个很严重的问题。想象一下,如果人们训练了一个基于具有偏见的词嵌入的简历筛选模型,那么这个模型就会针对程序员等岗位自动地过滤掉女性应聘者,也会针对理发师等职位筛除掉男性应聘者。同样,一个把医生全都当作男性以及把护士全都当作女性的问题应答模型,当被用来理解医疗报告时,它提供的答案也会是错误的。

  3、早期的“硬去偏”方法

  之前的方法是通过后处理方式减少词嵌入中与性别相关的部分从而减少性别偏见。具体来说,它需要一系列与性别相关的词对,并计算这些词对的差分向量的第一主成分作为嵌入空间中的性别方向。然后将有偏词嵌入映射到与推测的性别方向正交的子空间中,以消除性别偏见。虽然此方法确实能够在单词类比任务中减轻性别偏见,但另一项工作《Lipstick on a pig: Debiasing methods cover up systematic gender biases in word embeddings but do not remove them》认为这种方法并不是特别有效,因为去偏后嵌入的几何图形中仍然存在性别偏见。

  4、词频会对性别方向产生负面影响

  在这篇论文中,我们假设现有的“硬去偏”方法很难确定词嵌入正确的性别方向。《Frage: Frequency-agnostic word representation》和《All-but-the-top: Simple and effective postprocessing for word representations》两项工作表明,词频会显著影响词嵌入的几何结构。例如,常用词和罕见词会聚集在嵌入空间的不同子区域,不过,这些聚集在同一个子区域的词在语义上并不相似。这会对性别方向的定义过程产生负面影响,从而降低“硬去偏”方法消除性别偏见的能力。通过经验可以证明,某些词的使用频率变化,会导致其对应的差分向量与其他词的差分向量之间的相似性发生显著变化,如下图所示。

  2

  “双硬去偏”方法

  这项工作中,我们通过消除词频对性别方向的影响来提高“硬去偏”方法的性能。由于词频会改变性别方向,我们提出运用“双硬去偏”法来消除词频对性别方向的负面影响。此方法的关键在于:使用硬去偏之前,将单词嵌入映射到一个中间的子空间中。回顾一下,我们前面讨论的硬去偏方法就是通过将嵌入空间转化为无特定性别的空间来降低性别偏见。

  同样地,在双硬去偏方法中,我们首先将所有的单词嵌入转换成一个与使用频率无关的子空间,在这样的子空间中,我们能够计算出一个更加准确的性别方向。更确切地说,我们试图找到一个能够分散性别方向计算的编码频率信息的维度。然后我们从词嵌入中沿着这个特定的维度映射出组件,从而获得修正的嵌入向量,再对其应用硬去偏方法。

  为了确定这个维度,我们利用具有高偏见的单词的聚类作为指标,迭代测试词嵌入的主成分。具体步骤如下:

  计算所有单词嵌入向量的主成分作为候选的频率维度。

  选择一系列高性别偏见的男性和女性词汇(如程序员,家务操持者,游戏,跳舞等)。

  分别对每个候选维度 重复步骤4-6。

  将词嵌入映射到一个与 正交的中间空间,从而得到修正的词嵌入。

  对修正的词嵌入应用"硬去偏"方法。

  高性别偏见的单词经过步骤5得到去偏嵌入,再聚类此去偏嵌入,然后计该聚类的精度。

  如果步骤6中的聚类算法仍然将具有性别偏见的单词按性别分成两组,则说明去除 并不能改善去偏效果。因此,我们可以筛选出导致有偏词聚类精度下降最显著的那个 ,然后将其删除。

  3

  “双硬去偏”方法 效果如何?

  我们在几个偏见消除基准上评估“双硬去偏”法,其中包括一个重要的下游任务——共指消解(coreference resolution)。

  我们使用WinoBias数据集来量化共指系统中的性别偏见。WinoBias由两种类型的句子组成,每种类型的句子都可以划分为一个对性别有刻板印象的子集和一个反性别刻板印象的子集。性别,是这两个子集之间唯一的区别。

  举例来说,第一类句子中包含了一种对性别有刻板印象的句子: “The physician hired the secretary because he was overwhelmed with clients”(医生雇佣秘书是因为他的病人太多了)。而反性别刻板印象的句子是“The physician hired the secretary because she was overwhelmed with clients”(医生雇佣秘书是因为她的病人太多了)。

  性别刻板印象子集和反性别刻板印象子集的表现差异,反映了共指系统对于男性群体和女性群体有哪些不同的表现,所以我们将这种差异度作为性别偏见分数。原始的GloVe嵌入具有显著的性别差异,我们可以从其性别偏见分数中看到两种类型的句子之间的差距:一个达到29分,而另一个只有15分。

  与“硬去偏”方法和其他先进的去偏方法相比,我们的方法在两种类型的共指句子中都实现了最小差异。同时,“双硬去偏”法也保留了词嵌入中有用的语义信息。在最初的测试集上,我们观察到F1分数只下降了0.1%。

  我们还对500个带有高性别偏见的女性/男性词嵌入进行 tSNE 映射。如下图所示,原始GloVe嵌入被清晰地映射到不同的区域,显示出强烈的性别偏见。与其他方法相比,双硬GloVe最大程度地混合了男性和女性嵌入,去偏后能捕获到更少的性别信息。

  4

  结论

  我们发现,词频统计上的一点小变化就会对词嵌入的性别去偏方法产生负面影响。在以往的性别去偏工作中,词频统计一直被忽视,而我们提出的“双硬去偏”法能够减轻词频特征对去偏算法的负面影响。

  我们相信,引入无性别偏见且实用的词嵌入是十分重要的,同时也希望通过我们的这项研究工作,能够激励这一方向出现更多研究工作。

  via https://blog.einstein.ai/double-hard-debias-tailoring-word-embeddings-for-gender-bias-mitigation/

  ACL 2020原定于2020年7月5日至10日在美国华盛顿西雅图举行,因新冠肺炎疫情改为线上会议。为促进学术交流,方便国内师生提早了解自然语言处理(NLP)前沿研究,AI 科技评论将推出「ACL 实验室系列论文解读」内容,同时欢迎更多实验室参与分享,敬请期待!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股:今天,6月23号,突然跳水,释放了重要信号!

A股:今天,6月23号,突然跳水,释放了重要信号!

明心
2026-06-23 12:05:00
乔欣变样了!标准富太太脸型

乔欣变样了!标准富太太脸型

书台小事
2026-06-23 19:26:06
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
内塔尼亚胡:至暗时刻

内塔尼亚胡:至暗时刻

西楼饮月
2026-06-22 23:22:06
为什么儿科要单独一个科室,网友:儿童医生不亚于半个兽医

为什么儿科要单独一个科室,网友:儿童医生不亚于半个兽医

另子维爱读史
2026-06-17 21:25:35
世界杯太残酷了:随着阿尔及利亚2-1,首支出局的亚足联球队诞生

世界杯太残酷了:随着阿尔及利亚2-1,首支出局的亚足联球队诞生

侧身凌空斩
2026-06-23 12:59:22
全球首发!华为刚曝光的新机,真的很猛啊

全球首发!华为刚曝光的新机,真的很猛啊

科技堡垒
2026-06-21 11:51:14
谷智鑫34岁因拍戏坠马瘫痪,女友照顾他8年,如今怎样了

谷智鑫34岁因拍戏坠马瘫痪,女友照顾他8年,如今怎样了

铁锤妹妹是只猫
2026-06-23 07:02:02
英格兰队主帅赛前发布会炮轰补水新规:它对比赛的改变超出想象 法国队主帅曾率先吐槽

英格兰队主帅赛前发布会炮轰补水新规:它对比赛的改变超出想象 法国队主帅曾率先吐槽

红星新闻
2026-06-23 14:57:55
他是杨采钰老公,福建某集团富三代,比她小帅气多金,郎才女貌

他是杨采钰老公,福建某集团富三代,比她小帅气多金,郎才女貌

以茶带书
2026-06-22 15:38:16
63岁李连杰父亲节晒父女合照,四个女儿全部出镜,长女长得像前妻

63岁李连杰父亲节晒父女合照,四个女儿全部出镜,长女长得像前妻

冷紫葉
2026-06-21 19:19:43
钱越来越难赚,社会上的“钱”都去哪了?曹德旺一语戳破当下现实

钱越来越难赚,社会上的“钱”都去哪了?曹德旺一语戳破当下现实

复转这些年
2026-06-22 04:30:15
男篮险胜荷兰!朱俊龙+2后卫齐爆,杨瀚森需调整,没继伟真不行!

男篮险胜荷兰!朱俊龙+2后卫齐爆,杨瀚森需调整,没继伟真不行!

篮球资讯达人
2026-06-23 21:19:32
爆红后隐婚生娃,如今彻底过气了?

爆红后隐婚生娃,如今彻底过气了?

寻艺
2026-06-23 20:16:20
连锁反应?字母哥交易后,火箭欲组最强3巨头,“711”有望再联手

连锁反应?字母哥交易后,火箭欲组最强3巨头,“711”有望再联手

篮球圈里的那些事
2026-06-23 17:11:41
男篮热身赛:中国5分险胜荷兰取连胜 廖三宁21+7杨瀚森复出7+8

男篮热身赛:中国5分险胜荷兰取连胜 廖三宁21+7杨瀚森复出7+8

颜小白的篮球梦
2026-06-23 21:21:20
小心那个娃娃脸!23岁女孩备考公务员迷上杀人,一度想杀自己父亲

小心那个娃娃脸!23岁女孩备考公务员迷上杀人,一度想杀自己父亲

三目观史
2026-06-21 20:00:43
“对于梅西,我已经无话可说了”

“对于梅西,我已经无话可说了”

新浪财经
2026-06-23 19:35:35
世界杯罕见,库拉索允许球员与伴侣同住,队医称有利于身心恢复

世界杯罕见,库拉索允许球员与伴侣同住,队医称有利于身心恢复

红星新闻
2026-06-23 08:47:34
没想到,马宁世界杯主哨首秀仅1天,竟在海外实现口碑逆转

没想到,马宁世界杯主哨首秀仅1天,竟在海外实现口碑逆转

观察鉴娱
2026-06-23 11:04:01
2026-06-23 22:52:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7388文章数 20758关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

看到热搜新闻查了下自己 男子结婚8年发现3娃均非亲生

头条要闻

看到热搜新闻查了下自己 男子结婚8年发现3娃均非亲生

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

屋顶光伏度苦夏

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

亲子
手机
本地
艺术
公开课

亲子要闻

雯雯弄坏了豌豆的气球,慌张地把气球藏到身后,豌豆问起来...

手机要闻

曝字节新一代豆包AI手机发布时间或延迟,主要原因与备案认证有关

本地新闻

吃一次广东龙舟饭,才懂什么是豪华盛宴

艺术要闻

大连世界级地标!2026夏季达沃斯主会场——“钢铁贝壳”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版