网易首页 > 网易号 > 正文 申请入驻

今日工资到账8美元?!AI行业剥削严重,ImageNet仅4%数据标记工人收入过最低线

0
分享至


  大数据文摘出品

  作者:Caleb

  尽管随着AI的普及,我们在生活中越来越依赖于人工智能,但“人工智障”的相关调侃也从来没有消失过。

  相信大家都知道,如果我们想要让AI准确识别出图中的鸟,我们需要在数据集中手动将这些照片标记为鸟,然后让算法和图像之间产生关联性的判断识别。


  要是小规模的实验性数据还好,一旦遇到那种规模多达数百万个的标记需求,个中消耗的时间真是难以想象。

  俗话说,哪里有需求,哪里就有市场。

  根据普林斯顿大学、康奈尔大学、蒙特利尔大学和统计科学研究所的联合调查,研究者们发现,这项标记工作大部分是由欧美国家以外的来自全世界各地的工人共同完成的

  论文中指出,类似数字经济公司Samasource等会大量雇用来自撒哈拉以南非洲和东南亚的廉价工人,让他们完成这些枯燥的工作,每天给他们支付8美元的薪水,同时这些公司每年能够收入上千万美元。


  论文链接:

  https://arxiv.org/pdf/2102.01265.pdf

  为ImageNet工作的工人只能拿到2美元时薪

  由于许多深度学习技术需要大量的数据来训练模型,数据标签的需求也日渐增加,超过80%的机器学习开发过程包括数据的收集、清洗和标签等工作。

  对于Uber和Alphabet等大型科技公司而言,这些服务显得更为重要。

  但是,当我们换个角度,尽管这些工人正在为当前最热的人工智能行业做出贡献,这些系统最终可能并不会直接惠及到他们所在的社区,更令人唏嘘的是,不少系统可能会对他们的种族或性别等产生带有偏见的判断

  比如ImageNet,这个大型公开的图像数据集可以说是人工智能历史上影响力最大的数据集之一了。

  研究者指出,为ImageNet标记的工人只能拿到2美元的时薪,只有4%的工人时薪超过了美国联邦最低工资标准的7.25美元。

  同时,由于ImageNet是使用WordNet进行注释的,根据一项名为“ImageNet Roulette”的实验指出,如果人们将照片提交给由ImageNet训练出来的神经网络,该神经网络将使用数据集中的标签来描述这些图片。

  但当人们在系统中输入的是他们最感兴趣的照片:自拍时,软件会输出一些种族主义和冒犯性的标签来进行描述


  虽然数据标签不像传统工厂劳动那样耗费体力,但不少工人们报告表示,他们的任务速度和数量是“令人疲惫”和“单调”的,因为他们必须严格按照客户的规格要求来标记图像、视频和音频。

  “幽灵工人”无谈判立场,基本权益也难以被保障

  近几年,在全球南部,不少本土科技公司大量涌现,比如肯尼亚的Fastagger、南非的Sebenz.ai和马来西亚的Supahands。随着人工智能发展不断扩大规模,这些公司的扩张也为低技能劳动者进入劳动力市场打开了大门,但相关的劳动剥削行为也仍然在发生着。

  研究者们将这些数据标记工人称为“幽灵工人”(ghost worker),因为外界往往看到的只是一个系统的高识别率,而忽略了这些工人为训练数据集做出的劳力工作。


  研究者们提出,在美国,这种低工资结构很大程度上是由于花在没有补偿的活动上的时间,比如从事一项最终会被拒绝的任务。

  这就引出了Amazon Mechanical Turk这样的平台在权力动态上的另一个问题。我们就以该平台为例,在这个平台上,所有的权力都集中在任务的请求者那边,请求者有权力设定他们预计的价格,这个价格可以低至0.01美元,同时请求者还可以回绝工人已经完成的工作,并声称该项任务所需的时间远远少于工人们花费的时间。

  在美国,处于这种工作中的标记工人往往被认为是独立承包商而非雇员,因此《公平劳动标准法》所保障的保护措施并不能在他们身上适用。

  讨论美国的相关情况只是因为这些数据是最容易获取的,在全球范围内,更糟糕的劳工现象只会更多。

  “流水线”工人正在成为企业的竞争力

  2018年,BBC记者Dave Lee走访了生活在肯尼亚贫民窟的标记工人,也发现了相同的问题。

  根据报道,生活在Kibera的单身母亲Brenda每天的工作内容就是把大多数的图像数据处理成计算机能够理解的形式。

  比如说,在一张上传的照片上,Brenda需要用鼠标跟踪出现的物体,包括人、车辆、路牌、车道、天空,还要特别说明是晴朗的还是阴霾的天空。把数百万张这样的图片输入到人工智能系统中,对于自动驾驶汽车这类产品而言,就能够提高系统的识别准确率。

  Brenda的工作环境也绝对称不上友好。她和所有的同事都挤在狭小的办公室里,整个工作她必须紧盯显示屏、放大图像,防止标错哪怕是一个像素。


  上级人员会检查他们的工作,如果没有达到要求,还需要返工

  当然奖励也是有的,速度最快、准确率最高的标记员的名字会出现在办公室多台电视机屏幕上,以兹鼓励。当然他们最喜欢的,还是商场的购物券。

  Samasource是他们最大的雇主,根据首席执行官Leila Janah表示,公司能够与谷歌等科技巨头建立合作关系,除了准确性和安全性之外,还有一个原因是他们拥有全球最廉价的劳动力,并且当地人迫切需要稳定的工作。

  当时,Samasource给出的日薪是9美元,他们希望借此帮助到那些日薪低于2美元、还需要从事地下工作的人。

  “确实,它有很高的成本效益”,Janah说,“但我们工作中的一个关键点在于,我们不会提供可能破坏当地劳动市场的薪酬水平。如果我们给出的薪酬过高,我们会给整个社会带来麻烦。比如,可能会对我们员工所生活的社区的住房成本、还有食物成本等带来潜在负面影响”。

  在论文中被提及的另一组织Masakhane,该组织致力于通过AI保护非洲语言。值得注意的是,Masakhane不会为AI研究者们标记数据,而是建立了一个为非洲大陆标记、研究和构建算法的社区

  官网上写道:“我们建议将AI开发视为经济发展的前进之路”,“此开发活动不应专注于低生产率活动,例如数据标记,而应专注于高生产率活动,例如模型开发/部署和研究”。

  最后,论文指出,对于这种现象,潜在的解决方案是将这些数据标记器简单地集成到AI开发过程中,而不是让他们作为流水线工人为每个图像进行标记来赚钱。如此,工人会获得公平的薪水,况且得益于他们的生活经验和专业知识,数据收集过程中的差异也能被很好的发现并解决,系统的整体准确率也将得到提升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐

71岁大爷一夜爆红!爱美女却不结婚、身家上亿却34年0花销、衣食住行全白嫖:人间清醒!

VIKAN薇
2021-04-22 19:32:23

英国决定把对华援助削减95%,英国网友反应出人意料

环球网资讯
2021-04-22 17:16:23

特斯拉“车顶维权被拘”当事人丈夫:妻子出来后,考虑下一步维权

楚天都市报极目新闻
2021-04-22 18:30:05

中兴通讯三高管开会时被带走,工会主席服50片安定后自首

大白财经观察
2021-04-22 22:11:20

宋佳曾弃胡歌好友,插足5婚导演,逼宫上位未果,如今却过成这样

潘幸知
2021-04-22 13:28:47

“京圈格格”的成名之路,和她背后消失的姐姐

扒圈主持人
2021-04-21 20:52:30

25岁帅气的农民工小伙,娶了40岁2婚女公务员,亲戚以为他傍富婆

纸鸢谈情感
2021-04-21 20:44:22

员工陪睡?东航:所谓“员工不雅聊天记录”纯属蓄意捏造恶意诋毁

和讯网
2021-04-22 19:38:06

老艺术家潘长江的口碑崩坏史

叨唠
2021-04-22 19:50:10

东航空姐被安排陪睡老总,露骨对话曝光

经济学黑板报
2021-04-22 15:50:52

风流半生,曾为TVB当红小生的他,为何情归一名内衣模特?

周冲的影像声色
2021-04-22 12:31:29

英国突宣布关于中国的消息、全世界都沉默了…

南部身边事
2021-04-22 17:10:12

蒋欣,你真的没有“主角命”吗?

青石电影
2021-04-21 18:23:19

警钟|抱团腐败 医术虽高难自医

中央纪委监察部网站新闻
2021-04-21 08:12:13

初次去男友老家,凌晨我钻进他被窝,第二天他说一话我痛哭流涕

宇文读书
2021-04-22 20:40:39

上海台6大主持为刚出狱首富站台?称阵容堪比春晚,被曝全遭封杀

社会de记忆
2021-04-22 17:04:37

火化炉都烧化了!印度苦苦哀求美国无果,中国外交部承诺掷地有声

耿直小粒
2021-04-23 01:42:07

让员工陪睡领导?中国东方航空回应了

世界你好
2021-04-22 22:14:24

香奈儿起诉华为索赔千亿!欧洲法官落槌判决,给中企上了生动一课

溦溦看天空
2021-04-22 21:52:37

“娱乐圈第一女奴”人设崩塌,表面贤妻良母,背后却是另一副嘴脸

周冲的影像声色
2021-04-22 22:19:22
2021-04-23 05:37:07
大数据文摘
大数据文摘
专注大数据,每日有分享!
4237文章数 85897关注度
往期回顾 全部

科技要闻

特斯拉最新回应:愿意接受任何权威机构检测

头条要闻

央视记者暗访外卖厨房:徒手抓熟食 蟑螂地上爬行

头条要闻

央视记者暗访外卖厨房:徒手抓熟食 蟑螂地上爬行

体育要闻

意甲-因西涅双响默滕斯破门 那不勒斯5-2拉齐奥

娱乐要闻

气质女神!高圆圆穿绿衣 清新优雅

财经要闻

汽车要闻

福特EVOS将四季度上市 全新设计理念造型出众

态度原创

本地
手机
游戏
健康
旅游

本地新闻

取悦自己的方式有很多,哪种戳中了你的“爽点”?

手机要闻

一加9R体验:“打游戏最牛的品质旗舰机”所言不虚

老滚MOD改编《遗忘之城》延期至今夏发售

HPV和TCT检查要一起做吗

旅游要闻

为你推荐15条又美又虐的户外线!