网易首页

注册免费邮箱

网易首页 > 网易科技 > 网易科技 > 正文

AI是如何检测色情片的？

2019-02-23 13:42:05　来源: AI科技大本营举报

0

分享至

2018年12月17 日，Tumblr(汤博乐)网站宣布即日起全面禁止色情内容。当这项新的政策实施了两周后，就立马暴露出了问题。在Tumblr的人工智能系统成功部署后，它对一些中立的内容进行了错误标记，导致该网站的4.554亿个博客和1662亿个帖子无辜躺枪。它们的内容仅包含花瓶、女巫、鱼类以及介于它们中间的所有内容。

目前该公司并未对此有任何回应，也不清楚Tumblr使用的是何种内容过滤技术，或者是否创建了自己的内容过滤系统，但显然，社交网站在政策和技术方面都陷入了困境。例如，关于“女性乳头”和“艺术裸体”的外延，Tumblr 认为是取决于上下文语境，这透露出Tumblr自己也不确定它想要在平台上禁止什么内容。也难怪，站在企业的立场，究竟该如何定义“淫秽”内容呢？

如果难以定义，就很难阻止“淫秽”内容

首先，定义“淫秽”本是个陷阱。历史可以追溯到1896年左右，当时美国首次通过规范“淫秽”的法律。1964 年，“雅各贝利斯诉俄亥俄州”一案中，关于俄亥俄州是否可以禁止出演著名的路易·斯马勒（Louis Malle）电影，最高法院给出了可能是迄今最著名的有关“硬核色情”的一句话。

“我今天不打算进一步去定义我所理解的那种在速记中被包含的内容，‘硬核色情片’，也许我永远也不会成功地做到这一点。但我知道，当我看到它的时候，它的动作画面就不是这样了。” 法官波特·斯图尔特在他的赞同意见中如是说。

机器学习算法也处于同样的窘境，这是Picnix（一家提供定制化AI服务的公司）?的首席执行官Brian DeLorge正试图解决的问题。Iris是其产品之一，专门用于检测色情内容的客户端应用程序。正如DeLorge所说，“谁不希望生活中有点色情内容？”他指出另一个问题，色情片可以是很多不同的东西，但色情与非色情图像会共享相似的图像特征。

一张海滩上派对的照片可能被封杀不是因为它上面展现的皮肤比一张办公室的照片更多，而是因为它触碰到色情图像的边缘线了。“这就是为什么很难将图像识别算法训练成一种可广泛应用的解决方案，”DeLorge继续说到，“如果关于“淫秽”的定义对人类来说很困难，那对机器学习技术来也同样如此。”如果人们无法就色情是什么达成一致，那么AI是否有望学习里面的差异呢？

教 AI 如何检测色情片，第一件事就是收集色情片作为训练集

网上有很多的色情片。在哪里可以得到它们呢？ “人们经常从Pornhub、XVideos等网站下载，”Lemay.ai的联合创始人兼首席技术官Dan Shapiro说到。Lemay.ai是一家为其客户创建 AI 过滤技术的初创公司。“这是一个合法的灰色地带，但如果你正在使用其他人的内容进行训练，（训练）结果是否属于你？”

从你最喜欢的色情网站获得训练数据集之后，下一步是从色情的视频中删除所有不是色情内容的帧，以确保你正在使用的帧不是像一个拿着披萨盒子的人。平台会向大多数美国以外的人付费，来标注这些内容。这通常是一个低工资的重复劳动，就好像那些每次填一个验证码的工作。Dan Shapiro说到，“他们只是标注像‘这种色情片’或‘那种色情片’。通常你还可以再过滤一下，因为色情片上已经有很多可用的标签了”。当你使用不仅仅包含色情内容的大数据集时，训练效果往往会更好。”

Shapiro说：“很多时候，你不仅需要过滤色情内容，而且也需要过滤掉与色情内容相近的东西。像人们贴出的这些虚假档案，一张女孩的照片，一个电话号码。”在这里，他指的是寻找客户的性工作者，但很容易就被误认为是合法问题。“这不是色情片，但它是你不想放在平台上的东西，对吗？”一个好的自动化的检测模型至少需要在数百万级的内容上进行训练，这意味着需要投入大量的人力。

“这就类似于孩子和成年人间的不同，”Clarifai的创始人兼CEO?Matt Zeiler说道，Clarifai是一家为企业客户提供图像过滤的计算机视觉创业公司。“我可以说这是事实，几个月前我们刚生了一个孩子。他们对这个世界一无所知，一切都是新的。“你必须向宝宝展示很多东西，以便他们学习。“你需要数以百万计的例子，但对于成年人，由于现在我们已经拥有了很多关于世界的背景知识，并理解它是如何运作的，我们只需要几个例子就可以学到新东西，”他说。

上述文字解释一遍就是：训练AI系统来过滤成人内容，就好比向宝宝展示大量的色情内容。

今天，像Clarifai这样的人工智能技术供应商已经成长起来了。他们对世界有很多基础知识，也就是说他们知道狗是什么样，猫是什么样，什么是树，什么不是树，以及最重要的，什么是裸体，什么不是裸体。Zeiler的公司使用自己的模型为其客户训练新模型，因为原始模型已经能处理很多数据，因此定制的版本仅需要来自客户的新训练数据，就能启动和运行。

人工智能算法的判断不一定准确?

对明显是色情的内容，分类器效果很好；但它可能会错误地将内衣广告标记为色情，因为图片中的皮肤比例更多。（例如，分类器很难正确分辨比基尼和内衣。）这意味着做标签的人必须对那些模棱两可的训练集更细心，需要优先考虑模型难以分类的内容。那其中最难的一个例子是什么呢？

“动漫色情片。我们的第一版色情检测算法没有接受过任何卡通色情内容的训练。”很多时候人工智能系统会失败，因为它不理解什么是变态。“因此，一旦我们为该客户做这样的工作，我们就将大量数据整合到模型中，就大大的提高了检测漫画的准确性，并同时保持了在真实照片上的检测准确率，”Zeiler说。“你不知道你的用户会做什么。”

用来检测色情片的技术也可以用来检测其他东西。系统的基础技术非常灵活。这个灵活度比得上动漫里夸张的胸部。Perspective，是一个来自 Alphabet's Jigsaw的被广泛用于报纸自动评论的模型。

Jigsaw的沟通主管Dan Keyserling说，在Perspective之前，“纽约时报”只对大约10％的作品发表评论，因为他们的版主可以在一天内处理的数量有限。他声称Jigsaw的产品可以使这个数字增加三倍。该软件与图像分类器的工作方式类似，不同之处在于它对“毒性”进行排序，它们定义“毒性”为某人可能会根据评论而不是色情进行的对话。（毒性在文本评论中同样难以识别，就好比识别图像中的色情图像。）再比如，Facebook使用类似的自动过滤技术来识别有关自杀的帖子和内容，并试图利用该技术在其庞大的平台上发现虚假新闻。

整个事情仍依赖于标记数据才能发挥作用

Zeiler并不认为他的产品会让任何人失业。它本来就是在解决互联网上的“尺度问题”。一个婚礼博客Clarifai使用其产品来进行自动化的内容审核，而以前负责审批图像的编辑则转向从事定性标记的任务。这并不是要降低自动化下真正的人力成本。人们必须对AI进行训练，并对内容进行分类然后进行标记，以便AI能够识别哪些不能或可能导致创伤后应激障碍（PTSD）。

这才是未来应有的样子：公司提供个性化，现成的解决方案，使其全部业务能够在越来越多的数据上训练更好的分类器。就像Stripe and Square为不想在内部处理支持的企业提供现成的支付解决方案一样，而AWS已经确立了自己作为托管网站的地位，像Zeiler的Clarifai、DeLorge的Picnix、Shapiro的Lemay.ai等创业公司正在争相成为在线内容审核的一站式解决方案提供商。Clarifai已经拥有适用于iOS和Android的软件开发套件，Zeiler表示正在努力让产品在物联网设备（如安全摄像头）上运行，但实际上，那意味着每个设备上都需要有优化的AI芯片或足够的终端计算资源。

Lemay.ai的Dan Shapiro满怀希望。“与任何技术一样，它还没有完全发明成功，”他说。“所以这样做是不合理的，就好比我对一家公司的安排不满意，就开始想着放弃。”但无监督学习是否是一条好的出路？这就比较费解了。他说：“你需要从某些地方获得训练数据”，这意味着总会涉及到人的因素。“不过这是一件好事，因为它会减轻人们的压力。”

另一方面，Zeiler认为AI终有一天能够自己适应一切。他说：“我认为很多人的努力方向将转变为人工智能今天无法做到的事情，比如高级推理、自我意识，就像人类所拥有的那样。”

识别色情片就是其中的一部分。识别它对于人来说是一项相对简单的任务，但训练算法识别其中的细微差别却要困难得多。弄清楚检测模型将图像标记为色情或非色情的阈值也很困难，而且还受到数学上的限制。该函数称为精确-召回率曲线（precision-recall curve），它描述了模型返回结果的相关关系，但是人类需要的是灵敏度。

正如Alison Adam在其1998年出版的《人工知识：性别与机器思维》一书中提到的那样，无论是学习、在空间中移动和互动、推理，还是使用语言，AI的目的是“模拟人类智能的某些方面”。AI是我们如何看待世界的一个不完美的镜子，就像色情是当两个人独处时的反应一样：它可以说是一种片面性的真理，但却不是整个全貌。

参考链接：

https://www.theverge.com/2019/1/30/18202474/tumblr-porn-ai-nudity-artificial-intelligence-machine-learning

本文来源：AI科技大本营责任编辑：姚怿立_NBJS7522

相关推荐

热点推荐

经典之作PPO算法：曾被NeurIPS拒了

机器之心Pro 2026-06-22 11:02:18
0 跟贴 0
风行CEO易正朝：真正的全产业杀手应用是AI编程，相比AI视频，AI编程对企业经营的意义更大

量子位 2026-05-21 08:05:56
0 跟贴 0

给大学生推荐一些零基础的 AI 学习资源适用于任何专业的朋友

清华皓同学 2026-06-21 01:29:49
0 跟贴 0

让你的龙虾秒变电影《Her》里的Samantha，AI产品经理分享培养情感陪伴虾

量子位 2026-03-25 20:15:20
0 跟贴 0
AI实时渲染的无限流可视化浏览器Flipbook

量子位 2026-05-02 18:24:35
0 跟贴 0

安心养虾！从OpenClaw 看云上AI安全落地路径

量子位 2026-04-18 19:55:39
0 跟贴 0

未来的汽车拼的是脑子

长三角momo 2026-06-22 10:21:13
1 跟贴 1
我的新上班搭子，居然是个超靠谱的AI-5

机器之心Pro 2026-04-18 06:59:00
0 跟贴 0

AI谄媚可能让人陷入妄想症

量子位 2026-04-08 12:28:40
0 跟贴 0
CMU等团队让AI生成的3D场景真正站得住

机器之心Pro 2026-05-05 13:51:56
0 跟贴 0
邱锡鹏：未来我们一定会进入泛情境智能时代

量子位 2026-05-21 08:04:26
0 跟贴 0
Kinect：游戏机外设如何成为科研神器？

量子位 2026-01-21 00:24:22
0 跟贴 0
1700万人围观卡帕西的AI知识库：能自动更新，还越用越聪明？

机器之心Pro 2026-04-07 18:39:49
0 跟贴 0
ai演绎：你和她分别是什么臀型？

是小明同学 2026-06-20 15:51:35
3 跟贴 3
博士生如何用龙虾做知识管理？

量子位 2026-03-26 19:32:47
0 跟贴 0
代码放权与算法收权：数智时代领导者如何用“智能合约”激活组织自驱引擎

经济观察报 2026-06-22 09:08:04
0 跟贴 0
马斯克预判中国AI2027年追平Fable。智谱唐杰反驳：用不了那么久

究竟视频 2026-06-21 01:07:24
85 跟贴 85
两大核武国家，“水仗”升级

中国新闻周刊 2026-06-21 19:23:56
5265 跟贴 5265
按这算法，裤兜子都让算没了呀

我爱大长腿 2026-06-19 13:58:56
0 跟贴 0
大学生实习日薪180元弄丢客户6.5万元劳力士表

极目新闻 2026-06-21 14:57:13
5343 跟贴 5343
2比2战平乌拉圭！佛得角再造冷门，手握出线主动权

澎湃新闻 2026-06-22 08:06:28
5002 跟贴 5002
“造人”这事，小鹏理想走到一起了

汽车公社 2026-06-22 11:17:35
0 跟贴 0
杰张昊爆砍分篮板！张昊化身成机器人小卡，徐杰记三分

小朋友手工 2026-06-20 00:22:35
0 跟贴 0
从眼控到脑控，蔡磊化身“赛博躯体”称将把意识传送到具身机器人

第一财经资讯 2026-06-21 15:40:24
695 跟贴 695
花2W挖来的机械工程师，机器人地轨调试现场，大家评评值不值

机器人第七轴研发 2026-06-21 18:27:00
0 跟贴 0
"被球员围攻"冲上热搜第一两队不满判罚被马宁驱散

南方都市报 2026-06-21 14:57:19
630 跟贴 630
美媒：“这是美国的耻辱时刻”

上观新闻 2026-06-22 06:09:38
125 跟贴 125
仅百户的别墅小区50多户存在违建航天御苑小区业主：把一个高端别墅小区变得像城中村

华商网 2026-06-22 09:26:16
30 跟贴 30
高考成绩发布在即！填报志愿前先看这份指南

齐鲁壹点 2026-06-22 07:18:20
40 跟贴 40
刘强东：未来不需要快递员，计划送70万蓝领兄弟，去学习机器人维修、保养

究竟视频 2026-06-22 06:19:21
1 跟贴 1
深圳230亿IPO敲钟，这两家机构成最大赢家

36氪 2026-06-22 11:31:01
0 跟贴 0
那些存在上古互联网中的超自然现象，通过AI加强影像后看清了

来自星星的小胖子 2026-06-21 16:04:48
0 跟贴 0
乌克兰三位前总统宣布退还波兰白鹰勋章

参考消息 2026-06-21 20:56:05
277 跟贴 277
省内首创！山东中医药大学推出3+5贯通模式优秀初中生可直读中医本科

闪电新闻 2026-06-21 14:56:36
355 跟贴 355
微信终于要给 AI 手机开门了｜AI 器物志

爱范儿 2026-06-22 12:10:51
0 跟贴 0
让你的龙虾秒变电影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟贴 0
东风-17发射状态首次公开多车齐射场面硬核

环球网资讯 2026-06-22 08:05:35
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
中方将10家美国实体列出口管制管控名单

财联社 2026-06-22 09:05:08
208 跟贴 208
为了逃避考试，他发明了最好的压缩算法，zip的历史可谓一波三折

量子位 2026-04-29 06:41:21
0 跟贴 0

告诉孩子，高中阶段，除了学习，其他一切全都应放下

告诉孩子，高中阶段，除了学习，其他一切全都应放下

好爸育儿

2026-06-22 08:35:17

NBA首笔交易诞生！雷霆送走悍将省6100万

NBA首笔交易诞生！雷霆送走悍将省6100万

老玮是个手艺人

2026-06-22 12:14:13

青木已同意转会罗马，揭曼联分成细节！奥纳纳新买家曝光队友失望

青木已同意转会罗马，揭曼联分成细节！奥纳纳新买家曝光队友失望

罗米的曼联博客

2026-06-21 12:10:46

徐帆回应离婚才9个月，68岁冯小刚和养女贴脸拍照亲密，关系很好

徐帆回应离婚才9个月，68岁冯小刚和养女贴脸拍照亲密，关系很好

沧海一书客

2026-05-31 18:08:08

正常人可以偶尔偷吃一颗伟哥吗？有什么副作用？本文为你讲出实情

正常人可以偶尔偷吃一颗伟哥吗？有什么副作用？本文为你讲出实情

健康科普365

2026-05-09 21:05:04

逼杜锋退位？崔永熙轰国家队生涯最强一战，为郭士强执教广东铺路

逼杜锋退位？崔永熙轰国家队生涯最强一战，为郭士强执教广东铺路

绯雨儿

2026-06-22 14:00:12

血糖传感器故障致身体崩溃兹维列夫：九年从未见过如此大错

血糖传感器故障致身体崩溃兹维列夫：九年从未见过如此大错

星河漫山野

2026-06-22 00:52:44

真惨！社保基金新进四家行业龙头公司，全部被深套，最高跌幅45%

真惨！社保基金新进四家行业龙头公司，全部被深套，最高跌幅45%

时尚的弄潮

2026-06-21 13:04:36

多支球队2连败！目前已经确定淘汰出局，这些球队要回家了

多支球队2连败！目前已经确定淘汰出局，这些球队要回家了

体坛狗哥

2026-06-21 18:36:36

孙杨踩缝纫机也要耍大牌！

八卦疯叔

2026-05-01 09:45:19

既然双锤这么厉害，为啥《三国演义》《水浒传》没有一个人用双锤

既然双锤这么厉害，为啥《三国演义》《水浒传》没有一个人用双锤

小院之观

2026-06-21 19:01:51

大胜澳大利亚不足一小时！郭士强官宣：中国男篮最强援后天出战

大胜澳大利亚不足一小时！郭士强官宣：中国男篮最强援后天出战

童叔不飙车

2026-06-22 01:04:33

2026年，结婚人数又破纪录了！

2026年，结婚人数又破纪录了！

巢客HOME

2026-06-21 07:20:07

挑衅升级！菲军舰侵闯、军机飞越黄岩岛，中菲在黄岩岛爆发对峙

挑衅升级！菲军舰侵闯、军机飞越黄岩岛，中菲在黄岩岛爆发对峙

董董历史烩

2026-06-22 11:44:41

2换1交易！雷霆老鹰交易评价，威金斯就换了这？

2换1交易！雷霆老鹰交易评价，威金斯就换了这？

篮球实录

2026-06-22 13:16:40

名校光环失效？上海交大冷门专业应届出路腰斩

名校光环失效？上海交大冷门专业应届出路腰斩

户外阿毽

2026-06-22 09:48:18

王守业贪污1.6亿，2005年“双规”后却被放出，他叫嚣：我摆平了

王守业贪污1.6亿，2005年“双规”后却被放出，他叫嚣：我摆平了

帝哥说史

2026-06-02 21:40:03

莫斯科浓烟遮天蔽日的样子，连在俄中国人都被震撼到了

莫斯科浓烟遮天蔽日的样子，连在俄中国人都被震撼到了

小小科普员

2026-06-21 02:18:56

纸尿裤事件反转再反转，监管部门这个裁判不能“躲在背后看大戏”

纸尿裤事件反转再反转，监管部门这个裁判不能“躲在背后看大戏”

评底郭

2026-06-21 23:21:10

中学老师齐黎明心梗去世，年仅37岁，学生家长：不舒服仍坚持上课

中学老师齐黎明心梗去世，年仅37岁，学生家长：不舒服仍坚持上课

180视角

2026-06-22 11:17:28

网易新闻

iOS

Android

科技要闻

智谱盘中狂飙超40%，市值破万亿港元

头条要闻

南派三叔新剧上线10分钟被盗版还遭盗版者私信嘲笑

头条要闻

南派三叔新剧上线10分钟被盗版还遭盗版者私信嘲笑

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

韩红帮冯小刚宣传，结果翻车了…

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

全面提升全新理想L8 livis将家用舒适再进化

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

教育

艺术

手机

军事航空

数码要闻

多款电脑机型近一月上涨千元！经销商：一天一个价根本不敢囤货

教育要闻

动动脑，请问赚了还是赔了

艺术要闻

冷军人物油画写生8幅

手机要闻

从串行到并行 vivo X Fold6原子工作台解放移动生产力

军事要闻

东风-17发射状态首次公开多车齐射场面硬核

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版

×