网易首页 > 网易号 > 正文 申请入驻

你以为在点「红绿灯」验证身份,其实是在给AI免费打工

0
分享至




机器之心报道

编辑:+0

如果这是下一代图形验证码,你怎么看?



视频链接:https://mp.weixin.qq.com/s/kfIHMEkAO8QU4wu8ecFuHg

感觉会经历无数遍「您对 CAPTCHA 的响应似乎无效。请在下方重新验证您不是机器人」,不知道猫主子们怎么想。

这是最近很火的一篇调侃「我不是机器人」验证流程的帖子。视频里显示,用户得用鼠标一个个点选那些灰色的「猫屎团」,拖到旁边的垃圾桶里,最后过关后,得勾选「我不是猫」。



这个帖子的互动量爆炸,浏览量达到了一百多万。

评论区里非常热闹,有人觉得这比识别界限模糊的红绿灯像素好多了。



也有人联想到美剧《人生切割术》里的数据精炼工作。



还有人开玩笑:「所以只有猫主子才是真正的人类。」



其中一个讨论热度很高:「图像验证是在帮 AI 训练数据,还免费。」



帮 AI 训练数据?这就要展开说说了。

众所周知,不管是注册账号还是发帖,验证码都是个必不可少的东西。它的「大名」叫 CAPTCHA,全称是「全自动区分计算机和人类的图灵测试」。它的作用,顾名思义就是区分人和机器人,避免机器人刷屏、刷票或搞破坏。

最早,其主要形式是扭曲的文字或图片。扭曲的程度,决定了它难不难被认出来。



但很快,一个叫 Luis von Ahn 的天才(他也是后来「多邻国」的创始人)站了出来。他发现全球每天有数亿人(现在是数十亿)在戳这些验证码,加起来浪费的时间高达数百万小时。这不纯纯浪费「人力脑循环」吗?



于是,一个「一箭双雕」的天才想法诞生了,它叫reCAPTCHA

这套系统从 v1 开始,就不是一个单纯的「保安」,它是一个「大型人力众包项目」。

系统每次会弹给你两个扭曲的单词,这两个词里,只有一个是系统知道答案的「控制词」,用来确定你是不是人。另一个「未知词」,才是谷歌的「私货」——它来自某个古老的、AI OCR(光学字符识别)啃不动的扫描版图书或报纸。

你根本不知道哪个是哪个,所以你会老老实实把两个都填对。

结果呢?全球网民在毫不知情的情况下,用这种「无意识劳动」,硬是把《纽约时报》从 1851 年以来的全部历史档案,和海量的「谷歌图书」项目,给一个词一个词地免费「转录」成了数字版。

但是,我们亲手「喂」出来的 AI(谷歌的 OCR),把老师傅(v1 文本验证)给「卷」死了。

到了 2014 年,谷歌自己都公开承认,自家 AI 破解最难的扭曲文本,准确率高达 99.8%。这背后是「卷积神经网络」(CNN)的功劳。学术研究(如 CapNet)早已证实,这类 AI 模型破解文本验证码的准确率普遍达到了 98% 甚至 100%,v1 防线在技术上已彻底失效。

  • 谷歌博客:https://security.googleblog.com/2014/04/street-view-and-recaptcha-technology.html

防线必须升级。于是,v2 图像验证来了。



这套「我不是机器人」你熟不熟悉?「选出所有汽车」、「选出所有交通信号灯」、「选出所有人行横道」。那么问题来了,几乎在同一时间(2014 年左右),谷歌在疯狂「烧钱」哪个项目?

没错,自动驾驶(Waymo)

一个自动驾驶 AI,最需要训练什么?当然是识别「汽车」、「交通信号灯」、「人行横道」和「自行车」。也就说,全球几十亿网民,在登录、注册、发帖时,都在免费为谷歌的自动驾驶 AI 打工。

这个「人类计算」项目有多庞大?有学者估算,在过去十几年里,人类贡献的这波无偿劳动,总价值超过 61 亿美元。

到了 2024 年,AI 终于「学成下山」,把第二个老师傅(v2 拼图)也给「干」翻了。

瑞士苏黎世联邦理工学院(ETH Zurich)的研究人员提交了一篇论文,题为「Breaking reCAPTCHA v2」(攻破 reCAPTCHA v2)。他们使用先进的 YOLOv8 物体检测模型,破解 v2 图像挑战的准确率达到了100%



  • 论文地址:https://arxiv.org/abs/2409.08831

这类模型之所以如此强大,正是因为它们在海量的、已被精确标注的数据集(reCAPTCHA v2 帮忙创建的那种)上训练出来的。

研究甚至表明,AI 解决这些难题的表现和人类「没有显著差异」。那你可能要问了:「既然 AI 都 100% 破解了,为啥我还在天天点那些该死的红绿灯?」

因为,那张拼图早就不是真正的防线了。

2024 年的这项研究同时证实了一个「公开的秘密」:reCAPTCHA v2 的真正命脉,在于对你隐私数据的分析。

还记得那个「我不是机器人」的复选框吗?谷歌的「先进风险分析引擎」根本不在乎你是否点击,而在乎你如何点击。它在后台疯狂「视奸」你的:

  • 鼠标轨迹:你的移动是平滑中带点「人气」的抖动,还是机器人的完美直线或瞬移。
  • 点击位置:你是点在方框中间,还是不偏不倚的正中心(机器人行为)。
  • 浏览器指纹:你的屏幕分辨率、插件、字体……
  • 谷歌 Cookie:这才是「大杀器」。一个长期登录谷歌账户、浏览记录「清白」的用户,远比一个刚清除 Cookie 或开着 VPN 的用户「更像人」。

这场攻防战在学术界早已白热化。

进攻方(AI 攻击):攻击者面临一个「先有鸡还是先有蛋」的问题:你需要一个 AI 求解器来自动收集海量样本,但你又需要海量样本来训练这个求解器。

答案是「生成对抗网络」(GAN)。研究指出,攻击者只需少量(例如 500 个)真实样本,就能训练一个 GAN。这个 GAN 的「生成器」会伪造新的验证码,而「判别器」则学习破解它们。这个过程可以无限地生成合成的训练数据,AI 攻击者的「军火库」就此建成了。

防守方(v3 转向):既然拼图守不住,防线就全面转向了 reCAPTCHA v3。它的学术术语叫「行为生物识别」(Behavioral Biometrics)。这才是 v3 的核心。

reCAPTCHA v3 彻底隐形,会在你访问的所有页面上运行,像个监工一样默默观察你的所有行为(鼠标、滚动、键盘节奏),然后给你打一个 0.0(机器人)到 1.0(人类)的「可信度分数」。

这个转向的代价是巨大的:

  • 隐私噩梦:这种大规模监控被指控为「间谍软件」,并与 GDPR 等隐私法规严重冲突。
  • 隐私悖论:你越是努力保护隐私(用 VPN、清 Cookie、用隐私浏览器),你就越拿不到「可信」数据,v3 给你的分数就越低,你就越「像个机器人」。
  • 「酷刑」级难度:唯一能制裁 AI 的方法,就是把拼图搞得巨难无比。结果,AI 没防住,反而把视障、听障或有阅读障碍的用户(Dyslexia)彻底锁在了门外。

那么,当 v3 的「行为监控」也因隐私问题和 AI 模拟而失效时,该怎么办呢?

还是前面那个 ETH Zurich 的研究团队,提出了一种最「黑客帝国」的方案:「对抗性 CAPTCHA」(Adversarial CAPTCHA)。



  • 论文标题:Seeing Through the Mask: Rethinking Adversarial Examples for CAPTCHAs
  • 论文地址:https://arxiv.org/abs/2409.05558v1

这个想法是利用 AI 的一个致命弱点:它们很容易被「对抗性样本」欺骗。这是一种人类肉眼看来毫无意义的「噪音」图像,但 AI(如 CNN)却会以 99.9% 的置信度将其误认为某个特定物体。



未来的验证码,可能不再是「你是否能解决人类的问题」,而是「你是否会犯 AI 才会犯的错误」。

所以,回到开头的那个「铲猫屎」验证码。

你以为你是在逗猫?没准,你是在给某个「AI 铲屎官」机器人,免费上岗前培训呢。或者,你是在向系统证明,你不会傻到去点击一张 AI 误以为是「猫屎」的电视雪花点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蔡正元惹众怒,又有一人对蔡正元开火,大陆官媒正式定性蔡正元

蔡正元惹众怒,又有一人对蔡正元开火,大陆官媒正式定性蔡正元

沧海旅行家
2025-11-15 20:02:31
卓伟曝著名男星离婚已不可挽回,更多猛料曝光网友锁住目标,炸了

卓伟曝著名男星离婚已不可挽回,更多猛料曝光网友锁住目标,炸了

阿伧说事
2025-11-15 09:13:41
全运会女子50米蝶泳:张雨霏25秒61夺冠,斩获个人单项第2金

全运会女子50米蝶泳:张雨霏25秒61夺冠,斩获个人单项第2金

全景体育V
2025-11-16 19:09:41
壁虎不进寻常家,若家中出现壁虎,只因提醒这3件事千万不要看不懂

壁虎不进寻常家,若家中出现壁虎,只因提醒这3件事千万不要看不懂

古怪奇谈录
2025-10-14 12:09:36
风向大变!铁杆台独纷纷倒戈,回家才是正途

风向大变!铁杆台独纷纷倒戈,回家才是正途

起喜电影
2025-11-12 08:01:49
古力娜扎:很大!

古力娜扎:很大!

喜欢历史的阿繁
2025-10-19 08:51:29
一个很有意思的问题:城市极端缺水会发生什么?德黑兰给出答案

一个很有意思的问题:城市极端缺水会发生什么?德黑兰给出答案

全城探秘
2025-11-15 16:20:03
值得珍藏:可控核聚变+高科技+电力设备+毫秒用算+十五五概念等

值得珍藏:可控核聚变+高科技+电力设备+毫秒用算+十五五概念等

Thurman在昆明
2025-11-15 11:14:34
全运会乒乓:8项冠军已出炉!11月17日赛程公布,诞生团体8强

全运会乒乓:8项冠军已出炉!11月17日赛程公布,诞生团体8强

全言作品
2025-11-17 01:42:51
王宝强佟丽娅都想不到!陈思诚拿到最佳导演奖重重地感谢了王宝强

王宝强佟丽娅都想不到!陈思诚拿到最佳导演奖重重地感谢了王宝强

心静物娱
2025-11-16 11:18:26
孙颖莎惜败王曼昱,没想到她这样评价对手,还提到恩师,自己失落

孙颖莎惜败王曼昱,没想到她这样评价对手,还提到恩师,自己失落

马輈在解说
2025-11-17 02:28:24
卫冕+第4金!王曼昱连续2届决赛击败孙颖莎 关键暂停拿决胜1分

卫冕+第4金!王曼昱连续2届决赛击败孙颖莎 关键暂停拿决胜1分

颜小白的篮球梦
2025-11-16 23:16:33
致中国人死亡率全球第一的调味品,每家都在用,吃的时候要注意!

致中国人死亡率全球第一的调味品,每家都在用,吃的时候要注意!

博览历史
2025-08-29 19:01:06
官方:贝林厄姆当选与阿尔巴尼亚一役英格兰队内最佳球员

官方:贝林厄姆当选与阿尔巴尼亚一役英格兰队内最佳球员

懂球帝
2025-11-17 05:15:41
乌国防情报局奔袭6500公里,炸毁俄罗斯西伯利亚铁路导致运输中断

乌国防情报局奔袭6500公里,炸毁俄罗斯西伯利亚铁路导致运输中断

山河路口
2025-11-15 15:35:03
医生调查发现:经常吃辣椒的人,用不了多久,血管或有这4个变化

医生调查发现:经常吃辣椒的人,用不了多久,血管或有这4个变化

泠泠说史
2025-11-01 15:17:17
雷军真的急了!大周末发帖小米SU7很安全,翻出多篇文章自证清白

雷军真的急了!大周末发帖小米SU7很安全,翻出多篇文章自证清白

火山诗话
2025-11-16 15:33:35
快速将犯规“翻篇”,上海选手覃海洋获200蛙泳三连冠给自己打11分!

快速将犯规“翻篇”,上海选手覃海洋获200蛙泳三连冠给自己打11分!

上观新闻
2025-11-16 05:08:14
车晓的母亲王丽云太节俭了!北京街头被偶遇,座驾居然是20年前的

车晓的母亲王丽云太节俭了!北京街头被偶遇,座驾居然是20年前的

乐悠悠娱乐
2025-11-15 11:41:38
图赫尔:贝林厄姆被换下时很沮丧?因为他有一张黄牌

图赫尔:贝林厄姆被换下时很沮丧?因为他有一张黄牌

懂球帝
2025-11-17 04:39:47
2025-11-17 06:12:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11720文章数 142505关注度
往期回顾 全部

科技要闻

雷军,怒了!刚刚连发多条微博

头条要闻

中国公民需谨慎前往日本 四大原因披露

头条要闻

中国公民需谨慎前往日本 四大原因披露

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

健康
家居
亲子
本地
教育

血液科专家揭秘白血病七大误区

家居要闻

现代简逸 寻找生活的光

亲子要闻

一分钟教你判断孩子的咳嗽代表什么

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

教育要闻

大量的中小学校长不上课,绝对是教育资源的最大浪费!

无障碍浏览 进入关怀版