网易首页 > 网易号 > 正文 申请入驻

你以为在点「红绿灯」验证身份,其实是在给AI免费打工

0
分享至




机器之心报道

编辑:+0

如果这是下一代图形验证码,你怎么看?



视频链接:https://mp.weixin.qq.com/s/kfIHMEkAO8QU4wu8ecFuHg

感觉会经历无数遍「您对 CAPTCHA 的响应似乎无效。请在下方重新验证您不是机器人」,不知道猫主子们怎么想。

这是最近很火的一篇调侃「我不是机器人」验证流程的帖子。视频里显示,用户得用鼠标一个个点选那些灰色的「猫屎团」,拖到旁边的垃圾桶里,最后过关后,得勾选「我不是猫」。



这个帖子的互动量爆炸,浏览量达到了一百多万。

评论区里非常热闹,有人觉得这比识别界限模糊的红绿灯像素好多了。



也有人联想到美剧《人生切割术》里的数据精炼工作。



还有人开玩笑:「所以只有猫主子才是真正的人类。」



其中一个讨论热度很高:「图像验证是在帮 AI 训练数据,还免费。」



帮 AI 训练数据?这就要展开说说了。

众所周知,不管是注册账号还是发帖,验证码都是个必不可少的东西。它的「大名」叫 CAPTCHA,全称是「全自动区分计算机和人类的图灵测试」。它的作用,顾名思义就是区分人和机器人,避免机器人刷屏、刷票或搞破坏。

最早,其主要形式是扭曲的文字或图片。扭曲的程度,决定了它难不难被认出来。



但很快,一个叫 Luis von Ahn 的天才(他也是后来「多邻国」的创始人)站了出来。他发现全球每天有数亿人(现在是数十亿)在戳这些验证码,加起来浪费的时间高达数百万小时。这不纯纯浪费「人力脑循环」吗?



于是,一个「一箭双雕」的天才想法诞生了,它叫reCAPTCHA

这套系统从 v1 开始,就不是一个单纯的「保安」,它是一个「大型人力众包项目」。

系统每次会弹给你两个扭曲的单词,这两个词里,只有一个是系统知道答案的「控制词」,用来确定你是不是人。另一个「未知词」,才是谷歌的「私货」——它来自某个古老的、AI OCR(光学字符识别)啃不动的扫描版图书或报纸。

你根本不知道哪个是哪个,所以你会老老实实把两个都填对。

结果呢?全球网民在毫不知情的情况下,用这种「无意识劳动」,硬是把《纽约时报》从 1851 年以来的全部历史档案,和海量的「谷歌图书」项目,给一个词一个词地免费「转录」成了数字版。

但是,我们亲手「喂」出来的 AI(谷歌的 OCR),把老师傅(v1 文本验证)给「卷」死了。

到了 2014 年,谷歌自己都公开承认,自家 AI 破解最难的扭曲文本,准确率高达 99.8%。这背后是「卷积神经网络」(CNN)的功劳。学术研究(如 CapNet)早已证实,这类 AI 模型破解文本验证码的准确率普遍达到了 98% 甚至 100%,v1 防线在技术上已彻底失效。

  • 谷歌博客:https://security.googleblog.com/2014/04/street-view-and-recaptcha-technology.html

防线必须升级。于是,v2 图像验证来了。



这套「我不是机器人」你熟不熟悉?「选出所有汽车」、「选出所有交通信号灯」、「选出所有人行横道」。那么问题来了,几乎在同一时间(2014 年左右),谷歌在疯狂「烧钱」哪个项目?

没错,自动驾驶(Waymo)

一个自动驾驶 AI,最需要训练什么?当然是识别「汽车」、「交通信号灯」、「人行横道」和「自行车」。也就说,全球几十亿网民,在登录、注册、发帖时,都在免费为谷歌的自动驾驶 AI 打工。

这个「人类计算」项目有多庞大?有学者估算,在过去十几年里,人类贡献的这波无偿劳动,总价值超过 61 亿美元。

到了 2024 年,AI 终于「学成下山」,把第二个老师傅(v2 拼图)也给「干」翻了。

瑞士苏黎世联邦理工学院(ETH Zurich)的研究人员提交了一篇论文,题为「Breaking reCAPTCHA v2」(攻破 reCAPTCHA v2)。他们使用先进的 YOLOv8 物体检测模型,破解 v2 图像挑战的准确率达到了100%



  • 论文地址:https://arxiv.org/abs/2409.08831

这类模型之所以如此强大,正是因为它们在海量的、已被精确标注的数据集(reCAPTCHA v2 帮忙创建的那种)上训练出来的。

研究甚至表明,AI 解决这些难题的表现和人类「没有显著差异」。那你可能要问了:「既然 AI 都 100% 破解了,为啥我还在天天点那些该死的红绿灯?」

因为,那张拼图早就不是真正的防线了。

2024 年的这项研究同时证实了一个「公开的秘密」:reCAPTCHA v2 的真正命脉,在于对你隐私数据的分析。

还记得那个「我不是机器人」的复选框吗?谷歌的「先进风险分析引擎」根本不在乎你是否点击,而在乎你如何点击。它在后台疯狂「视奸」你的:

  • 鼠标轨迹:你的移动是平滑中带点「人气」的抖动,还是机器人的完美直线或瞬移。
  • 点击位置:你是点在方框中间,还是不偏不倚的正中心(机器人行为)。
  • 浏览器指纹:你的屏幕分辨率、插件、字体……
  • 谷歌 Cookie:这才是「大杀器」。一个长期登录谷歌账户、浏览记录「清白」的用户,远比一个刚清除 Cookie 或开着 VPN 的用户「更像人」。

这场攻防战在学术界早已白热化。

进攻方(AI 攻击):攻击者面临一个「先有鸡还是先有蛋」的问题:你需要一个 AI 求解器来自动收集海量样本,但你又需要海量样本来训练这个求解器。

答案是「生成对抗网络」(GAN)。研究指出,攻击者只需少量(例如 500 个)真实样本,就能训练一个 GAN。这个 GAN 的「生成器」会伪造新的验证码,而「判别器」则学习破解它们。这个过程可以无限地生成合成的训练数据,AI 攻击者的「军火库」就此建成了。

防守方(v3 转向):既然拼图守不住,防线就全面转向了 reCAPTCHA v3。它的学术术语叫「行为生物识别」(Behavioral Biometrics)。这才是 v3 的核心。

reCAPTCHA v3 彻底隐形,会在你访问的所有页面上运行,像个监工一样默默观察你的所有行为(鼠标、滚动、键盘节奏),然后给你打一个 0.0(机器人)到 1.0(人类)的「可信度分数」。

这个转向的代价是巨大的:

  • 隐私噩梦:这种大规模监控被指控为「间谍软件」,并与 GDPR 等隐私法规严重冲突。
  • 隐私悖论:你越是努力保护隐私(用 VPN、清 Cookie、用隐私浏览器),你就越拿不到「可信」数据,v3 给你的分数就越低,你就越「像个机器人」。
  • 「酷刑」级难度:唯一能制裁 AI 的方法,就是把拼图搞得巨难无比。结果,AI 没防住,反而把视障、听障或有阅读障碍的用户(Dyslexia)彻底锁在了门外。

那么,当 v3 的「行为监控」也因隐私问题和 AI 模拟而失效时,该怎么办呢?

还是前面那个 ETH Zurich 的研究团队,提出了一种最「黑客帝国」的方案:「对抗性 CAPTCHA」(Adversarial CAPTCHA)。



  • 论文标题:Seeing Through the Mask: Rethinking Adversarial Examples for CAPTCHAs
  • 论文地址:https://arxiv.org/abs/2409.05558v1

这个想法是利用 AI 的一个致命弱点:它们很容易被「对抗性样本」欺骗。这是一种人类肉眼看来毫无意义的「噪音」图像,但 AI(如 CNN)却会以 99.9% 的置信度将其误认为某个特定物体。



未来的验证码,可能不再是「你是否能解决人类的问题」,而是「你是否会犯 AI 才会犯的错误」。

所以,回到开头的那个「铲猫屎」验证码。

你以为你是在逗猫?没准,你是在给某个「AI 铲屎官」机器人,免费上岗前培训呢。或者,你是在向系统证明,你不会傻到去点击一张 AI 误以为是「猫屎」的电视雪花点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

大卫聊科技
2026-03-25 12:22:18
上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上观新闻
2026-03-24 13:32:07
白宫坚称美伊仍在谈判,威胁伊朗“切勿误判”;伊朗外长:美国谈论“谈判”无异于承认“失败”,伊朗放声开新战线

白宫坚称美伊仍在谈判,威胁伊朗“切勿误判”;伊朗外长:美国谈论“谈判”无异于承认“失败”,伊朗放声开新战线

每日经济新闻
2026-03-26 17:08:49
追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

喜欢历史的阿繁
2026-03-26 14:40:54
巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

巴萨旧将:当时赫莱布知道自己要离队,他往功能饮料里兑酒喝

懂球帝
2026-03-26 06:43:09
已删除!钟丽缇发文道歉:在孩子教育问题上有疏忽

已删除!钟丽缇发文道歉:在孩子教育问题上有疏忽

半岛晨报
2026-03-24 15:30:03
人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

荷兰豆爱健康
2026-03-23 01:42:20
疯了!有新联赛硬刚NBA!想抢詹姆斯约基奇!

疯了!有新联赛硬刚NBA!想抢詹姆斯约基奇!

柚子说球
2026-03-26 22:00:29
学医后才知道,保护心血管最好的运动,不是慢跑快走,而是这个

学医后才知道,保护心血管最好的运动,不是慢跑快走,而是这个

医学科普汇
2026-03-23 21:55:03
紫薇老公也是2cm

紫薇老公也是2cm

毒舌扒姨太
2026-03-24 22:44:57
美媒:万斯将出面

美媒:万斯将出面

极目新闻
2026-03-26 09:51:54
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
无人机真是中国领先吗?为何战场上被打下的,全都是中国无人机

无人机真是中国领先吗?为何战场上被打下的,全都是中国无人机

安安说
2026-03-19 13:00:22
重磅!新加坡国立大学原副校长,全职加盟清华大学

重磅!新加坡国立大学原副校长,全职加盟清华大学

TOP大学来了
2026-03-26 17:43:56
全国多地学校宣布:取消早读!家长:孩子每天多睡近一小时,早上吃饭也不慌了

全国多地学校宣布:取消早读!家长:孩子每天多睡近一小时,早上吃饭也不慌了

山西晚报
2026-03-26 17:30:54
德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

懂球帝
2026-03-26 15:59:41
1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

1965年,毛主席点名让彭德怀复出,背后有人拼命阻挠,这人后来判了18年

史海孤雁
2026-03-25 18:31:11
只剩6天!医保全国统一,41-61岁抓紧办这几件事,否则就晚了!

只剩6天!医保全国统一,41-61岁抓紧办这几件事,否则就晚了!

另子维爱读史
2026-03-25 22:09:07
“油价飙升至200美元”?特朗普团队被爆评估极端情景,白宫紧急否认

“油价飙升至200美元”?特朗普团队被爆评估极端情景,白宫紧急否认

第一财经资讯
2026-03-26 18:58:56
国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

零度眼看球
2026-03-26 07:23:48
2026-03-27 04:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12608文章数 142594关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
游戏
手机
艺术
房产

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

无障碍浏览 进入关怀版