网易首页 > 网易号 > 正文 申请入驻

你的验证码又升级了:虐完人类不过瘾,现在要收拾 AI 了

0
分享至

没人喜欢被白嫖,整个互联网都一样。

就在昨天,互联网基础设施巨头 Cloudflare 宣布了一项新举措:默认拦截所有未经许可的 AI 网络爬虫(crawler)对网站内容的抓取。换言之,AI 公司想要抓取网页数据训练模型,必须先征得网站所有者的同意,否则将被挡在门外。

这一系列举措无疑在业界引起震动——对于需要全网搜刮数据的大模型开发厂商来说,免费任吃、数据不要钱的好日子,或许没几天能过了。

从 7 月初开始,每一个新接入 Cloudflare 的站点都会被询问是否允许 AI 爬虫访问,其默认设置为拒绝,这等于给网站赋予了一键封禁 AI 抓取的权力。同时,Cloudflare 还推出了「按次付费爬取」的新模式,网站出版商可以选择向 AI 爬虫收取抓取内容的费用。

版权的战争打了这么久,凭什么这家公司一出声,就变得大件事了?

因为这是 Cloudfare,这是真正的互联网「保安」。

验证码变形记:Cloudflare 如何拦住AI爬虫

要理解 Cloudflare 此举的意义,先得弄清它究竟在做什么。

传统的验证码(CAPTCHA)相信大家都不陌生:比如让用户选出图片中所有的红绿灯,或输入扭曲的字符,以此区分「你是人还是机器人」。

一度,验证码演化到了一种复杂死人的程度,别说机器人,正常人也要花上好几分钟才能解完:

2022 年,Cloudflare 推出了 Turnstile 新一代的「无感验证」方案。

当你打开某些网站时,可能会看到一句「正在验证浏览器,请稍候」,几秒后自动放行——这背后就是 Turnstile 在检查你的浏览器环境、鼠标移动轨迹、页面操作等数据,以确定访问者是活生生的人类,而非脚本程序。

Cloudflare 强调,这种验证对真人几乎是隐形的:没有烦人的拼图对齐和「找不同」大战,甚至连多余的点击都不需要。2023 年时他们还宣布要彻底淘汰视觉谜题式验证码,承诺不再以任何理由给任何人看乱七八糟的拼图

的确,新一代的 Turnstile 验证既保障了安全,又让用户几乎无感知通过,可谓一个隐形的守门人,在真人用户和自动程序之间筑起一道分界线。

以往,验证码主要用来防范批量注册、刷票、薅优惠券这种脚本行为。但在 AI 大模型时代,验证码扮演的角色更加吃重,因为无处不在的 AI 爬虫正试图把整个互联网当作自助餐。

各个 AI 爬虫爬取的数据量. 图片来自:Cloudfare

Cloudflare 的验证系统则从设备完整性证明出发升级,结合行为分析、浏览器指纹和机器学习模型,来识别访问者是正常用户、良性爬虫,还是伪装的 AI 抓取工具。

一旦判定某次访问属于未经授权的自动抓取,Cloudflare 要么让其陷入无限验证环节,要么干脆直接阻断。

技术拦不住,法庭再相见

Cloudfare 为什么这个时候出来选边站?

作为全球领先的 CDN 和网络安全服务商,Cloudflare 在 2023 年的报告中估计,它每天要应对万亿级别的网络请求,直接处理了全世界约 16%的互联网流量,占据着全球约五分之一的网络流量。

2024 年通过 IPv4 互联网流向 Cloudflare 的流量聚合情况

当这样一个守门员开始对 AI 说「不」,其影响可想而知——而眼下,AI 厂商在版权战争中占取上风,接二连三地赢下诉讼。

Anthropic 在使用了数百万本书籍训练模型后,被告上法庭。最近出炉的裁决认为,他们的行为符合「合理使用」的原则——这项法律原则允许在某些情况下,无需获得所有者许可即可免费使用受版权保护的内容。

Meta 也打了胜仗。在应对作家们的集体诉讼中,加州联邦法庭裁定 Meta 胜诉。不过,这个胜利来得比较侥幸,能胜主要是因为原告的「诉讼点」提得不够好,在法律层面不够有力,因此法官也表示「这项裁决并不代表 Meta 使用受版权保护的材料训练其语言模型是合法的。

找个好律师真是很重要啊。

在 AI 模型对网页内容的胃口与日俱增的背景下,验证码系统俨然成为抵御「大数据采集狂魔」的一道防线。如果没有这层把关,AI 爬虫们恣意爬网的行为不仅可能把网站服务器搞得不堪重负(它们的高频抓取甚至被比作 DDoS 攻击),内容创作者的成果,更加是在不知情间就被拿去「喂 AI」。

如今有了 Cloudflare 的拦截机制,网站主至少有了一套可以用来自我保护的武器。

互联网格局如何改变

对于普通网民来说,这场关于 AI 爬虫的风波听上去很「大」,但日常上网时的体验并不会有明显变化。

Cloudflare 的 Turnstile 验证本就以「隐身」著称,不会像旧式验证码那样频繁跳出来考你识别交通灯和楼梯。因此,即便现在把 AI 爬虫视作众矢之的,也不代表我们上网时要遭更多复杂考验——Cloudflare 不会开倒车。

倒是那些试图冒充人类的 AI 爬虫们,恐怕要开始头疼如何通过这道检验了——换句话说,验证码系统的功能重心已经悄然转变。

以前,网站加验证码主要是为把关「脚本」和恶意机器人,而现在 Cloudflare 明显是在有意识别并阻挡特定的 AI 爬虫。

有数据显示,Cloudflare 的自动化识别技术可以准确地区分真人流量和 AI 爬虫流量,这表明其验证码背后的目标已从一般性防护升级为专门针对 AI 数据抓取。可以说,原本验证人机的「小考」,如今背后多了一层「筛查 AI」的使命。

在我们看来页面秒开、一片风平浪静时,Cloudflare 早已在背景里盘查过:「这是正常人类,通过」;「那是 GPT 的爬虫,拦下来」。这种场景,如今每一分每一秒都在互联网的底层跑道上真实上演。

这样高调封杀未授权 AI 爬虫,表面理由是为内容创作者讨回公道——毕竟 AI 公司过去一直在大吃特吃「霸王餐」,侵占内容却不给创作者流量和报酬,即便后者闹到法庭上,也不见得能求得公道。

不过,与此同时,Cloudflare 顺势推出了让 AI 公司付费爬取内容的功能和平台,实行按次付费爬取 (Pay Per Crawl) 的方式。这项新功能允许特定出版商和创作者向 AI 公司收取访问其内容的费用。参与者可以为单个爬虫程序设定价格,从而完全控制其作品如何以及是否用于 AI 模型训练。

这意味着 Cloudflare 正在将自己的安全防护网,升级为 AI 时代的「收费关卡」。以前 AI 爬虫横行时,内容网站几乎无从谈判,AI 公司想抓就抓,顶多背负一些道德谴责。而现在,Cloudflare 替网站堵上了大门,让 AI 公司不得不停下来说:能不能让我进来抓点数据?价格好商量。

这种转变无疑改变了网络内容的利益分配格局,为出版社、媒体、创作者等网站主提供了筹码。而 Cloudflare 则居中扮演了至关重要的「基础设施」角色。

正如 Cloudflare CEO 所说,他们希望建立的是多方共赢的新模式,帮助创作者决定是否允许所有 AI 爬虫、允许特定的爬虫或设置自己的访问费用,将以前未货币化的内容使用转变为新的收入来源。

当然,在这个模式里,Cloudflare 自己也扮演了角色:一边替内容提供方把门,一边替 AI 公司带路,中间这一来一回,就可以收点服务费手续费之类了。

可以预见,随着这一机制推广开来,AI 公司要想抓取海量网络内容训练模型,恐怕得先准备好「买路钱」。毕竟,手握着全球五分之一网络流量「安检闸口」,Cloudflare 无疑已经为这笔潜在的生意打好了基础。

眼下可以确定的是,Cloudflare 已经把「我不是机器人」升级成了 AI 爬虫面前的一道高门槛。这道门槛背后,既有守护互联网内容生态的用心,也不乏精明的商业算计。

下一次你轻松通过自动验证时,栅栏抬起的另一侧,某个 AI 爬虫可能正在被拦下来——想过,先去交个过路钱吧。

来源 | APPSO(ID:appsolution)

作者 | Selina ; 编辑 | 呼呼大睡

内容仅代表作者独立观点,不代表早读课立场

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

萧栝记录风土人情
2026-01-26 10:41:45
有面子!孙兴慜鼓励拜合拉木:你像年轻时的我,拼搏就能赢得机会

有面子!孙兴慜鼓励拜合拉木:你像年轻时的我,拼搏就能赢得机会

国足风云
2026-01-26 10:13:39
全都“叛变”了!台积电、三星接连宣布,外媒:中国不买了?

全都“叛变”了!台积电、三星接连宣布,外媒:中国不买了?

甜柠聊史
2026-01-26 13:56:36
鼓励老百姓捐献器官,还纳入见义勇为,这些专家到底想干啥?

鼓励老百姓捐献器官,还纳入见义勇为,这些专家到底想干啥?

眼光很亮
2026-01-25 09:19:18
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
变天信号已出现!美国没想到郑丽文会来这一招,赖清德好日子到头

变天信号已出现!美国没想到郑丽文会来这一招,赖清德好日子到头

云舟史策
2026-01-26 07:04:27
拿600万顶薪,7战一共得9分!CBA头号“混子”,惨不忍睹

拿600万顶薪,7战一共得9分!CBA头号“混子”,惨不忍睹

弄月公子
2026-01-26 08:53:27
太原一国企董事长上门殴打他人被行拘3天:本人拒绝回应,官方称已知情

太原一国企董事长上门殴打他人被行拘3天:本人拒绝回应,官方称已知情

大风新闻
2026-01-26 12:48:15
这回真洗不白了! 高调炫富的李湘再传"噩耗",被扒的"底裤"不剩

这回真洗不白了! 高调炫富的李湘再传"噩耗",被扒的"底裤"不剩

娱说瑜悦
2026-01-23 18:17:04
特朗普彻底破防,直接开骂!多国被现场点名,气愤十分窒息

特朗普彻底破防,直接开骂!多国被现场点名,气愤十分窒息

毛豆论道
2026-01-25 18:13:28
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
内幕来了!中国雷达被正名,美媒:美军向委内瑞拉投下电磁脉冲弹

内幕来了!中国雷达被正名,美媒:美军向委内瑞拉投下电磁脉冲弹

谛听骨语本尊
2026-01-26 12:24:46
一粒速效救心丸可治10多种病,别只用来治疗心梗了,一定要收藏

一粒速效救心丸可治10多种病,别只用来治疗心梗了,一定要收藏

路医生健康科普
2026-01-24 08:30:03
再见,湖人!再见,NBA的詹姆斯们!

再见,湖人!再见,NBA的詹姆斯们!

体育新角度
2026-01-26 12:20:44
央视提醒!别再吃了!这40种“食品”抽检不合格,有人天天当早餐

央视提醒!别再吃了!这40种“食品”抽检不合格,有人天天当早餐

有范又有料
2026-01-25 16:50:13
当年举报毕福剑的张清,落得何种结局?

当年举报毕福剑的张清,落得何种结局?

深度报
2026-01-22 23:29:58
笑不活了!全网最崩溃的婆婆诞生,得知儿媳怀上三胎,她就地打滚

笑不活了!全网最崩溃的婆婆诞生,得知儿媳怀上三胎,她就地打滚

火山诗话
2026-01-25 08:28:32
中国哪的酱油最好吃?经评比,这6种酱油榜上有名,你喜欢哪种?看看有没有你家乡?

中国哪的酱油最好吃?经评比,这6种酱油榜上有名,你喜欢哪种?看看有没有你家乡?

美食格物
2026-01-26 14:06:13
张宗逊明明战功高、资历老,却没能评上大将,这事儿和惹恼两大元帅毫无关系,真正原因另有他处

张宗逊明明战功高、资历老,却没能评上大将,这事儿和惹恼两大元帅毫无关系,真正原因另有他处

清风鉴史
2025-12-24 13:59:10
郭麒麟没想到,央剧《太平年》播出仅1天,朱亚文实现口碑逆转

郭麒麟没想到,央剧《太平年》播出仅1天,朱亚文实现口碑逆转

泠泠说史
2026-01-24 18:35:45
2026-01-26 20:11:00
互联网早读课 incentive-icons
互联网早读课
专注互联网产品、运营、交互
9467文章数 55157关注度
往期回顾 全部

科技要闻

印奇再上牌桌,阶跃融资50亿

头条要闻

国企董事长打伤要债人被拘 被打男子:80万元一直不给

头条要闻

国企董事长打伤要债人被拘 被打男子:80万元一直不给

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被实名举报代孕、插足婚姻

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

房产
手机
健康
艺术
游戏

房产要闻

突发!三亚官宣,调整安居房政策!

手机要闻

真我Neo8手机首销周销量为上代同期200%,限时价2399元起

耳石脱落为何让人天旋地转+恶心?

艺术要闻

溥心畬的花鸟,淡雅清新

《地平线6》首发550辆汽车!国产神车五菱宏光S在内

无障碍浏览 进入关怀版