网易首页 > 网易号 > 正文 申请入驻

Anubis把AI爬虫逼到墙角:1行代码让服务器成本暴涨47倍

0
分享至


2024年,一个GitHub项目的Star数从0涨到8000,不是靠功能多炫酷,而是因为它让AI公司的服务器账单开始燃烧。

这个项目叫Anubis,名字取自埃及死神。开发者用了一个20年前的老技术——工作量证明(Proof-of-Work),把网站防爬战从"猫鼠游戏"变成了"算力对赌"。

1. 为什么正经网站开始"挖矿"防身

AI爬虫的破坏力被严重低估。Cloudflare 2024年报告显示,全球40%的互联网流量来自机器人,其中"善意爬虫"(搜索引擎索引)占比不足15%。剩下的,大部分是AI公司训练大模型的数据采集器。

这些爬虫的共同点:不讲武德。它们会同时开上千个连接,无视robots.txt,把服务器CPU压到100%,直接导致正常用户无法访问。某独立博客作者记录,一次未防护的爬虫攻击让他的VPS在3小时内产生47美元流量费——相当于平时半个月的开销。

Anubis的解法很粗暴:想访问页面?先算一道哈希题。单个用户耗时不到0.3秒,但爬虫如果并行开1000个线程,算力成本会指数级膨胀。开发者Eevee在README里写得很直白:"这不是为了挡住所有人,是为了让大规模爬取变得不划算。"

工作量证明在这里不是区块链噱头,而是精确的成本杠杆。

2. Hashcash复活:一个被垃圾邮件逼出来的老方案

1997年,密码学家Adam Back提出Hashcash,初衷是解决邮件垃圾问题。核心逻辑:发邮件前,你的电脑先花几秒算一道题,把结果附在邮件头里。正常用户发几封邮件无感,但垃圾邮件发送者要发百万级邮件,算力成本直接爆炸。

Hashcash没能在邮件领域普及——Gmail选择了更粗暴的机器学习过滤。但27年后,它的精神继承者Anubis在Web防护领域找到了位置。


技术实现上,Anubis用WebAssembly在浏览器端跑SHA-256计算。用户访问被保护的网站时,页面会弹出一个"正在验证"的提示,后台默默完成约20万次哈希迭代。现代笔记本耗时50-200毫秒,老旧手机可能到1秒,但仍在可接受范围。

真正的杀招在经济学层面。假设某AI公司要爬取100万页面,原本的成本主要是带宽和存储;加入Anubis后,需要先完成100万次工作量证明。按AWS p3.2xlarge实例的算力成本估算,这部分新增支出可能让单次爬取成本从200美元跳到9400美元——47倍的差距。

3. "临时方案"背后的长期博弈

Anubis开发者承认这是"hack"(权宜之计)。真正的防线在更深处:通过字体渲染、Canvas指纹、WebGL行为等特征,识别出无头浏览器(Headless Browser)——AI爬虫的主流形态。

这像极了冷战时期的军备竞赛。爬虫方不断升级伪装:用真实Chrome内核、模拟鼠标轨迹、甚至接入第三方打码平台解决验证码。防御方则在收集"人类行为"的细粒度特征:你滚动页面的加速度曲线,鼠标悬停时的微抖动,字体抗锯齿的像素级差异。

「最终目标是让合法用户无感知通过,而机器需要付出不成比例的成本。」Anubis维护者在Issue区回复用户提问时写道。

但这场博弈有个尴尬的第三方:隐私工具用户。JShelter、NoScript等浏览器插件会阻断Anubis所需的JavaScript执行,导致正常用户被误拦。项目文档不得不专门提示:"请为本站禁用JShelter"——一个反追踪工具,在反爬虫战场成了 collateral damage(附带损伤)。

4. 没有JavaScript的互联网正在消失

Anubis的README里有句话被很多人忽略:"无JS方案正在开发中。"这句话的潜台词是:在当前技术条件下,没有JavaScript就无法区分人类和机器。

这指向一个更深层的变化。早期的Web是文档的互联,HTML足以承载一切。现在的Web是应用的互联,JavaScript是运行时的基础设施。当AI爬虫可以完美解析HTML、CSS,甚至执行基础JS时,"人机验证"被迫上移到了更复杂的执行层。


对普通用户的影响是实实在在的。2024年,W3C的Web无障碍倡议组织收到多份投诉,称这类防护机制对使用屏幕阅读器的视障用户不友好。Anubis团队回应称正在优化ARIA标签支持,但优先级低于"挡住当前这波爬虫潮"。

技术债务在转移:AI公司省下的数据标注成本,正在变成全社会的验证负担。

5. 当每个网站都成为收费站

Anubis不是孤例。Cloudflare的Turnstile、Google的reCAPTCHA v3、甚至Cloudflare的"托管质询"页面,都在做类似的事:用某种成本不对称,过滤掉机器流量。区别在于,Anubis是开源的、自托管的、不需要把用户数据交给第三方。

这契合了2024年的一种情绪:平台不信任。开发者宁愿自己维护一套防爬系统,也不愿意把访问日志送给Google分析。Anubis的Docker镜像下载量在三个月内突破50万次,其中相当一部分来自欧洲的独立站长——GDPR合规压力下,他们比任何时候都更在意数据主权。

但自托管意味着责任自担。GitHub Issues区里,最常见的求助是"配置后网站变慢了"或"移动端验证失败"。没有SLA(服务等级协议),没有7×24客服,只有一份还在完善的文档和志愿者的碎片时间。

「我们是在用90年代的互联网精神,解决2020年代的平台问题。」一位贡献者在讨论区写道。

回到那个核心问题:Anubis能赢吗?

技术层面,工作量证明只是延迟了爬虫的适应速度。已经有用户在测试用WebGPU并行计算,把验证时间压缩到原来的1/20。经济层面,AI公司的算力预算仍在膨胀,9400美元的爬取成本对OpenAI或Anthropic可能只是 rounding error(舍入误差)。

但Anubis的真正价值或许不在技术本身,而在它示范了一种姿态:网站运营者开始拒绝默认承担AI训练的外部性成本。当足够多的站点部署类似机制,AI公司的数据获取策略将被迫调整——从野蛮抓取,转向授权协议和合成数据。

那个"无JS方案"的承诺,至今仍在开发中。而依赖屏幕阅读器的用户、使用隐私插件的访客、以及所有相信Web应该对机器和人类同等开放的人,正在等待一个答案:当验证成为基础设施,谁有权定义"合法访问"的门槛?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你信不信未来王钰栋都要替补!U19苗润东魏祥鑫杨铭锐个顶个强

你信不信未来王钰栋都要替补!U19苗润东魏祥鑫杨铭锐个顶个强

安海客
2026-03-28 17:29:09
彩票销量“断崖式”下跌,2元中500万梦,为何如今没人愿意信了?

彩票销量“断崖式”下跌,2元中500万梦,为何如今没人愿意信了?

复转这些年
2026-03-28 11:52:28
瑞舒伐他汀天天吃,这五个问题一定要知道!

瑞舒伐他汀天天吃,这五个问题一定要知道!

药师方健
2026-03-26 22:18:10
绘说现代化丨“开局”看河南 万象“皆”中

绘说现代化丨“开局”看河南 万象“皆”中

人民资讯
2026-03-28 08:36:26
1937年地主王学文救下女红军还收留了她的孩子,彻底改变三个家庭

1937年地主王学文救下女红军还收留了她的孩子,彻底改变三个家庭

磊子讲史
2026-01-14 16:09:59
校长拒拆鸟巢:不迎合的温柔是孩子最动人的成人礼 |新京报快评

校长拒拆鸟巢:不迎合的温柔是孩子最动人的成人礼 |新京报快评

新京报
2026-03-27 16:16:34
里勒35+5三分北控大胜宁波 廖三宁10+6+10杰克逊27分

里勒35+5三分北控大胜宁波 廖三宁10+6+10杰克逊27分

醉卧浮生
2026-03-28 21:49:03
连战方面出手后,失去马英九信任的金溥聪彻底急了,邱毅一语道破

连战方面出手后,失去马英九信任的金溥聪彻底急了,邱毅一语道破

爱看剧的阿峰
2026-03-28 16:54:01
美国高尔夫球星“老虎”伍兹因酒驾发生翻车事故被捕

美国高尔夫球星“老虎”伍兹因酒驾发生翻车事故被捕

新京报
2026-03-28 09:44:58
杭州一女子“断碳水”2个月暴瘦30斤,每天只吃少量蔬菜和鸡胸肉,出现头晕心慌,确诊糖尿病前期

杭州一女子“断碳水”2个月暴瘦30斤,每天只吃少量蔬菜和鸡胸肉,出现头晕心慌,确诊糖尿病前期

大象新闻
2026-03-28 19:45:02
4万股东突发踩雷,这家公司白天大涨,晚上股票被实施st风险警示

4万股东突发踩雷,这家公司白天大涨,晚上股票被实施st风险警示

有范又有料
2026-03-28 10:13:07
想拿中国尿素救春耕?先把欠中企的百亿欠款还了,否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了,否则一粒不售

铁锤妹妹是只猫
2026-03-27 20:09:11
尼科-帕斯:非常开心收获国家队首球,这一刻我已经盼了很久

尼科-帕斯:非常开心收获国家队首球,这一刻我已经盼了很久

懂球帝
2026-03-28 12:40:11
巴拿马玩砸!赔款156亿不足,滞华巴船暴涨,船东纷纷倒戈

巴拿马玩砸!赔款156亿不足,滞华巴船暴涨,船东纷纷倒戈

就像当初啊
2026-03-27 19:30:20
从年赚358亿到巨亏234亿,美团的外卖江湖地位保住了吗?

从年赚358亿到巨亏234亿,美团的外卖江湖地位保住了吗?

时代周报
2026-03-27 21:40:32
中方未收道歉,日本自卫官被转移,沉默24小时后,小泉进次郎发文

中方未收道歉,日本自卫官被转移,沉默24小时后,小泉进次郎发文

说历史的老牢
2026-03-26 18:53:45
现货黄金涨超3%

现货黄金涨超3%

证券时报
2026-03-28 01:19:04
联大投票结果出炉,伊朗与122国获压倒性胜利,英法德日纷纷弃权

联大投票结果出炉,伊朗与122国获压倒性胜利,英法德日纷纷弃权

牛锅巴小钒
2026-03-28 22:23:55
刘昊然郭麒麟商K风波升级!被质疑参加拖鞋场,画面细节对上了

刘昊然郭麒麟商K风波升级!被质疑参加拖鞋场,画面细节对上了

萌神木木
2026-03-28 15:34:37
出其不意的伊朗:多层次非对称下的正面博弈

出其不意的伊朗:多层次非对称下的正面博弈

红星新闻
2026-03-28 11:24:13
2026-03-29 00:00:49
碳基打工人
碳基打工人
坐标北京,靠咖啡续命,靠小红书下饭的普通人类。
387文章数 4关注度
往期回顾 全部

科技要闻

华为盘古大模型负责人王云鹤确认离职

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

陈牧驰陈冰官宣得子 晒一家三口握拳照

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

时尚
游戏
艺术
手机
公开课

和田曦薇一样嫩嘟嘟,这3个变美技巧你一定不能错过!

《死亡搁浅2》Steam销量超42万 中国玩家占一半

艺术要闻

沙特NEOM又出状况!多份重大合同终止,中国公司依然坚守

手机要闻

华为手机全面回归!畅享90 Pro Max下周首销:1699元起

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版