网易首页 > 网易号 > 正文 申请入驻

网站们悄悄划下的AI边界,正在把互联网切成孤岛

0
分享至

最近看到一段关于人工智能爬虫和robots.txt的讨论。核心问题直白得令人意外:网站所有者到底该不该让AI系统抓取他们的内容?

有人晒出了一份配置方案,长这样:用户代理设为ClaudeBot,允许抓取;用户代理设为GPTBot,禁止;ChatGPT-User,禁止;PerplexityBot,同样禁止。


粗看之下,这种差别待遇背后有它自洽的商业逻辑。可能是网站跟某家AI厂商签了商业协议,对另一家则没有。可能单纯更信任某个机构。也可能就是看某家公司不顺眼,不想让它从自家内容里捞到好处。这些决策都说得通。

有个前提得记牢:robots.txt本质上是请求,不是一堵墙。它只能约束那些愿意遵守规则的爬虫。我们接下来要讨论的"边界",靠的是合规惯例和授权协议才得以形成,并非技术上的强制执行。

真正有意思的问题藏在后面:当成千上万个机构同时做出类似决策时,局面会变成什么样。

过去大多数时间里,现代互联网守着一条心照不宣的假设:大家都从大致相同的信息池里取水喝。搜索引擎质量有高下之分,排序算法各不相同,有些信源更容易被发现,这些都不假。但总体而言,两个人搜同一个话题,他们引用的底层信源有极大概率是重合的。网络作为一个知识语料库,大体上是共享的。

这个假设未必能永远成立。

人们一谈到信息割裂,习惯性直奔那些最极端的例子——政府审查、国家级防火墙,或是成体系的宣传机器。这些都是真实存在的样本。但信息割裂的出现,压根不需要谁怀揣恶意。

设想以下局面:A公司屏蔽OpenAI,却对Anthropic敞开大门。B公司把内容独家授权给OpenAI。C公司一刀切,禁止所有AI爬虫。D公司专门针对某一个AI平台做优化。E公司私下跟某家商业搜索服务商签了协议。

这些机构里没有谁成心要制造信息茧房。他们不过是在一个已经不再给自家网站导流的生态里,努力守住知识产权,或者谈下一笔事关生存的授权合同。每家做的决策,从本地视角看都合情合理。可把这些决策聚合到一块,不同的信息环境就开始成形了。这种分野不是从AI的推理逻辑里长出来的,是从AI的访问权限里长出来的。

有两类访问需要拆开来看,它们造成割裂的机制不一样。第一类是模型训练阶段喂进去的数据。第二类是你提问那一瞬间,模型能实时触达的数据库。今天这两者高度重叠,多数大模型都是从几乎同一批底层语料里训练出来的。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
澳男因在腿上纹150多只宝可梦走红,耗时6年花费达$10000

澳男因在腿上纹150多只宝可梦走红,耗时6年花费达$10000

澳洲红领巾
2026-06-30 15:34:25
火箭实验室80亿美元吃下铱星,年内连扫四家技术公司

火箭实验室80亿美元吃下铱星,年内连扫四家技术公司

字节漫游指南
2026-06-30 00:56:37
重磅!恭喜杨瀚森!28岁中锋告别开拓者...

重磅!恭喜杨瀚森!28岁中锋告别开拓者...

技巧君侃球
2026-06-30 20:21:56
吃“春药”后,是什么感觉?医生说的2个案例,告诉你真实感受

吃“春药”后,是什么感觉?医生说的2个案例,告诉你真实感受

医学科普汇
2026-06-23 17:16:20
这位像雕塑的刚果球迷,在夜店证明了:他也会动

这位像雕塑的刚果球迷,在夜店证明了:他也会动

快乐加载中21
2026-06-30 00:03:49
万达集团,被判向苏宁易购支付超17亿元

万达集团,被判向苏宁易购支付超17亿元

都市快报橙柿互动
2026-06-30 02:51:39
印度一家五口揣9万卢比来上海,以为能买半条街,一顿火锅后傻了!

印度一家五口揣9万卢比来上海,以为能买半条街,一顿火锅后傻了!

犀利强哥
2026-07-01 01:49:42
苹果凌晨推送iOS 26.5.2,没有新功能,却释放了一个重要的信号

苹果凌晨推送iOS 26.5.2,没有新功能,却释放了一个重要的信号

小8说科技
2026-07-01 01:19:05
纳格尔斯曼下课?克洛普就担任德国队教练坦诚发表看法

纳格尔斯曼下课?克洛普就担任德国队教练坦诚发表看法

本泽体育
2026-06-30 12:33:49
温网高温规则揭秘:辛纳中暑退赛敲响警钟

温网高温规则揭秘:辛纳中暑退赛敲响警钟

坠入温柔晚风
2026-06-30 01:15:28
《四渡》里3万红军对抗40万敌军,电影外人民群众对抗黑分子

《四渡》里3万红军对抗40万敌军,电影外人民群众对抗黑分子

光影新天地
2026-06-29 12:50:20
长得漂亮真的很重要吗?网友调侃:你根本不懂美貌的杀伤力

长得漂亮真的很重要吗?网友调侃:你根本不懂美貌的杀伤力

夜深爱杂谈
2026-06-04 22:31:38
人民日报披露案情,抓捕12人,坐实《四渡》被黑

人民日报披露案情,抓捕12人,坐实《四渡》被黑

光影新天地
2026-06-29 20:00:56
暴怒!韩国球迷接机破口大骂:杂种洪明甫毁了世界杯!李刚仁看呆了

暴怒!韩国球迷接机破口大骂:杂种洪明甫毁了世界杯!李刚仁看呆了

818体育
2026-06-30 11:36:10
西班牙成唯一遮羞布, 欧洲足球被南美碾压 ,原因让人细思极恐!

西班牙成唯一遮羞布, 欧洲足球被南美碾压 ,原因让人细思极恐!

小莜读史
2026-06-30 18:38:36
陈震:韩红误会走个面意思了,在北京这是抱怨的意思

陈震:韩红误会走个面意思了,在北京这是抱怨的意思

映射生活的身影
2026-06-29 17:04:11
一次底妆十万起步!明星天价妆造,直接让我惊掉下巴

一次底妆十万起步!明星天价妆造,直接让我惊掉下巴

南万说娱26
2026-06-29 09:02:25
日本出局不可怕,可怕的是赛后森保一的宣言!黄健翔直接点破事实

日本出局不可怕,可怕的是赛后森保一的宣言!黄健翔直接点破事实

青杉依旧啊啊
2026-06-30 22:02:13
16GB+1TB!新机官宣:7月22日,正式发布

16GB+1TB!新机官宣:7月22日,正式发布

高科技爱好者
2026-06-28 23:08:19
网友笃定她家黑狗是金毛,大家都不信,直到她晒出这张照片……没毛病,是金毛!

网友笃定她家黑狗是金毛,大家都不信,直到她晒出这张照片……没毛病,是金毛!

爱宠物
2026-06-30 01:01:40
2026-07-01 02:27:00
像素与芯片
像素与芯片
有态度网友ytd
238文章数 45关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

德国足球,脸都不要了

娱乐要闻

黄晓明沦陷!羡慕周杰伦能降住昆凌

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

艺术
本地
健康
数码
时尚

艺术要闻

18幅 现当代著名画家作品

本地新闻

贵州小城的新目标:举办“村超”世界杯!

狂吃“糯叽叽”小心肠梗阻!

数码要闻

曝微软停产Surface Go与Surface Laptop Go,无后续机型研发计划

Meiinpsn的穿衣风格,清新又叛逆

无障碍浏览 进入关怀版