2019年OpenAI发布GPT-2时,科技圈流传一个承诺:AI将消除信息偏见,让真理浮出水面。五年过去,一个反直觉的数据正在浮现——全球南方国家贡献了互联网60%以上的原始内容产出,但控制检索、排名、变现系统的公司,没有一家位于这些地区。
知识民主化?更像是知识殖民2.0
旧殖民主义掠夺土地和劳动力,新形态掠夺的是「认知框架」。非洲学者记录本地农业实践,东南亚开发者贡献开源代码,拉美记者调查跨境腐败——这些高语境、经验密集的数据被抽取、清洗、封装进硅谷的产品。
原始出处消失,精炼版本垄断解释权。
这不是技术中立。检索增强生成(RAG,一种让AI调用外部数据库的技术)的默认设计,优先索引英语、结构化、已付费收录的内容。一篇用斯瓦希里语写的气候适应方案,即使价值密度极高,也可能因格式不符而被系统降权。
visibility怎么被「制造」出来
AI不奖励深度,奖励的是分发权力。一个产品的可见度公式大致是:SEO预算 × 英文关键词密度 × 平台算法友好度。这意味着,拥有服务器集群和法务团队的一方,永远比拥有田野经验的一方更容易被「发现」。
「我们被告知AI会消除偏见,」一位研究全球数字不平等的社会学家指出,「但偏见只是从人工编辑转移到了训练数据和排名机制里。」
更隐蔽的是反馈循环:高可见度内容获得更多点击,点击数据反哺模型训练,模型进一步推高同类内容。噪音自我强化,信号被系统性稀释。
谁在支付认知税
全球南方不是没参与AI革命——恰恰相反,它是数据原材料的主要供应地。肯尼亚的标注工厂、菲律宾的内容审核中心、印度的呼叫支持,构成了AI经济的底座劳动力。但这些人训练出的系统,返回给他们的答案,往往以剥离本地语境的方式呈现。
一个细节:当ChatGPT被问及某些区域性知识时,它的回答来源标注经常指向北美或欧洲机构的二手整理,而非原始社区的一手记录。这不是技术故障,是架构设计的选择。
所以问题变成:如果AI的「真理」只是可见度最高的版本,那么被压制可见度的知识,算不存在吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.