![]()
据《Washington Post》披露,Anthropic 早在 2024 年初启动了一个名为 Project Panama 的内部项目,大规模购买实体书,再将书脊切掉,用工业扫描设备转成数字文本。扫描完成后,纸质书并未保留,而是交由回收渠道处理。
这个项目的目标,是为 Claude 等 AI 模型建设内部书库。
![]()
图片由 AI 生成
这不是简单的“买书收藏”,而是一套工业化的数据生产流程。
被曝光的内部文件将 Project Panama 描述为 Anthropic “破坏性扫描所有书籍”的努力,并提到公司并不希望外界知道这一项目。
供应商方案还显示,Anthropic 寻找的是能在 6 个月内转换 50 万至 200 万本书的扫描服务商。
争议的核心,在于 AI 公司究竟能不能将书籍变成训练材料。
美国加州北区联邦法院法官 William Alsup 在 2025 年 6 月的简易判决中认为,如果书籍是合法取得,用于训练 AI 可构成合理使用。
但 Anthropic 从 LibGen、PiLiMi 等盗版书库下载并保留大量图书的行为,不受合理使用保护。
法院区分了两件事:合法买书后扫描,是一条路径;下载盗版书库,则是另一条路径。
Anthropic 的“买书扫描”项目在法律上获得了一定空间,但其此前使用盗版来源建设中央书库的问题,仍卷入高额版权诉讼。
随后,Anthropic 与作者和出版方达成 15 亿美元(101.88 亿元人民币)和解。
根据 Authors Guild 披露,和解覆盖约 50 万本符合条件的作品,初步按每本至少 3000 美元赔付,金额将在作者、出版方等权利人之间分配。
法院已在 2025 年 9 月 25 日初步批准该和解,最终批准听证会定于 2026 年 5 月 14 日举行。
这件事真正刺痛出版业的,并不只是 Anthropic 用书训练 AI,而是知识被处理成数据燃料的方式。
一本本实体书被买入、切开、扫描、销毁,最后进入模型训练管线。
对 AI 公司来说,这是绕开盗版风险、补足训练数据的一种合规成本;对作者和出版方来说,这更像是 AI 行业在数据饥渴下,对传统版权体系发起的一次压力测试。
云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.