![]()
机器之心编辑部
AI 编程工具越强,Meta 这样的巨头反而越尴尬。
据外媒 The Information 报道:Meta 正在限制员工在 AI 模型构建中使用 Claude Code 和 Codex,原因是担心涉及模型蒸馏。
Meta 担心这些外部模型生成的内容,可能进入自家的训练数据或评测体系,从而引发所谓的模型蒸馏争议。
![]()
地址:https://www.theinformation.com/articles/internal-docs-show-meta-putting-limits-claude-codex-fearing-distillation
模型蒸馏,成了 Meta 担心的边界
简单来说,模型蒸馏指的是基于一个模型的输出,去训练或改进另一个模型。对于 AI 公司而言,这是一条非常敏感的边界。因为 OpenAI、Anthropic 和 Google 等公司的服务条款,都明确禁止用户使用模型输出来构建竞争性系统。
![]()
Meta 面临的麻烦恰恰在这里。
今年早些时候,Meta 成立了应用 AI 工程团队,任务之一是改进自家的编程助手 MetaCode。为了提升 MetaCode 的能力,这个团队需要构建高质量数据集、设计编程挑战题,并用这些任务来训练和测试代码模型。
但问题是,Meta 又是 Claude Code 的大客户之一。工程师在日常开发中使用 Claude Code 和 Codex 并不稀奇,可一旦这些工具生成的代码、测试题、bug 分析、任务思路进入 MetaCode 的研发流程,事情就会变得复杂。
The Information 查阅到的内部指南显示,Meta 已经对应用 AI 工程团队使用外部 AI 工具划下明确限制。公司允许工程师在某些常规工作中使用 AI,例如搭建工作流、整理代码和文件、构建测试基础设施等。但即便在这些场景下,AI 生成内容也必须经过人工仔细审查。
![]()
更关键的是,指南明确禁止工程师使用外部 AI 模型生成用于测试自家模型的编程挑战题。Meta 在内部文件中表示,这类做法会让工程师失去对任务设计的主导权,公司不希望任务来自模型。
此外,Meta 还限制工程师使用 AI 分析源代码来查找漏洞,或基于代码分析生成测试任务创意。换句话说,外部 AI 可以参与一些辅助性工程工作,但不能帮助 Meta 决定应该测试什么问题,更不能成为 MetaCode 训练和评测任务的来源。
内部文件还提到,如果正在被测试的内部模型能够访问某些基础设施容器,那么任何 AI 生成内容都不能被放入这些容器中。基础设施容器通常包含应用运行所需的代码、库和相关环境。Meta 担心,第三方模型输出如果被内部模型接触到,后续可能间接进入训练链路。
据报道,一份 Meta 内部备忘录甚至要求团队暂停部分使用 Claude Code 和 Codex 的任务。原因在于,Meta 担心外部模型的输出可能流入自家训练数据。一旦被模型厂商认定存在蒸馏风险,会引发合作层面的问题,可能被撤销模型访问权限,甚至遭到账号或公司级封禁。
越来越贵的 AI 账单
这背后也有成本压力。
随着 Meta 在全公司范围内推广 AI 工具,内部 AI 使用成本正在快速上升。Meta 今年仅内部 AI 使用支出就可能达到数十亿美元。此前,Meta 还曾鼓励员工积极使用 AI 工具提升效率,但随着 token 消耗不断增加,公司已经开始限制员工的 token 使用量。
因此,减少对外部 AI 编程工具的依赖,把更多开发工作迁移到 MetaCode 上,正变得越来越重要。可 Meta 想要用自家工具替代 Claude Code 和 Codex,又必须先确保这个替代工具没有吸收 Claude Code 和 Codex 的输出。
![]()
这就形成了一种微妙的矛盾:Meta 需要外部 AI 工具提升研发效率,同时又要防止这些工具的贡献进入自家模型体系。
也就是说,科技公司可以使用竞争对手的 AI 模型来辅助研发,但必须证明这些模型的输出没有进入自己的训练数据、评测集和模型构建流程。
Meta 发言人表示,公司制定了清晰政策,规定团队如何使用 AI 工具,确保员工能够以负责任的方式专注于高影响力工作。
AI Coding 的问题,已经不只是提效
但这件事真正值得关注的地方在于,它揭开了 AI Coding 时代的新问题。
过去,AI 编程工具主要被视为提效工具:帮工程师写代码、补测试、整理文件、修复 bug。现在,随着 Claude Code、Codex 这类工具能力增强,它们已经开始影响更上游的研发环节,包括任务设计、评测构造、代码分析和模型训练流程。
当 AI 工具生成的不只是代码,还包括测试标准、问题设计和工程思路,企业就很难再轻松回答一个问题:自家模型的能力,究竟来自内部工程师,还是来自外部模型的输出?
Meta 对 Claude Code 和 Codex 的限制,表面上是一次内部合规调整,背后则指向一个更大的行业变化:AI 编程工具正在从开发辅助工具,变成模型研发供应链的一部分。
公司越依赖前沿模型来搭建内部 AI 基础设施,就越难证明这些智能能力究竟来自哪里。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.