![]()
GitHub(代码托管平台)悄悄更新了一项条款:你的Copilot(AI编程助手)使用数据,现在成了训练AI的免费燃料。1500万付费用户写的代码、调试记录、甚至注释习惯,都可能被拿去优化模型,再打包卖给企业客户。
条款埋在哪:用户协议第4.2条的"小字游戏"
这次变动藏在GitHub企业版服务条款的修订里。3月17日生效的新版本明确写道:Copilot交互数据可用于"改进服务、开发新产品,以及与微软共享以支持其AI研发"。
翻译成人话:你让Copilot补全的函数、反复修改的bug、甚至那句"TODO: 重构这坨屎山"的注释,都是训练数据。
GitHub产品副总裁Mario Rodriguez在开发者论坛回应质疑时称:「我们始终致力于在创新与用户信任之间找到平衡。」但这份"平衡"的代价是——用户没有退出选项。企业管理员可以关闭部分数据收集,个人订阅者只能全盘接受或取消服务。
更微妙的是数据流向。条款里的"与微软共享"五个字,把GitHub和母公司之间的防火墙拆了。微软拥有OpenAI 49%股份,同时运营着Azure OpenAI服务。你的代码片段可能经过GitHub→微软→OpenAI→Azure客户这条链条,变成银行或保险公司的私有模型养料。
1500万付费用户的"数字佃农"困境
Copilot的商业模式建立在双重收割上。用户每月掏10到19美元购买订阅,同时贡献数据让产品变得更聪明——然后GitHub用升级后的模型吸引新用户,或向企业收取更高费用。
这像极了农业时代的佃农制度:租地主的地(IDE插件),交自己的收成(代码数据),还得感谢地主给了锄头(AI补全)。
GitHub官方博客披露的数字显示,Copilot已生成超过30亿行接受建议的代码。按每行平均50字符计算,这是1500亿字符的人类编程行为样本。作为对比,GPT-4的训练数据总量约为13万亿token——Copilot贡献的代码风格、调试模式、架构决策,构成了独特的"程序员行为指纹"数据集。
一位在Hacker News(技术社区)获得高赞的评论写道:「我为Copilot付费,现在发现我是产品的一部分。」这条评论发布18小时内收获2700多点支持。
![]()
竞争对手的"隐私牌"与行业连锁反应
GitHub的竞争对手正在借机反扑。GitLab(代码协作平台)在条款更新48小时后发布声明,强调其AI功能"默认不将客户代码用于模型训练",并推出"零数据保留"选项。Sourcegraph的Cody(代码AI工具)则主打"代码永不离开你的基础设施"。
市场反应验证了用户焦虑的含金量。GitLab股价在新条款曝光后三个交易日上涨12%,同期GitHub母公司微软股价波动平缓——资本市场显然认为,隐私差异化是有效的竞争武器。
更深层的冲击在开源社区。Linux基金会、Apache软件基金会等组织开始审查旗下项目的Copilot使用政策。Apache基金会法务委员会主席Roman Shaposhnik在邮件列表中警告:「成员项目需评估,基金会托管的代码通过贡献者使用Copilot,是否构成间接的数据贡献。」
这触及开源运动的核心悖论。开源代码本可自由使用,但当AI训练将其与具体开发者的行为模式绑定,传统的许可协议(如GPL、MIT)是否足以保护贡献者权益?目前还没有判例给出答案。
监管真空与用户的有限反击
欧盟《人工智能法案》要求高风险AI系统披露训练数据来源,但编程助手目前被归类为"有限风险"。美国尚未通过联邦层面的AI数据法规,各州零散的隐私法对代码这种"非个人敏感信息"覆盖有限。
用户的实际选择空间狭窄。企业客户可以谈判定制数据条款,但成本陡增;个人开发者若转向本地运行的开源替代品(如Continue.dev配合Ollama),牺牲的是模型质量和集成体验。
一位前GitHub工程师在Bluesky(社交平台)透露:「内部曾讨论过'数据贡献积分'机制,让高频用户获得订阅折扣或API额度。这个方案被毙了,因为法务担心构成'数据买卖'的认定。」
如果这条路径走通,至少用户能明确知道自己"卖"了什么、值多少钱。现在的状态是:你付了钱,贡献了数据,换来的只是服务条款里一行加粗的免责声明。
GitHub的下一步动作值得关注。它会在压力下推出真正的退出机制,还是赌定开发者离不开Copilot的便利性?当1500万人的编程习惯成为AI时代的战略资源,"用户"和"产品"的边界,或许比我们想象的更模糊。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.