3个月前那个"邪恶"玩笑，正在拆掉SaaS的护城河|源代码|saas|python

3个月前那个"邪恶"玩笑，正在拆掉SaaS的护城河

2026-03-28 11:47:48　来源: 全栈遛狗员

北京举报

分享至

2023年有人预言AI会让SaaS变成白菜价，当时没人信。现在一家叫Malus.sh的网站，把"白菜价"三个字做成了自动化流水线——上传你的依赖清单，它用AI把GPL代码洗成MIT，LGPL洗成私有。名字里的Malus是拉丁语"邪恶"，开发者说这是讽刺，但讽刺的是它真能跑通。

这件事的可怕之处不在于技术，而在于法律 precedent（先例）早在1982年就写好了。

1982年的"干净房间"，成了2025年的武器

Phoenix Technologies当年想兼容IBM PC，但IBM的BIOS有版权。他们的解法堪称精密：A组工程师把BIOS拆解成功能说明书，B组工程师——完全没见过原代码——照着说明书重写。法院判了合法，因为B组是独立创作。

这个判例活了43年，现在被AI复刻了。Malus.sh的演示很简单：你扔进去一个Python库的依赖文件，它的"AI A组"分析功能，"AI B组"从零实现。两个模型不共享权重，不交换上下文，技术上满足"干净房间"的所有要件。

FOSDEM（欧洲开源开发者大会）的现场，演讲者把这事当警告讲，台下听出了别的意思。Hacker News的1400多条评论里，最扎眼的一条是：「这到底是copyleft的末日，还是我们终于可以不用管开源合规了？」

几乎同时，有人用Claude实操了chardet库——一个LGPL协议的字符编码检测工具。输出结果：MIT协议的新版本，功能一致，代码不同。开源社区炸了，但炸完发现拦不住。

SaaS的护城河，从来不在代码里

Malus.sh针对的是开源库，但真正的杀招在另一块战场。

SaaS公司从不公开源代码，但它们公开一切行为。每个按钮的响应、每个API的返回、每个错误提示的文案，都是可观测的。把这些喂给LLM，生成规格文档，再让另一个LLM实现——源代码？从来没被"看见"过。

对SaaS来说，"干净房间"的防御反而更强。因为没有原代码，就不存在"复制"的指控。你能证明Claude看过Salesforce的代码吗？不能。你能证明它看过Salesforce的界面行为吗？人人都可以。

有人反驳：LLM的训练数据里明明有开源代码，Claude能一字不差背出chardet的源码，包括许可证头。这算"见过"吗？

算。但架构可以改。

双模型系统：模型A读行为，写规格；模型B读规格，写代码。两者权重隔离，上下文隔离。三模型、四模型，每多一跳，溯源难度指数级上升。不同基座模型、不同云厂商、不同司法管辖区——你想起诉？先证明链条上哪个环节"污染"了最终输出。

2023年预言的"SaaS泡沫破裂"，迟到两年，但路线更野。

两种剧本同时上演

第一种剧本企业最爱：终于不用怕GPL的"传染性"了。改过的代码不必开源，合规部门可以裁员。MongoDB当年改SSPL协议防云厂商，现在云厂商可以反问：我为什么要用你？我自己洗一个。

第二种剧本更安静，也更致命。SaaS的定价建立在"我们做了你做不到的事"上，但当"做到"的成本降到API调用费，毛利率怎么守？不是每个SaaS都有网络效应，不是每个都有数据飞轮。那些靠功能复杂度堆起来的护城河，正在变成负资产——越复杂，行为观测越丰富，AI复刻越完整。

Notion的块编辑器、Figma的协作逻辑、Zapier的集成图谱，这些曾经需要百人团队磨两年的东西，现在可以被拆解成"行为-规格-实现"的流水线。不是明天，是现在。有人已经在用Claude复刻内部工具，两周替代了原来$15万/年的订阅。

开源社区的反应很分裂。一部分人喊"这是盗窃"，另一部分人默默fork了Malus.sh的思路——不是洗别人的代码，是洗自己的技术债。那些早年选了GPL、现在想转MIT的老项目，发现了一条灰色捷径。

法律还在1982年，技术已经到2025年

Phoenix Technologies案确立的规则是：独立创作，不碰原代码，就不侵权。AI满足这个条件吗？技术上可以设计为满足。法律上？还没有判例。

但诉讼成本摆在那里。你要告一家用了"干净房间AI"的公司，得先穿透三层模型架构、两个云厂商、一个离岸实体，证明"污染"存在。而被告只需要展示：看，我的模型B训练数据里绝对没有你的代码。

copyleft运动的核心假设是：代码一旦开源，许可证就像病毒一样附着。但如果代码可以被"功能等价但表达不同"地无限再生，病毒就失去了宿主。AGPL（ Affero GPL）要求网络服务也必须开源，现在你可以用AI洗一个"行为等价但代码全新"的版本，AGPL的触发条件——"基于该程序修改"——还成立吗？

开源律师圈在讨论一个新概念："合成干净性"（synthetic cleanliness）。意思是AI生成的代码，即使训练数据包含原代码，只要生成过程满足一定隔离条件，就可以视为独立作品。这要是写进判例，开源许可证的 enforcement（执行）机制就塌了一半。

SaaS行业的估值模型里，"技术壁垒"这个乘数正在失效。

VC们开始问新问题：你的护城河是数据吗？是网络效应吗？是品牌吗？如果答案只是"我们功能多、代码好"，下一轮估值要打对折。2024年SaaS估值已经杀过一轮，当时归因于利率和增长放缓。现在看，可能杀早了。

Malus.sh的创始人在FOSDEM后发了条推文：「我们是讽刺作品，但讽刺的是你们拦不住。」网站本身几天后下线，但GitHub上出现了十几个开源实现，文档比原版还全。有人加了"三模型"模式，有人接了本地LLM绕过API审查，有人专门洗Rust库——那帮最看重内存安全的开发者，现在最积极。

企业采购部门的态度更微妙。理论上他们应该抵制"洗代码"的供应商，但预算压力是真实的。当一个$50万/年的企业协议可以被$5万的AI复刻替代，CFO的邮件比法务的警告先到。

开源基金会也在动。OSI（开源倡议组织）在起草"AI生成代码的许可证兼容性指南"，但进度赶不上技术扩散。Linux基金会悄悄资助了几个"溯源技术"项目，想从技术上证明某段代码是否"AI污染"，但对抗的是整个生成式AI行业的商业逻辑。

最尴尬的可能是那些"开源核心+商业插件"的混合模式公司。他们的商业版本本来靠功能差异收费，现在客户可以用AI把开源核心扩展到90%的功能，剩下10%自己写。红帽的订阅模式、Elastic的授权分层，这些被验证过的 playbook（打法），突然需要重写。

有个细节很少被讨论：Malus.sh的"干净房间"流程，对小型开源库最致命。一个维护者业余时间写的实用工具，没有精力打官司，没有资源做技术溯源。AI洗一遍，大公司用上，原作者连署名都拿不到。这不是理论，chardet事件后，几个Python工具库的维护者已经暂停更新，说"等法律明朗"。

但法律不会明朗。1982年的判例保护的是"独立创作"，2025年的技术让"独立"变得可以工程化。当两个AI模型之间的隔离，比两个真人团队更彻底，法院怎么判？没人知道。而"没人知道"本身，就是对 copyleft 的削弱。

SaaS的死亡预言可能夸张了，但"SaaS as we know it"确实在变形。那些靠功能复杂度建立的优势，正在变成行为观测的素材库。那些靠许可证建立的保护，正在变成可以绕过的路障。不是每个公司都会用Malus.sh，但只要有一个竞争对手用了，定价权就开始流失。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.