阅读时间 9 分钟

Malus.sh:AI 洁净室克隆如何威胁开源软件的可持续性闭环

Malus.sh 是什么

Malus.sh(发音同 "malice",意为恶意)是一个 AI 驱动的工具,声称能够通过"洁净室"(Clean Room)工程方法,从零重新创建任何开源软件的功能等价版本,同时剥离原始项目的所有许可证义务。其网站上最醒目的标语是:"No attribution. No copyleft. No problems."

该项目的独特定位在于它既是讽刺作品,也是真实运营的商业产品。创始人 Mike Nolan 的身份是联合国开源软件政治经济学研究员。他在接受 404 Media 采访时明确表示,如果只是讽刺,开源技术工作者会觉得"这不会发生在我身上"而选择忽视。让工具真正可用,是为了迫使社区正视开源经济模型中已存在的结构性裂缝。

Malus.sh 已注册为 LLC,接入 Stripe 收款,拥有真实付费客户。目前其"解放服务"暂时不可用,但项目引发的行业讨论仍在持续扩散。

技术机制:AI 加速的洁净室工程

传统洁净室方法的历史先例

洁净室工程的法律基础可追溯至 1982 年的 IBM BIOS 案。当时 IBM 垄断个人计算机市场,竞争对手希望实现兼容而不侵犯版权。解决方案是:

  • 团队 A 分析 IBM BIOS 的原始代码,写出功能规格书
  • 防火墙隔离:团队 A 与团队 B 之间严格隔离
  • 团队 B 只看规格书,从零重新实现代码
  • 法律结果:功能兼容但代码独立,法院认定不侵犯版权

这一案例被 HBO 剧集《Halt and Catch Fire》第一季戏剧化呈现,成为软件版权法历史上的关键节点。

Malus 的 AI 版本流程

Malus 将传统洁净室方法完全自动化:

上传依赖清单 → Robot A 阅读文档/API → 生成规格书
                    ↓
              隔离防火墙
                    ↓
         Robot B 根据规格书重新实现 → 输出 MC-0 许可证代码

具体步骤包括:

  1. 上传清单:支持 package.jsonrequirements.txtCargo.toml 等格式
  2. 隔离分析:四个 AI 单元分别阅读 README、分析 API、研究类型定义、审查文档,"从未见过一行原始源代码"
  3. 独立重建:通过隔离防火墙,由另一组 AI 根据规格书重新实现
  4. 许可证解放:输出代码附带 MalusCorp-0 License,零署名、零 copyleft、零义务

速度的量级跃迁

AI 对洁净室工程的最大改变在于时间压缩。Malus 声称:

项目 传统耗时 Malus 耗时
IBM BIOS 克隆(1984) 4 个月以上 整支工程团队
left-pad(11 行代码,2016 年删除导致全球构建崩溃) 数小时人工重写 10 秒
SPACEWAR!(第一款电子游戏) 数周 5 秒

开发者 Dan Blanchard 在 2026 年初使用 Anthropic 的 Claude Code 对流行的 Python 库 chardet 进行了类似的"从零开始"MIT 许可证重写。他的评价是:"以前需要团队数月甚至数年的重写,现在 AI 几天就能完成。这个趋势不可逆转。"

商业模式与定价

Malus.sh 采用按量计费模式:

项目 详情
计价方式 按解压后包体积计费(per-KB)
单包上限 10 MB
单次上限 50 个包
支付渠道 USD、EUR、BTC、股票期权
输出许可证 MalusCorp-0 License
法律保障 声称通过"不承认软件版权的离岸子公司"提供赔偿

网站上的"客户证言"明显带有讽刺性质,例如"guilt doesn't show up on quarterly reports"(愧疚不会出现在季度报告里)。但定价结构和支付功能是真实的。

创始人的核心论点

Mike Nolan 在 2026 年 3 月发布的博客文章《Thank You for Your Service》中系统阐述了 Malus 的立场。

开源的三大结构性问题

"免费意味着没有合同约束。透明意味着攻击者也能读代码。'全球社区维护'只是'谁周二有空谁维护'的礼貌说法。"

开源已经失败的案例

年份 事件 类型
2016 left-pad 被删除,全球数千构建崩溃 维护者破坏
2021 Log4Shell(CVE-2021-44228) 严重 CVE
2022 colors.jsfaker.js 被植入无限循环 维护者抗议
2022 node-ipc 包含针对俄/白 IP 的文件删除载荷 地缘政治破坏
2025 Shai Hulud 2.0 npm 蠕虫 供应链攻击

关于 Log4Shell,Nolan 写道:"工程师们在圣诞节假期里修补它,而实际维护 Log4j 的人大多是 unpaid 志愿者,他们收到了来自全球的恐慌邮件。这不是任何个人的失败,而是在没有人正式负责维护的代码上建立关键全球基础设施的自然后果。"

企业合规成本对比

支出项 年度成本
SCA 工具 $120 万
OSPO 团队 $85 万
法务审查 $70 万
事件响应 $98 万
CLA 管理 $27 万
传统开源合规总计 $400 万
Malus 全面解放套餐 $5 万/年

Nolan 声称可节省 98.75%。

对"剥削"指控的回应

"有人说我们在提取开源社区的想法却抛弃贡献者。是的,这确实准确描述了我们的商业模式。但这也准确描述了几乎所有使用开源却不回馈的公司——也就是几乎所有使用开源的公司。我们只是更诚实,而且收费。"

对"公地悲剧"的承认

"最复杂的反对意见是:如果 AI 能轻易绕过这些保护,整个激励结构会崩塌,公地会枯萎。我承认,这可能是真的。"

法律与伦理争议

支持洁净室有效性的观点

版权法保护的是表达而非思想。1879 年的 Baker v. Selden 案确立了这一原则。Phoenix Technologies 在 1984 年通过洁净室方法成功克隆 IBM BIOS 并获得法院认可。如果 AI 生成的代码在表达层面与原始代码完全不同,仅功能等价,理论上不侵犯版权。

质疑洁净室真实性的核心论点

  1. 训练数据暴露:AI 模型在训练时已经接触过原始开源代码。如果 LLM 的权重中包含了原始代码的模式,其输出能否真正被视为"独立创作"?
  2. AI 输出的版权归属:美国版权局已明确表示,纯 AI 生成的作品不受版权保护。如果 Malus 的输出没有人类作者,使用者也无法主张版权保护。
  3. 诱导侵权:明确以"绕过版权"为营销目的,可能构成诱导侵权(inducement liability)。

Slashdot 社区的高赞评论指出:"祝你好运让法官同意 AI 完成了'洁净室'实现——这个 AI 恰恰是在被它'重新发明'的代码上训练出来的。"

另一位评论者补充:"中国墙法律策略要求团队 A 产出规格书、团队 B 产出实现。如果这些人无法展示规格书,他们就完了。声称在 LLM 网络黑盒的抽象柏拉图空间里一定存在规格书,不会说服法庭。"

为什么这威胁开源的可持续性闭环

开源生态的可持续性依赖于一个隐性社会契约:

  • 贡献者发布代码,获得声誉、协作机会和间接商业价值
  • 使用者遵守许可证义务(署名、copyleft、回馈改进)
  • 企业使用开源降低开发成本,同时通过合规投入反哺生态

Malus.sh 所展示的能力从三个层面破坏了这个闭环:

第一,许可证义务的 enforceability 被架空。 当任何人都能以接近零成本获得功能等价但法律独立的版本时,MIT 的署名要求、GPL 的 copyleft 约束、Apache 的声明保留条款都失去了实际约束力。

第二,贡献激励被侵蚀。 如果开发者知道自己的工作会被 AI 剥离义务地复制,为什么还要选择开源?声誉回报的前提是署名被尊重,而 Malus 的核心卖点正是"零署名"。

第三,企业合规投入的动机消失。 传统上,企业投入 OSPO、SCA 工具、法务审查,既是合规需要,也是间接支持开源生态的方式。当 Malus 将合规成本从 $400 万降到 $5 万,这笔"节省"不会流向开源项目,而是直接消失。

Nolan 自己在博客中承认的"公地枯萎"场景,描述的正是这个闭环的逐步瓦解:不是突然的崩溃,而是贡献意愿的缓慢侵蚀,最终导致开源 Commons 的枯竭。

不可逆的趋势

Malus.sh 本身可能是一个精心设计的讽刺作品,但它所展示的能力已经在被严肃地使用。Dan Blanchard 使用 Claude Code 重写 chardet 的案例表明,这种技术不需要专门的 Malus 平台——任何拥有主流 AI 编码工具的人都可以实现类似效果。

Blanchard 的评价代表了行业内的普遍共识:"以前需要团队数月或数年的重写,现在 AI 几天就能完成。我认为已经没有办法把精灵塞回瓶子里了。"

这一趋势的市场影响已经开始显现。2026 年初,Oracle 等软件公司股价因"AI 可被用于快速复制软件功能"的担忧而遭受抛售。

参考来源