你敢信吗?硅谷有家AI公司,出道就骂前东家跑得太快要毁了人类,喊着要做全世界最安全的AI,转头就拿着美国军方的合同给人家干活。喊了五年的安全口号,说好了不安全就立刻停工,结果现在偷偷删掉承诺,转头加速卷得比谁都凶。这家做Claude的Anthropic,就是圈内有名的“安全狂魔”,今天咱们就聊聊它的那点事儿。
![]()
2020年底GPT-3爆火,微软拿着10亿美金排队进场,OpenAI当时的研究副总裁Dario,直接带着妹妹和一票技术大牛集体辞职。他走的理由很直接,OpenAI跑太快了,快到要把全人类推下悬崖。说服别人太低效,不如自己拉一帮信得过的人,造一个绝对安全的AI帝国,Anthropic就这样诞生了。
从开业第一天,“安全”就刻进了这家公司的DNA。他们搞出了宪法式AI,给AI定了一套类似机器人三定律的规矩,要求AI必须诚实无害。2023年他们还公开了RSP文件,拍胸脯承诺“只要发现不安全,立刻就停下来”。
![]()
理想是美好的,可研发AI太烧钱了,没钞票啥理想都白搭。Anthropic撑不住,只能接巨头的投资,亚马逊投了80亿,谷歌投了30亿,拿到救命钱的同时也背上了人情。当初那个发誓绝对不碰危险军事用途的Dario,转头就和美国国防部签了2亿美元的机密合同,把Claude部署进了美国的情报系统。
不少人骂他是又当又立,其实人家自己有一套自洽的逻辑,只是这套逻辑一般人接受不了。这套逻辑根源于有效利他主义,核心就是行善要算数学,不能讲感情。举个例子,同样花五万美元,训练一只导盲犬只能帮一个美国人,捐去非洲治河盲症能让两千个人重见光明,怎么选算一算就清楚。
这套逻辑推到极致,就得出了“赚钱去捐”的结论。你去华尔街硅谷赚大钱,然后把钱捐出来做善事,比你亲自去当志愿者救的人多得多。Dario和他的核心团队,全都是这套理念的死忠信徒。在他们的算术中,未来超级AI毁灭人类这种存在性风险,权重比现在任何灾难都大得多,为了阻止这个最大的恶,过程里任何妥协都是合理的。
逻辑到这里就闭环了。在Dario的二元世界观里,美国代表着大概率正确的正义,其他国家就是AI安全的风险来源。所以和美国军方合作根本不是违背原则,反而是为了保卫全人类。这套逻辑也能说通,为什么Claude对中国用户封锁得最严,那点收入损失,在防止人类灭绝的宏大算式面前,根本不值一提。
这套看起来完美的逻辑,其实藏着一个致命的漏洞。它假设计算者本人是绝对理性又绝对诚实的,可这个假设根本站不住脚。历史早就给过我们警示,之前FTX交易所的创始人SBF,也是有效利他主义的明星代言人,打着“赚钱去捐”的旗号挪用公款,最后落得身陷囹圄的下场。
他当初也辩解,说偷钱是为了赚更多钱救更多人。当目的可以洗白一切手段的时候,底线崩塌就是分分钟的事。Anthropic现在正在重蹈覆辙。2026年初,五角大楼要求AI必须支持“所有合法用途”,这里头就包括全自动武器,Dario的安全红线直接撞上了美国的霸权意志。
结果短短几个小时,国防部就把Anthropic列为了供应链风险,转头把合同给了OpenAI。Dario原本以为自己是那个能驾驭魔戒的人,他算准了AI失控的概率,算准了所谓的外部风险,唯独错算了一件事。他默认美国这个盟友是永远正义且可控的,可这个前提崩塌的时候,他五年建立的安全叙事瞬间就碎了。
紧接着Anthropic就悄悄修改了RSP文件,删掉了“不安全就暂停”的硬承诺。给出的理由也很直白,竞争对手都在加速,我们单方面停下没有任何意义。你看,还是那套熟悉的期望值计算,怎么对自己有利怎么来。五年前Dario反对OpenAI为了商业压力牺牲安全,五年后他自己变成了那个为了不被淘汰放弃底线的人。
回看硅谷这几个头部AI大佬的路径,真的挺让人唏嘘。他们出发的时候理由各不相同,最后都掉进了同一种傲慢里,全都相信只有自己手握魔戒才不会变坏。奥特曼信自己的务实,马斯克信自己的远见,Dario信自己的计算。
可老话讲得好,欲深者天机浅。当你试图用数学公式计算善意的边界,用“更大的善”去合理化每一次妥协的时候,你其实已经走在通往深渊的路上了。魔戒最大的危险,从来不是落入坏人手中,而是落入一个真心相信“只有我能掌控它”的好人手中。
![]()
Anthropic的矛盾,本质上就是人类试图用理性驾驭不可控未来的无力感。这场你追我赶的AI竞速里,根本没有赢家,只有被技术洪流裹挟着往前走的野心,和一点点破灭的幻想。
参考资料:环球时报 起底美国AI巨头Anthropic的双面操作
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.