6月22日,美国限制外国人使用Anthropic最新模型已有10天,争议没有降温。《金融时报》这次把它重新推到一个更刺的问题上:Anthropic是否把自己的安全叙事,变成了政府出手的依据。
美国政府6月12日下令,暂停外国公民使用Anthropic最新两款大模型Fable 5和Mythos 5;Anthropic为确保合规,随后关闭了这两款模型对所有用户的访问。
禁令理由是“越狱”,争议焦点是安全叙事
美国政府给出的理由,是发现了一种可以绕开Fable 5安全护栏的“越狱”方法。但这项禁令引发的更大争议,是Anthropic长期强调AI风险、安全和监管的公开表达,是否反过来成为政府限制其模型出口的理由。
英国《金融时报》6月20日发布统计分析称,2026年以来,Anthropic在官方声明、社交媒体帖子和首席执行官署名文章中,提到风险、监管或限制相关词汇的频率为每千词5次;OpenAI为每千词0.6次,相差约8倍。
具体来看,2026年以来,Anthropic公开传播中,“风险”“安全防护”“漏洞”这三个词的出现次数分别为336次、121次和128次;OpenAI对应三个词的出现次数分别为30次、33次和10次。
《金融时报》还做了情感分析,认为Anthropic整体语调比OpenAI更偏负面。不过FT也指出,Anthropic的措辞比2023年已明显软化,当时其风险和监管相关用词频率约为现在的两倍
批评者认为,Anthropic给了政府限制理由
禁令公布后,一些AI行业人士把矛头指向Anthropic自己的安全话术。Meta前首席AI科学家、图灵奖得主杨立昆(Yann LeCun)在社交媒体上批评Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)的风险叙事,称这是“种瓜得瓜”。
AI政策研究员伦纳特·海姆(Lennart Heim)则指出,这件事的矛盾之处在于:一个自称支持创新、批评安全监管的政府,却转头限制了美国公司最先进模型的外国用户访问。
曾任美国政府AI主管的大卫·萨克斯(David Sacks)在X上称,有"可信的合作伙伴"向政府演示了绕过Fable安全护栏的方法,而Anthropic低估了问题严重性,政府才“不情愿地”实施禁令。这个说法目前仍属萨克斯个人表述,Anthropic并未确认其具体叙述。
禁令前几天,阿莫迪刚在个人博客中警告,Mythos展现出“对网络安全非常真实的风险”,可能影响金融部门、关键基础设施和国家安全。这一时间上的接近加剧了外界争议,但现有公开信息不能证明这篇博客与政府禁令之间存在直接因果关系。
Anthropic反驳:这不是模型独有风险
Anthropic在6月12日声明中反对这项禁令。公司称,审查相关报告后认为,所谓越狱方法本质上是让模型阅读一个特定代码库并修复软件漏洞;这种能力并非Fable 5独有,也存在于OpenAI GPT-5.5等其他模型中,安全从业者每天也会用类似能力做防御工作。
Anthropic强调,Fable 5发布前经过美国政府、英国AI安全研究所和多家第三方机构数千小时红队测试,安全护栏强于此前部署的模型。公司认为,如果因为一个狭窄、非通用的潜在越狱方法就召回已经商业部署的模型,这一标准推广到全行业后,可能会让所有前沿模型提供商难以发布新模型。
这也是普通用户和企业客户最直接的风险:他们买到的是美国公司的在线AI服务,但访问权可能因为美国政府的国家安全判断被突然切断。对跨国企业、海外开发者、研究机构和创作者来说,前沿模型不再只是产品能力问题,也开始变成政策可用性问题。
G7峰会上的尴尬:盟友也担心被“关掉开关”
禁令发生时,七国集团(G7)峰会正在法国举行。法国总统马克龙在峰会上表示,美国对Anthropic的行动“澄清了利害关系”,并呼吁G7国家加强AI监管合作。他警告,民主国家之间缺乏合作,本身就是风险。
据半岛电视台报道,美国对Anthropic模型的出口限制进一步拉紧了盟友关系,也促使一些国家讨论提高AI自主性。Axios则把这件事称为AI行业的警报:美国政府不仅能限制芯片出口,也可能直接限制外国用户使用美国公司的前沿模型。
这项禁令真正改变的,不只是Fable 5和Mythos 5能不能用,而是美国前沿AI公司的海外用户第一次更清楚地看到:模型访问权并不完全由商业合同决定,也可能被国家安全政策随时改写。(易句)
(本文由AI翻译,网易编辑负责校对)
