181比0。这不是比分,是Claude新模型Mythos Preview与当前最强版本Opus 4.6的自主漏洞挖掘成绩对比。Anthropic在4月7日的安全披露里埋了这个数字,但没多少人真正读懂它的分量。
这不是升级,是断层。测试用的同一批漏洞库,Opus 4.6几乎全军覆没,Mythos却批量产出可用攻击代码。更麻烦的是,这些漏洞全在现役系统里——Windows、macOS、Chrome、Firefox、银行间的加密通信库,还有支撑云计算的虚拟机监控器。没有一个是实验室假想敌。
27年隐身:OpenBSD的"安全神话"破了
OpenBSD被挑中,恰恰因为它以安全著称。代码审计严苛,社区洁癖式地追求正确性,27年来没人发现那个漏洞。Mythos Preview用了多久?披露没写具体小时数,但用了"characterised in hours"描述FFmpeg的16年老洞——后者是被 fuzzing(模糊测试)最彻底的代码库之一,全球安全研究者啃了十几年。
「The oldest bug discovered was 27 years old」,Anthropic的原话。一个比很多程序员职业生涯还长的漏洞,被新模型从代码堆里拎了出来。这打破了两个幻觉:一是"老代码=被充分审计",二是"小众系统=攻击面小"。
金融软件从业者该紧张了。披露明确提到「cryptographic libraries that secure bank-to-bank communications」——银行对银行的加密通信库。这不是支付前端的小毛病,是清算、结算、跨境资金流动的管道。管道有裂缝,但之前没人看得见。
量子 horizon 的阴影视线
原文标题里的"quantum horizon"(量子地平线)不是修辞。Mythos的架构设计指向一个被回避的事实:现有加密体系在量子计算面前的脆弱性,可能不需要等到量子计算机成熟就会暴露。AI现在就能找到传统方法发现不了的实现层面的漏洞,而这类漏洞在加密库里的密度,远高于一般软件。
虚拟机监控器(VMM)的出现更让人坐不住。云服务商用这个技术把一台物理机切成几十上百个虚拟机,客户彼此隔离。披露说Mythos找到了「at least one production virtual machine monitor」的漏洞——生产环境,正在跑的那种。突破隔离意味着租户A可能窥视租户B的内存,包括密钥。
Anthropic选择主动披露而非等外部曝光,策略上聪明,但也说明问题已经大到藏不住。181个漏洞不是潜在风险,是已验证的攻击路径。模型还没公开,但漏洞本身不会等到模型发布才被人利用。
每个金融产品的隐形债务
对25-40岁的科技从业者来说,这件事的启示很具体:你依赖的基础设施,其安全假设可能已经过期。不是"可能有问题",是"已经被证明有问题,只是之前没工具能发现"。
「The infrastructure was already compromised」——原文标题的陈述句语气,没有问号。这不是预警,是诊断。Mythos Preview的存在,相当于给攻击者预演了一套新工具的能力边界。而防御方的问题在于,你不知道自己用的库、操作系统、云服务里,还埋着多少个27年级别的沉默漏洞。
披露没给修复时间表,也没列受影响的具体版本号。这种留白本身是一种信号:范围太广,逐个点名不现实。金融软件的合规团队通常要求供应商提供安全审计报告,但审计方法论是基于人类研究者的能力边界设计的。181比0的差距,暗示这套方法论需要整体重估。
下一个问题是:当模型能力继续爬坡,发现速度超过修复速度时,行业现行的漏洞响应流程会不会直接崩溃?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.