网易首页 > 网易号 > 正文 申请入驻

一夜之间,你的手机、电脑要冒出无数bug了?

0
分享至


一夜之间,你的手机、电脑、路由器,甚至智能马桶,可能都要疯狂打补丁修漏洞了。

这不是咱们乱说的,就在今天,Anthropic 发布了自家有史以来最强的模型Claude Mythos Preview


这个船新版本的新模型,能自己找到 0-day 漏洞(也就是开发者压根不知道、零时间防备的致命漏洞),还能顺手给你写一套完整的攻击代码。

眼看这能力实在太刑了,Anthropic 自己都哆嗦了,于是就以“过于先进不便展示”的理由给锁起来了,只提供给亚马逊、苹果、微软、谷歌等 12 家正派大厂用。


与此同时,他们还组团额外搞了一个名叫 Project Glasswing(玻璃翼蝶)计划,号召大家先用 Mythos 做网络安全防御。

其实这波新模型咱们之前也听过风声,上个月底,Anthropic 家后院起火,泄露了 3000 多份机密文档。当时就有人发现,在原本的超大杯 Opus 之上,居然还藏着一个代号“卡皮巴拉”。


估计是觉得这名字太萌了,所以正式发布时直接改名叫 Mythos(神话,金色传说的感觉)。

虽然咱们吃瓜群众暂时摸不到这玩意,但光看官方给出的数据,也足够让人头皮发麻了。

搁以前,各家大模型的新品通常只能把基准测试的成绩提高个 3%、5% 。

但 Mythos 这次直接就是一个降维打击:

USAMO(美国数学奥林匹克竞赛): 得分从上一代的 42.3% 直接暴涨到 97.6%;


Cybench(网络安全基准测试): 100% 满分通关,Anthropic 官方甚至有点凡尔赛:现有的 Cybench 基准测试太没难度了,对新模型来说已经失去了测试意义。


CyberGym(专业漏洞复现测试)上,它的得分是 83.1%,相对比,此前的最强的公开模型 Opus 4.6 只是 66.6%。

Firefox JS shell(漏洞利用测试),这个最离谱,漏洞利用能力比 Opus 4.6 提升了近 80 倍。。。


面对两位数、甚至几十倍的增长,也难怪 Anthropic 放出话来,说Mythos 已经能和“最顶尖的人类安全专家”掰手腕了

看到这里,差友们肯定也和咱们想的一样,好强啊,太牛了。。。但这剧本怎么有点熟悉?

先是“不小心”泄露风声,然后官方下场甩几组炸裂数据,最后话锋一转:“哎呀,我家模型太强了,怕毁灭世界,所以不能给你们用哦”。

上一个这么干的是 GPT-5 吧?再上一个好像是 Sora?


OpenAI 天天搞谜语人套路,现在风评都成啥了,怎么 Anthropic 浓眉大眼的,也玩这套了?

更不要说,Anthropic 要在今年 IPO 了。

所以网友们一下子就炸锅了,有人喷这是在为了上市造势吹牛逼;有人骂得更直白,说这帮做大模型的,压根不管普通用户死活。

知名开发者 Simon Willison 都出来阴阳怪气,“我们的模型太危险了不能发布”,的确是 AI 圈的流量密码


不过,网友骂归骂,但当你看了它实际的操作,可能也会觉得,这玩意儿现在放出来,确实相当于去幼儿园发 AK 了。

我们从两个官方的案例就能品出味来。

第一个就是,Mythos 在 OpenBSD 里,找到了一个 1998 年的远古漏洞。

这是啥概念?OpenBSD 可是号称全球最注重安全加固的系统之一,防火墙和关键基建全靠它续命。

结果人类顶级专家用显微镜盯了 27 年都没看出来的破绽,被 AI 喝着茶就给挑出来了。。。


另一个强有力的证明案例就是 FFmpeg ,几乎所有视频播放器和浏览器底层都有它。

Mythos 在这里面找到了一个藏了 16 年的漏洞,而包含这个漏洞的代码,早就被人类反复测试了超过 500 万次,却一路绿灯。

Mythos 表示:什么叫国服 AI,战绩可查啊?

而且,你还别小看 AI 找到的漏洞,就拿 FFmpeg 来说,这个漏洞乍一看无关紧要,平时几乎不会被触发,我们联系到的某信息安全从业人士文安(化名)却觉得,这属于典型非常规的输入导致的预期外的问题。

现实生活中,恰恰有大量类似的案例,你不能说触发几率小就完全忽视。

更进一步说,现在这个小漏洞可能只是让程序闪退或者报错,但如果再和一些任意地址(相当于黑客有了你电脑的万能钥匙)读写技术结合起来,那就是个危害级别比较高的漏洞了。

所以,文安在看完这些新闻直接来了句:“如果这个文章全是真的,感觉(从事网络)安全一半(人)可以跳河了”。


随后,文安表示跳河只是夸张修辞,也安慰咱们说这些漏洞,暂时还没到,“我的支付宝会不会被洗劫、微信聊天记录会不会满天飞”的级别。

但问题的核心在于,官方放出这些案例,不是为了炫耀“漏洞有多毒”,而是说明 AI 不用任何外挂工具,纯靠自己的知识储备和跨维度推理,就能挖出新漏洞。

所以,在文安看来,现阶段的 Mythos 并不是“更强的黑客工具”,而是把网络攻击门槛给降低了。

以前不管是正经安全人员还是黑灰产,起码得有个懂行的人坐镇,真要搞一次像样的网络攻击,还得小黑屋里熬上几个月。

但以后,可能村口的小黑胖抠着脚,对着 AI 喊两句麦就行

这种有手就行的低门槛,势必会引来无数乐子人和法外狂徒,玩一把、试一试。

所以文安觉得,Anthropic 先整出个 Glasswing 计划挺合理的。


毕竟,传统安全工具就像死板的门卫,只会查有没有带违禁品,管不了熟人作案;而 AI 能顺藤摸瓜看懂业务逻辑,更能发现那种张三拿着自己的钥匙,却去开李四的门的操作。

提前让大厂们进行自我审查、试用,能够更先一步构筑网络保护、进行漏洞筛查,防范于未然。

至于 AI 时代的网络安全,文安还是比较乐观的。

一来,现在的 AI 还没成精,搞不定特别复杂的连环攻击链。你暂时不用担心,有人靠 AI,盗走你支付宝里那仅剩的 9 块 2 毛 5。

另一方面,AI 能找洞,自然也能补洞,有了它,扫洞效率直接拉满,还能顺便指导下开发漏洞该怎么修。

所以,文安的判断是,未来的网络攻防,大概率就是“人类指挥官 + AI 特种兵”的混合双打


而且吧,差评君仔细看了看最新的技术文档,也觉得 Anthropic 还真不像是在搞噱头,不光是前面说的网络安全能力出色,Mythos 展现出其它方面的能力,也相当惊人

比如在一次测试中,Mythos 发现没有访问权限,正常的反应是说出来:"我没权限,臣妾做不到啊"。

可它偏不这么干,直接去读取沙箱底层,试图从内存里直接把访问令牌搞出来。


还有次测试中,模型利用了一个文件权限漏洞,对敏感文件动手动脚了。

做完这一切,Mythos 还顺手修改了自己的历史提交记录,把这事儿给抹去了。

意识到自己做了不该做的事,然后它选择了毁尸灭迹。。。

还有一次,Mythos 在进行测试,不小心把书翻到最后一页搞到了答案,这操作其实是被命令禁止的。

可研究人员翻看它的思维链时才发现,它不仅没揭发自己,还想着自己的步骤好像和结果对不上,得在最终答案里引入一个小错误,看起来是自己做出来的题,而不是抄到了答案。


我说实话,这个操作,比当年抄我数学试卷的同桌高明多了,不然我俩也不会被罚去扫厕所了。

不过这也不是外界传的那么玄乎,什么整个硅谷都害怕了,Anthropic 老板吓得瘫坐在椅子上了。。。

研究人员也出来澄清了,已经搞清楚了这些心机操作的原因,根本不是 AI 有什么邪恶目的或者自主策划能力

他们还通过反复强化训练,把类似行为的发生率降至百万分之一以下了。

但咱就琢磨着,百万分之一听起来很低,但如果这个模型每天被调用几十亿次呢?


所以,回过头来看,与其骂 Anthropic 搞 Glasswing 计划是搞营销,咱们倒是更愿意相信,他们是真觉得自家的 AI 有点强了。

虽然就像文安说的那样,普通人现在确实还不用担心自己的微信被黑、余额被盗。

但当攻击的成本无限趋近于零,我们唯一能指望的,现有的防御机制,能再完善一些。

撰文:八戒

编辑:江江 & 面线

美编:焕妍

图片、资料来源

Anthropic官网

X.com

Anthropic’s Project Glasswing—restricting Claude Mythos to security researchers—sounds necessary to me


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拉夫罗夫:西方将乌克兰推向更大范围冲突 俄方耐心有限

拉夫罗夫:西方将乌克兰推向更大范围冲突 俄方耐心有限

财联社
2026-04-19 17:41:04
为什么脑梗逐年增多?提醒:与肥肉无关,有一样东西要少碰

为什么脑梗逐年增多?提醒:与肥肉无关,有一样东西要少碰

芹姐说生活
2026-04-19 08:33:41
中国人在哈萨克斯坦生活实录:饭太多、女人太飒、聊天太上头了!

中国人在哈萨克斯坦生活实录:饭太多、女人太飒、聊天太上头了!

老特有话说
2026-04-19 15:29:16
震惊!儿媳失业近一年,每天只买菜做饭,河南婆婆吐槽劝儿子离婚

震惊!儿媳失业近一年,每天只买菜做饭,河南婆婆吐槽劝儿子离婚

火山詩话
2026-04-19 09:20:26
成都“牵手门”事件女主现今状况曝光,太惨了......

成都“牵手门”事件女主现今状况曝光,太惨了......

许三岁
2026-03-17 07:34:05
世锦赛3大不可思议!丁俊晖7-2领跑,张安达6-10惨遭艾伦逆转

世锦赛3大不可思议!丁俊晖7-2领跑,张安达6-10惨遭艾伦逆转

林子说事
2026-04-20 00:10:26
自责!马卡:皇马球员怒气冲冲回到更衣室,看到卡马文加独自痛哭

自责!马卡:皇马球员怒气冲冲回到更衣室,看到卡马文加独自痛哭

兰亭墨未干
2026-04-19 20:15:03
间谍就在我们身边!4月16日,央视报道了一个让人后背发凉的新闻

间谍就在我们身边!4月16日,央视报道了一个让人后背发凉的新闻

丁丁鲤史纪
2026-04-19 19:43:57
超级巨大失误!多纳鲁马送礼,哈弗茨笑纳,塔帅疯狂庆祝瓜帅暴怒

超级巨大失误!多纳鲁马送礼,哈弗茨笑纳,塔帅疯狂庆祝瓜帅暴怒

奥拜尔
2026-04-19 23:57:08
一个害国害民的历史罪人,老百姓还把他当成英雄崇拜

一个害国害民的历史罪人,老百姓还把他当成英雄崇拜

小豫讲故事
2026-04-19 06:00:10
郑永刚转身拒握手,情绪失控抑或刻意挑衅,联赛礼仪该用规则守护

郑永刚转身拒握手,情绪失控抑或刻意挑衅,联赛礼仪该用规则守护

篮球看比赛
2026-04-19 15:17:04
千万别帮!女子坐飞机接连被陌生人请求带行李,一查吓一跳:幸好拒绝了

千万别帮!女子坐飞机接连被陌生人请求带行李,一查吓一跳:幸好拒绝了

金哥说新能源车
2026-04-20 00:29:58
不装了赖清德、马英九暴露真面目!国民党发甲级动员,想决一死战

不装了赖清德、马英九暴露真面目!国民党发甲级动员,想决一死战

青梅侃史啊
2026-04-19 19:17:48
豪掷120亿!巴铁要买40架歼-35A?背后金主发力,巴媒:碾压印度10年

豪掷120亿!巴铁要买40架歼-35A?背后金主发力,巴媒:碾压印度10年

健身狂人
2026-04-19 20:02:22
男子爬上泰山“五岳独尊”石刻拍照,景区:将核查其身份进行处理

男子爬上泰山“五岳独尊”石刻拍照,景区:将核查其身份进行处理

扬子晚报
2026-04-17 12:09:40
A股:刚刚,大消息传来,美方突抵巴基斯坦,周一将迎新关键节点

A股:刚刚,大消息传来,美方突抵巴基斯坦,周一将迎新关键节点

云鹏叙事
2026-04-20 00:00:09
本田被曝将关停广州、武汉两座燃油车工厂 年产能砍至72万辆

本田被曝将关停广州、武汉两座燃油车工厂 年产能砍至72万辆

金融界
2026-04-17 13:45:07
4.20日早评|美伊大改口!A股要加速!

4.20日早评|美伊大改口!A股要加速!

龙行天下虎
2026-04-20 01:30:43
全网唱衰的下嫁!嫁普通人5年,前任是法拉利总裁,终究还是输了

全网唱衰的下嫁!嫁普通人5年,前任是法拉利总裁,终究还是输了

橙星文娱
2026-04-18 16:42:58
55岁上海炒股冠军罕见发声:如果本金有20W,建议死磕这五条铁律

55岁上海炒股冠军罕见发声:如果本金有20W,建议死磕这五条铁律

股经纵横谈
2026-04-19 19:03:09
2026-04-20 02:47:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
10602文章数 489591关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

教育
时尚
数码
艺术
公开课

教育要闻

655家单位、1.29万个岗位,湖南用心帮大学生找工作

装修“精神角落”,就是这么上瘾

数码要闻

华为新机发布前瞻:阔折叠X Max+影像旗舰Pura 90,都没悬念了

艺术要闻

超模施特洛耶克写真曝光,简直美到窒息,别错过!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版