网易首页 > 网易号 > 正文 申请入驻

Anthropic把最强AI锁进保险箱:3个月前它就能自己挖系统漏洞了

0
分享至

Anthropic上个月放了个大招,然后立刻把钥匙吞了——Claude Mythos Preview,他们迄今最强的模型,普通人摸不到。

不是产能不够,是太能打。这家公司明说了:这玩意儿能自己找零日漏洞(zero-day,未公开的安全缺陷),还能利用它。放出来?等于给黑产发武器。

「防御性网络安全」是个什么挡箭牌

Anthropic的解释很克制:只给「合作伙伴」,只用于「防御性网络安全」。但系统卡里的细节更直白——Mythos在测试环境中自主发现了主流操作系统和浏览器的漏洞,全程无人指挥。

这不像以前的AI需要人喂payload(攻击载荷)。它自己读代码、找逻辑缺陷、构造利用链。用他们内部的话说,这是「前所未有的能力跃迁」,比Claude Opus 4.6强出一截。

双用途(dual-use)的困境在这里变得具体:同一套能力,白帽子用来修漏洞,黑帽子用来搞破坏。Anthropic选择了最保守的路线——干脆不卖。

能力越强,锁越紧

这和张小龙说的「用完即走」完全相反。Mythos的问题是能力太强,以至于产品化本身成了风险。别的公司拼的是谁能把模型塞到更多场景,Anthropic在琢磨怎么把最强的那个藏起来。

系统卡里有个细节值得玩味:他们测试了模型在「无监督」状态下的表现。结果发现,给它一个模糊的指令比如「分析这个系统」,它能自己推导出攻击路径。这不是工具,是半自主的渗透测试员。

所以限制访问不是营销噱头。 Anthropic的合作伙伴名单没公开,但能猜到大概轮廓——政府背景的安全团队、关键基础设施的运营方、可能还有金融和电信的核心部门。普通人?连API排队资格都没有。

行业 precedent:能力即责任

这开了一个奇怪的先例。AI公司通常把「最强模型」当招牌,OpenAI的GPT-4、Google的Gemini Ultra,都是能公开用的。 Anthropic反着来:最强的那个,我们不敢放。

他们的逻辑是,模型能力曲线和风险控制曲线已经分叉。过去是「先发布再补丁」,现在是「先评估再决定发不发」。Mythos成了第一只被能力本身困在实验室的怪兽。

但这套说辞也有缝隙。什么叫「防御性」?谁来定义?如果某个合作伙伴拿到模型后,「防御性」地分析了竞争对手的系统,这算谁的? Anthropic的系统卡没回答这个。

更实际的问题是:锁得住吗?模型权重一旦流出,复制成本趋近于零。历史上没有哪项数字技术能被真正关进笼子,从Stuxnet到各种开源渗透工具,先例足够多。

Anthropic的赌注是,延迟发布能换取对齐(alignment)研究的时间。他们在系统卡里坦承,Mythos的「自主性」带来了新的对齐挑战——不是问「它会不会说谎」,是问「它会不会在我们没注意的时候做事」。

这有点像核不扩散协议的科技版。区别是,核武器需要浓缩铀和离心机,AI模型只需要一个下载链接。

所以最后的问题留给读者:如果最强的AI必须被锁起来,那「最强」的定义权在谁手里? Anthropic说Mythos太危险,那下一个做出类似模型的公司,会同意这个判断吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗伊斯兰革命卫队:若冲突继续将启用新作战方法

伊朗伊斯兰革命卫队:若冲突继续将启用新作战方法

每日经济新闻
2026-04-14 07:57:57
人穷能卑微到什么地步?网友说:一个男人两千块买了我三个晚上!

人穷能卑微到什么地步?网友说:一个男人两千块买了我三个晚上!

黯泉
2026-04-14 12:13:04
比亚迪着火:燃烧超3小时,超千辆车被毁,事因曝光,目击者发声

比亚迪着火:燃烧超3小时,超千辆车被毁,事因曝光,目击者发声

温柔看世界
2026-04-14 09:53:30
西班牙首相夫人正式被控多项腐败罪行

西班牙首相夫人正式被控多项腐败罪行

Nee看
2026-04-14 10:07:20
3月,拖后腿!我国外贸顺差,不再是高增长,而是暴跌50%以上

3月,拖后腿!我国外贸顺差,不再是高增长,而是暴跌50%以上

南生今世说
2026-04-14 11:01:52
辉瑞内部人士爆料,德国约有6万人死于新冠疫苗,马斯克:完全认同

辉瑞内部人士爆料,德国约有6万人死于新冠疫苗,马斯克:完全认同

可达鸭面面观
2026-04-13 16:37:24
“80后”毛焦尔将出任总理,匈牙利选举怎样影响欧洲和中匈关系?

“80后”毛焦尔将出任总理,匈牙利选举怎样影响欧洲和中匈关系?

齐鲁壹点
2026-04-14 07:18:11
撒贝宁和妻子当街吵架,妻子吼了两句话,撒贝宁:我第一次听有人提这种要求

撒贝宁和妻子当街吵架,妻子吼了两句话,撒贝宁:我第一次听有人提这种要求

小椰的奶奶
2026-04-14 12:31:32
中朝外长在平壤见面,中方重提“血盟条约”,美国该清醒下了

中朝外长在平壤见面,中方重提“血盟条约”,美国该清醒下了

第一军情
2026-04-14 12:10:03
美方封锁进出伊朗港口船只 外交部:只会激化矛盾 加剧局势紧张

美方封锁进出伊朗港口船只 外交部:只会激化矛盾 加剧局势紧张

财联社
2026-04-14 15:26:06
最新数据:美国从中国进口的智能手机比例从90%骤降至25%,组装中心加速转移

最新数据:美国从中国进口的智能手机比例从90%骤降至25%,组装中心加速转移

风向观察
2026-04-14 14:25:12
章子怡为新电影角色增重20斤,剧透照曝光,素颜状态让人认不出来

章子怡为新电影角色增重20斤,剧透照曝光,素颜状态让人认不出来

观鱼听雨
2026-04-13 20:38:29
访问大陆会被调查?萧旭岑:民进党“抗中害台”策略已不受欢迎

访问大陆会被调查?萧旭岑:民进党“抗中害台”策略已不受欢迎

海峡导报社
2026-04-14 11:12:08
交警提醒:新交规落地,高速143km/h不扣分,龟速行车直接扣3分!

交警提醒:新交规落地,高速143km/h不扣分,龟速行车直接扣3分!

复转这些年
2026-04-14 12:14:50
莫氏鸡煲拒收温氏千只鸡,老莫:没地放,没骂他;温氏股份:在沟通更多合作想法

莫氏鸡煲拒收温氏千只鸡,老莫:没地放,没骂他;温氏股份:在沟通更多合作想法

界面新闻
2026-04-14 10:23:03
伊朗官员说美若明智就别再冒险

伊朗官员说美若明智就别再冒险

财联社
2026-04-14 15:06:18
请陈芋汐正面回应:在知情的情况下,为何不退出282群?

请陈芋汐正面回应:在知情的情况下,为何不退出282群?

开成运动会
2026-04-13 20:23:15
比亚迪回应坪山园区一立体车库火情:为试验及报废车辆专用停放区 火势已扑灭 无人员伤亡

比亚迪回应坪山园区一立体车库火情:为试验及报废车辆专用停放区 火势已扑灭 无人员伤亡

财联社
2026-04-14 09:32:13
今天才知道,为啥鹅蛋很少有人吃?为啥卖鹅蛋的人很少?涨知识

今天才知道,为啥鹅蛋很少有人吃?为啥卖鹅蛋的人很少?涨知识

阿龙美食记
2026-04-12 15:01:18
女子买10瓶五粮液8瓶假,官方罚单已出!商家:你是“职业打假”人,我不赔

女子买10瓶五粮液8瓶假,官方罚单已出!商家:你是“职业打假”人,我不赔

大风新闻
2026-04-14 10:20:06
2026-04-14 15:39:00
硬核玩家2哈
硬核玩家2哈
沉淀中,勿扰
1383文章数 6关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

防范特朗普政府"对华软化" 史上最严对华芯片法案来了

头条要闻

防范特朗普政府"对华软化" 史上最严对华芯片法案来了

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

数码
旅游
游戏
教育
时尚

数码要闻

荣耀WIN游戏本首发东风尾喷散热引擎,WIN生态全面提速

旅游要闻

秀我中国|吉林集安:桃花次第开 小城迎客来

Switch 2立大功!日本25年主机游戏市场增长138.8%

教育要闻

初中数学,根式运算

今年科切拉的风吹向了谁?

无障碍浏览 进入关怀版