网易首页 > 网易号 > 正文 申请入驻

AI 强到这一步了?发布上线,但不敢让普通人用

0
分享至

我觉得,人类或许正在以一种超出常规认知的速度在被 AI 追赶。

不知道你们的现状是怎样的,至少我现在已经完全离不开 AI 了,我每天的工作中至少有 50% 是 AI 辅助完成的。

而且,这个比例还在持续提升。

与此同时,随着一代又一代新模型的推出,不管是我的工作效率和质量,还是我在 Token 上的每月消费,都在快速增长。

昨晚我看了个消息,Anthropic 发布了一个连他们自己都不敢公开给所有人使用的模型,因为真的太强了。

这个新模型的名字叫「Mythos」,翻译成中文就是「神话」的意思。

目前是预览版,所以官方叫它「Mythos Preview」。不过,这次是以一个叫「Project Glasswing」的项目形式推出的。

关于这个项目,我后面会讲。


上个月,Anthropic 一份内部文档意外泄露,里面提到有一个比 Opus 更大、更强的模型正在开发,代号就是 Mythos。

随后,Anthropic 把这次泄露归因于「人为错误」,也没有进一步说明理由。

现在,这个代号是 Mythos 的模型算是正式官宣了。

官宣归官宣,但它并没有公开发布上线。也就是说,普通用户还不能使用。

原因很直接,Anthropic 觉得这个模型太强了,在安全机制到位之前不适合向所有人开放。

我觉得,这句话值得停下来想一秒。

通常,一家 AI 公司发布新模型巴不得第一时间上线抢占市场,但这次 Anthropic 的做法明显有点反常。

在我看来,不是他们不想发,而是不敢发。

因为,这个叫 Mythos 的模型的确很强大。

先看几个官方公布的测试数据。

在编码能力上,Mythos 和目前公开最强的 Claude Opus 4.6 之间的差距不小,在各项基准测试中,Mythos 基本是完胜 Opus 4.6。


推理能力上,在 GPQA Diamond(研究生水平科学问答)测试中,结果是 94.6% vs 91.3%,Mythos 胜。

在 Humanity's Last Exam 有工具和无工具测试中,也都是 Mythos 完胜。


跟 Agent 有关的计算机操作能力上,OSWorld-Verified(自主完成电脑任务),Mythos 以 79.6% 超过 Oputs 4.6 的 72.7%。

每一个维度上,Mythos 都强于 Opus 4.6,有些甚至是碾压式超过。


在一些任务表现上,差距已经不是小步迭代,而是大幅跃升。比如 SWE-bench Multimodal 从 27.1% 跳到 59%,几乎翻了一倍。

让他们不敢上线 Mythos 的一个最核心原因,就是它突破软件世界的安全防线能力太强了。

说白了,全世界所有的系统和软件都有漏洞,而 Mythos 可以用超过人类的水平发现并攻击这些漏洞。

假设,这种能力被黑客掌握,那全世界的操作系统和软件都会遭殃,尤其是一些公共基础设施和国家安全。

Anthropic 在公告里有这么一句话,看完后我觉得细思极恐。


翻译过来就是:「 AI 模型的编码能力已经达到了极高水平,在发现和利用软件漏洞方面,它们几乎可以超越除最熟练的人类之外的所有人」。

关于这句话,我想多展开一下。

我是程序员出身,所以我知道软件的构建方式是怎样的,以及不同人写出来的代码差异有多大。

还有,没有哪个软件敢说自己没有漏斗,即便这个漏洞从来没被发现过。

以前的漏洞之所以能几十年安静地躺在系统里,并不是因为系统足够安全。

而是因为找漏洞这件事,需要极高的专业能力,极大的耐心和精力,以及大量的时间。

会的人太少,敢投入的人就更少了。

这种「能力稀缺」,构成了整个软件安全世界的隐性前提。AI 介入之后,这个前提就开始松动了。

AI 能以超过大多数非顶尖人类能力的方式开展工作,我们可以用它来攻击漏洞,当然也可以用它来堵住漏洞。

为了解决这个问题,接下来我说下 Anthropic 搞的这个 Project Glasswing 是什么。

简单说,这是一个利用 Mythos 的能力帮全世界基础设施系统找 bug 的项目。

参与方包括 AWS、苹果、微软、谷歌、英伟达、思科、Linux 基金会等共计 12 家机构。


这个阵容覆盖了云计算、操作系统、芯片、浏览器、金融基础设施、网络安全和开源生态。

换句话说,全球数字基础设施的核心参与者几乎都在这个项目里了。

这个项目的核心逻辑只有一条,让防守方先用上这个顶级 AI 模型的能力。

因为如果攻击方先拿到同等级的工具,窗口一旦打开就很难关上。Anthropic 承诺提供 1 亿美元的模型使用额度,覆盖研究预览期。

除了 12 家核心机构,还有超过 40 个维护关键软件基础设施的组织获得了访问权限,可以用 Mythos 扫描自家系统和开源项目。

同时,Anthropic 向 Linux 基金会捐了 250 万美元,向 Apache 软件基金会捐了 150 万美元,这二者都是软件世界的基础设施。

这么说吧,我们现在使用的各种 App、网站、系统,基本上都是以他们为底层架构的。

在我看来,Anthropic 这次算是干了件好事,不仅推出了更强的模型,还花钱给全球信息基础设施让他们来完善自己。

毕竟,如果裸上的话,对谁都没有好处。

可能说到这你还是感觉不到 Mythos 到底有多强,我从官方原文里看到了三个具体案例,我觉得比数字更能说明问题。


第一个,OpenBSD。

这是公认安全性极高的操作系统,很多关键基础设施会跑在上面,包括我们用的苹果手机 iOS 系统、Android 系统、甚至一些企业和机构内部系统。

Mythos 在里面发现了一个存在了 27 年的漏洞,攻击者只要连上目标机器,就能让它远程崩溃。

27 年!不是没人在意,是压根没人找到。

第二个,FFmpeg。

几乎所有需要处理视频的软件都依赖它,你们用的各种视频播放软件基本上都有它的身影。

有个漏洞躲在一行写于 16 年前的代码里,自动化测试工具反复攻击了整整 500 万次,每次都没找到。

但是,Mythos 找到了。

第三个,Linux 内核。

这个就不用多说了,基本上可以说是整个互联网的基础设施,也最值得警惕。

Mythos 不只是发现了几个独立漏洞,而是把多个漏洞串联成一条攻击链。

从普通用户权限开始,一路提权,最终实现对整台机器的完全控制。

关于 Linux 这个,和前两个案例的性质完全不一样。

找漏洞,是分析能力。

但串漏洞,就是策略能力了。

就像很多产品经理,会画原型图会写文档会做数据分析,这些是单点能力。但把业务、产品、商业串起来,就是策略能力了。

一个能规划攻击路径的模型,已经不只是审计工具了,它更接近于一个可以在数字环境里主动行动的智能体。

以上三个案例,Anthropic 采取的都是先发现、先报告、先修复、再披露的方式,目前均已修复。

看到这,你就知道 Mythos 有多强了,就像一头暂时不敢被放出笼的猛兽,现实世界需要先做好适应它的准备。

我想在这里说几个观察,或许也是接下来真正变化的开始。

第一,软件世界的安全假设正在失效。

今天我们习以为常的软件稳定性,并不完全来自系统设计足够好。很大程度上,它依赖的是攻击能力的稀缺。

说得直白点,不是软件足够强,而是人不够强。

找漏洞需要成本,构造利用链需要时间,大规模扫描需要资源。所以很多技术债、陈年 bug、老旧系统就那样活着,从没被认真清理过。

就像我们做产品一样,我们觉得逻辑闭环了,没问题了,并不代表真的万事无忧了,很可能是我们的能力上限到了。

Mythos 展现的能力,是漏洞从被发现到被利用的时间窗口从过去的几个月被压缩到了几分钟。

几分钟意味着什么?

意味着补丁的节奏,修复的流程,已经开始跟不上攻击的速度了。

第二,开源世界会最先感受到压力。

今天大多数现代软件,底下都压着大量开源依赖。平时看不见,一旦被打穿,就是全行业同时受影响。

可能有读者不是很了解这个逻辑,用大白话说,就是我们现在使用的所有软件都有开源项目作为底层,而这些项目的源代码是对所有人可见的。

以后当模型能持续地、大规模地扫描开源项目,开源社区维护者们面对的压力级别会完全不一样。

这也是为什么 Anthropic 要给 Linux 基金会和 Apache 基金会捐钱的原因。

不是做公益,而是承认开源基础设施是 AI 时代整个数字世界最脆弱、也最不能倒的那层地基,他们不想被当做坏人和恶人而已。

第三,人会被弱化,AI 开始和 AI 博弈。

以前互联网产品安全团队的价值,在于人的判断力、经验积累和对系统的深度理解。

未来,这件事会换个逻辑。

比的是谁的模型更强,谁的工具接得更快,谁能把 AI 审计嵌进开发流程的最前端。

这不是程序员被替代的问题,而是安全行业本身的生产方式会重组。

好的那面,是数千个高危漏洞可以在几周内被找出来。麻烦的是,攻击方迟早也会有同等级的工具。

到那个时候,软件产品的安全不再是人和人的对抗,而是模型和模型之间的攻防博弈。

这次,Anthropic 不只发布了能力,还发布了风险。可能是目前这个阶段,整个行业最需要看到的那种诚实。

所有人都在谈 AI 如何改变工作效率,这没毛病。

但 Mythos 也在提醒我们,AI 能力的跃最终会从内容世界传导到软件世界,再传导到整个数字世界的基础设施。

内容世界被改写,影响的是流量逻辑。

软件世界被改写,动的是地基。

此时,我想起了电影《2012》里的一句台词,也作为这篇文章的结尾吧。

「无论你是谁,不分种族,不分国家,明天我们都没有区别!」

PS:我很少写这种长文,看到这你至少已经花了10分钟,说明你是拥抱变化喜欢思考的人。那么,就来个点赞、在看、转发,让更多人加入对明天的期待中。

················· 唐韧出品 ·················

安可时刻

昨天看完 Mythos 的官方介绍后,我起身走到窗边发了一会儿呆。

没想什么,只是有点恍惚,而我的几个 AI 员工还在电脑上帮我干活,有的在分析数据、有的在搭建文章框架、有的在写项目文档。

昨天我还新招了个 AI 员工,取名唐小艺,以后我所有的封面图、海报、甚至我的日常摄影需求都交给他了。


以下,就是他给我「拍」的一张照片,还原了上面我描述的场景。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
尖扎黄河特大桥垮塌事故调查详情公布:违规购买使用劣质螺栓

尖扎黄河特大桥垮塌事故调查详情公布:违规购买使用劣质螺栓

南方都市报
2026-04-08 21:15:06
曝广东男篮锁定救火外援,NBL盖帽王将加盟,身高2米13场均17+11

曝广东男篮锁定救火外援,NBL盖帽王将加盟,身高2米13场均17+11

篮球看比赛
2026-04-09 10:10:07
乌克兰清除安全局前叛徒负责人利亚普金!连续击中两座俄军机场

乌克兰清除安全局前叛徒负责人利亚普金!连续击中两座俄军机场

项鹏飞
2026-04-06 22:06:05
伊朗发现重大惊喜,打向以色列的导弹,一颗竟然都没被拦截

伊朗发现重大惊喜,打向以色列的导弹,一颗竟然都没被拦截

纪中百大事
2026-04-09 10:02:43
这样的“规则”太“霸王” !无法说话,四肢瘫痪,16岁女孩误购演唱会门票求退票,平台规则“概不退票”

这样的“规则”太“霸王” !无法说话,四肢瘫痪,16岁女孩误购演唱会门票求退票,平台规则“概不退票”

新民晚报
2026-04-08 12:58:55
尘埃落定!世乒赛大名单确定,樊振东做出牺牲,温瑞博被寄予厚望

尘埃落定!世乒赛大名单确定,樊振东做出牺牲,温瑞博被寄予厚望

曹说体育
2026-04-08 12:12:29
女生要主动起来跟想象中完全不一样!网友:让我递毛巾 瞬间开窍了

女生要主动起来跟想象中完全不一样!网友:让我递毛巾 瞬间开窍了

另子维爱读史
2026-01-26 18:39:06
骑士122-116险胜老鹰,米切尔迎2大里程碑,但阿特金森却如坐针毡

骑士122-116险胜老鹰,米切尔迎2大里程碑,但阿特金森却如坐针毡

毒舌NBA
2026-04-09 10:10:09
97岁吴越权臣发动政变,不杀君王不诛百官,为何只灭水丘氏一族?

97岁吴越权臣发动政变,不杀君王不诛百官,为何只灭水丘氏一族?

小莜读史
2026-04-08 08:58:35
事态严重了,中方接到日媒消息,日本远导锁定东海,俄已选边站

事态严重了,中方接到日媒消息,日本远导锁定东海,俄已选边站

遁走的两轮
2026-04-09 07:36:05
为何好多小国都莫名其妙反华?马斯克一语道破本质

为何好多小国都莫名其妙反华?马斯克一语道破本质

兴史兴谈
2026-04-06 02:41:27
神级挑战+制胜4罚!米切尔31+7赢潜在首轮对决 哈登出战19胜6负

神级挑战+制胜4罚!米切尔31+7赢潜在首轮对决 哈登出战19胜6负

颜小白的篮球梦
2026-04-09 10:09:36
利物浦0射正遭巴黎吊打!4连败+33%输球率,65年耻辱纪录诞生

利物浦0射正遭巴黎吊打!4连败+33%输球率,65年耻辱纪录诞生

篮球看比赛
2026-04-09 10:12:41
米特里策被队内罚6万欧,许多浙江球迷在公告评论区表示对俱乐部失望

米特里策被队内罚6万欧,许多浙江球迷在公告评论区表示对俱乐部失望

懂球帝
2026-04-08 23:05:08
汕头一加油站逃税!被罚118万元!

汕头一加油站逃税!被罚118万元!

ilove汕头
2026-04-08 20:04:25
八国联军侵华,7个国家瓜分中国,唯独一国反对,如今成超级大国

八国联军侵华,7个国家瓜分中国,唯独一国反对,如今成超级大国

文史达观
2025-03-08 06:45:05
双色球26039期彩票周四4月9日实票10注本文内容仅供分析

双色球26039期彩票周四4月9日实票10注本文内容仅供分析

王晓爱体彩
2026-04-09 07:20:07
小米电视S Mini LED 2026系列开启预售,首发价3099元起

小米电视S Mini LED 2026系列开启预售,首发价3099元起

IT之家
2026-04-08 10:38:43
张雪都夸的豪爵摩托,今年将新出4款,涵盖125—350,有中意的吗

张雪都夸的豪爵摩托,今年将新出4款,涵盖125—350,有中意的吗

小李子体育
2026-04-08 16:47:01
《八千里路云和月》出圈理由:王阳的演技,万茜的脸,于和伟出演

《八千里路云和月》出圈理由:王阳的演技,万茜的脸,于和伟出演

一娱三分地
2026-04-08 13:57:10
2026-04-09 10:47:00
唐韧 incentive-icons
唐韧
用产品思维解决难题
1448文章数 2022关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

福建45岁女子驾车坠河5人遇难有3名儿童 家属最新发声

头条要闻

福建45岁女子驾车坠河5人遇难有3名儿童 家属最新发声

体育要闻

40岁,但实力倒退12年

娱乐要闻

具俊晔最新露面,又黑又瘦情绪低迷

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

艺术
家居
数码
健康
亲子

艺术要闻

庞茂琨 2026油画写生新作

家居要闻

清新自然 复古风尚

数码要闻

三星显示:显示器用QD-OLED面板累计出货500万块

干细胞抗衰4大误区,90%的人都中招

亲子要闻

如何判断孩子肚子里有没有蛔虫?儿科医生来教你

无障碍浏览 进入关怀版