网易首页 > 网易号 > 正文 申请入驻

没人教它黑客技术,GPT-5.5却打败了人类安全专家

0
分享至

「没人训练GPT-5.5去黑客攻击。他们训练它思考,黑客能力就自己冒出来了。」这是英国人工智能安全研究所(AISI)最新评估报告里唯一值得被记住的句子,也是大多数报道会忽略的一句话。

导读:OpenAI的GPT-5.5刚刚成为第二个完成AISI 32步网络靶场端到端攻击的AI。三周前,Anthropic的Mythos Preview是第一个。不同实验室,不同架构,相似得分。第一个结果不是异常值,是曲线的起点。


一、71%背后的真相:思考能力的副产品

GPT-5.5在AISI专家级网络任务中拿到71.4%,略高于Mythos Preview的68.6%。它完成了"The Last Ones"——AISI设计的32步企业网络攻击——10次尝试中成功了2次。

关键细节:AISI评估的是基础模型,不是专门放开的网络攻击版本。

他们的结论很明确:网络攻击技能是推理能力的副产品,不是专门训练出来的能力。没人教这些模型去黑客攻击。教的是思考。黑客攻击自己掉出来了。

对比数字:GPT-5.4是52.4%,Claude Opus 4.7是48.6%。从52%跳到71%,不是渐进优化,是能力性质的跃迁。

这些任务本身很硬核:内存损坏漏洞利用、破解加密实现、逆向剥离符号的二进制文件。人类安全研究员通常要花几小时甚至几天。

二、10分22秒 vs 12小时:速度重构攻击形态

评估中有一个任务要求逆向工程一个自定义虚拟机。一位配备专业工具的人类专家花了约12小时。GPT-5.5用了10分22秒。

大约70倍速度差。而且这不是靠暴力枚举能解决的问题。逆向工程自定义虚拟机是结构性工作:阅读从未见过的指令,推断语义,在脑中构建一台无人记录过的机器的模型。这类任务 historically 区分资深研究员和初级人员。

结果不是攻击者变便宜了,是变快了。他们能迭代更多,尝试更多目标,更快放弃死胡同。攻击工作流的形态从"选一个二进制文件,投入一天"变成"一个下午铺开整个组合"。

三、两条曲线的交汇:这是整个领域的事

三周前Mythos Preview成为首个完成32步攻击的AI时, framing 很自然:单一模型,单一里程碑,可能无法泛化的孤例。

GPT-5.5把它泛化了。相同评估,不同实验室,不同基础架构,可比得分。Mythos 10次中成功3次,GPT-5.5是2次。方差很小,趋势很大。

我第一次读报告时漏掉了这一点。Mythos的发布隐晦地把结果当成Anthropic交付的东西。AISI的观点——我现在认为是对的——是:这是整个领域交付的东西。

谁会被替代:进攻性研究市场的底部。熟练的红队人员不会消失,但地板下沉了。任何初级人员一天能解决的问题,模型现在几分钟解决,最终答案相同。

数据收束:71.4%、68.6%、52.4%、48.6%——四个数字画出一条陡峭上升的曲线,起点是"需要专门训练",终点是"思考能力的副产品"。当两个独立实验室的基础模型在相同基准上 converge 到相近水平,这不再是产品发布的故事,是能力涌现的坐标。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
孙杨私生子风波升级,处处忍让的张豆豆,终究不再顾及所谓体面

孙杨私生子风波升级,处处忍让的张豆豆,终究不再顾及所谓体面

一盅情怀
2026-04-30 15:59:37
马云预言又应验!若无意外,2026年起,中国房地产或迎来3大转变

马云预言又应验!若无意外,2026年起,中国房地产或迎来3大转变

社会日日鲜
2026-05-02 09:45:05
世界超级摩托车锦标赛匈牙利站“张雪机车”夺冠

世界超级摩托车锦标赛匈牙利站“张雪机车”夺冠

界面新闻
2026-05-02 20:37:32
路透社:中国批准对美航空航天至关重要的稀土出口

路透社:中国批准对美航空航天至关重要的稀土出口

社会日日鲜
2026-05-02 09:56:18
C-929项目:中俄合作调整,首飞提前至2027年

C-929项目:中俄合作调整,首飞提前至2027年

黑翼天使
2026-05-01 06:41:22
蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

蒋介石在他的日记里坦言:重庆谈判时放走毛泽东,全是因为这2点

伦伦妈爱历史
2026-05-02 10:01:48
日本:射程之内!

日本:射程之内!

新民周刊
2026-05-01 09:17:00
5.2世乒赛国乒首秀:孙颖莎12-10遭遇困难,张本美和大爆发11-0

5.2世乒赛国乒首秀:孙颖莎12-10遭遇困难,张本美和大爆发11-0

越岭寻踪
2026-05-02 18:05:19
很多公司已经发不出工作了,网友说:公司的清华学霸都被优化了!

很多公司已经发不出工作了,网友说:公司的清华学霸都被优化了!

黯泉
2026-05-02 13:57:41
紧急预警!松山湖今天有1亿人!东莞多地“密密麻麻全是人”!

紧急预警!松山湖今天有1亿人!东莞多地“密密麻麻全是人”!

东莞好生活
2026-05-02 17:34:55
央视不买世界杯天价电视转播权,没想到球迷一边倒地支持!

央视不买世界杯天价电视转播权,没想到球迷一边倒地支持!

达文西看世界
2026-05-01 19:00:14
地球已经装不下追觅这么牛的公司了

地球已经装不下追觅这么牛的公司了

老斯基财经
2026-04-30 11:05:19
我救了一个美女,隔天她成了我总裁,开会时说:臭流氓,怎么是你

我救了一个美女,隔天她成了我总裁,开会时说:臭流氓,怎么是你

千秋文化
2026-05-01 18:56:26
许家印为何必须进去?野心膨胀:想当世界首富+参政 国家只能动手

许家印为何必须进去?野心膨胀:想当世界首富+参政 国家只能动手

念洲
2026-05-02 09:22:06
男篮世预赛赛程公布:7月3日主场战日本 6日中立场地战中国台北

男篮世预赛赛程公布:7月3日主场战日本 6日中立场地战中国台北

醉卧浮生
2026-05-02 17:55:24
仅一夜!NBA诞生3大抢七!火箭成最大输家,两大夺冠热门悬了

仅一夜!NBA诞生3大抢七!火箭成最大输家,两大夺冠热门悬了

篮球扫地僧
2026-05-02 21:19:33
近6轮中超首胜!浙江2-1逆转新鹏城 王钰栋世界波绝杀+破7场球荒

近6轮中超首胜!浙江2-1逆转新鹏城 王钰栋世界波绝杀+破7场球荒

我爱英超
2026-05-02 21:42:44
巴雷特三分准绝杀!猛龙加时胜骑士3-3拖进抢七 哈登16+9+9

巴雷特三分准绝杀!猛龙加时胜骑士3-3拖进抢七 哈登16+9+9

醉卧浮生
2026-05-02 10:30:14
A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

夜深爱杂谈
2026-05-02 09:55:01
李小冉这也太绝了吧,我P都不敢P这么白

李小冉这也太绝了吧,我P都不敢P这么白

喜欢历史的阿繁
2026-05-02 12:43:27
2026-05-02 21:52:49
爬虫饲养员
爬虫饲养员
业余养了只叫“龙虾”的AI爬虫,主业是给互联网打工。
2056文章数 20关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

香港两名6旬男女码头长凳上做不雅行为 被人拍下传网上

头条要闻

香港两名6旬男女码头长凳上做不雅行为 被人拍下传网上

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

高圆圆赵又廷游三亚 牵手逛街好甜蜜

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

艺术
时尚
教育
健康
亲子

艺术要闻

色块与笔触的激情之旅!

连衣裙还得是“法式”,性感妩媚却不轻浮

教育要闻

今年高校毕业生达1270万,十年间增幅60%

干细胞治烧烫伤面临这些“瓶颈”

亲子要闻

麻麻们都喜欢的儿子

无障碍浏览 进入关怀版