网易首页 > 网易号 > 正文 申请入驻

打破“神话”垄断?英国研究证实GPT-5.5在网络安全领域展现顶尖实力

0
分享至

由于不可抗力的限流导致无法接收推送文章的问题,我们迫切需要以下操作:

点击标题下方蓝字 “一半杯 ” → 点击右上角“...” → 点选“设为星标★”,这样就更容易找到我们和收到推送文章

保持爱读文章,保持领先


人工智能领域的网络安全竞赛正进入白热化阶段。上个月,人工智能企业Anthropic对其名为Mythos Preview(预览版)的大语言模型进行了高调宣传,声称该模型在网络安全方面构成了巨大的威胁,并以此为由决定将其初始版本仅限“关键行业合作伙伴”使用。然而,这一“神话”的独特性似乎已被打破。根据英国人工智能安全研究所(AISI)发布的最新研究结果表明,OpenAI于上周公开发布的GPT-5.5模型在网络安全评估中,已经达到了与Mythos Preview相似的性能水平。

评估数据曝光:GPT-5.5在极高难度挑战中表现抢眼

自2023年以来,英国人工智能安全研究所(AISI)一直致力于通过95项不同的“夺旗赛”挑战来测试各类前沿AI模型的网络安全能力。这些复杂的测试涵盖了逆向工程、网络漏洞利用以及密码学等多个关键的专业领域。

在最高级别的“专家(Expert)”难度任务中,测试数据揭示了令人瞩目的结果:新近推出的GPT-5.5平均通过率达到了71.4%,这一成绩甚至略高于Anthropic公司Mythos Preview模型所取得的68.6%的平均通过率(尽管研究人员指出该差距仍在误差范围之内)。

在其中一项极其困难的特定任务中,AI需要构建一个反汇编程序来解码一段Rust二进制代码。AISI的研究报告特别指出,GPT-5.5在没有任何人类协助的情况下,仅耗时10分钟零22秒就成功解决了这项挑战,并且在此过程中产生的API调用成本仅为微乎其微的1.73美元。这一惊人的效率和低廉的成本充分展示了其在自动化代码解析和逆向工程方面的深厚实力。

深度渗透与破坏测试:突破防线与尚存的技术瓶颈

除了基础的任务外,模型们还接受了更为复杂和贴近实战的模拟攻击测试。在一个名为“The Last Ones (TLO)”的AISI测试靶场中,研究人员设置了一个针对企业网络的32步数据提取攻击模拟。在以往的测试中,没有任何一个早期的AI模型能够成功完成过哪怕一次这样的测试。

然而,在此次较量中,GPT-5.5在10次尝试中成功了3次,不仅打破了以往零成功的记录,还与Mythos Preview的表现(10次尝试中成功2次)旗鼓相当,甚至略胜一筹。

尽管如此,这并不意味着这些顶级AI已经可以在网络世界中为所欲为。在AISI设计的难度更高的“冷却塔”模拟测试中——该测试旨在模拟对发电厂控制软件的破坏企图——GPT-5.5同样未能成功实施破坏,这也是此前所有接受测试的AI模型共同面临的技术瓶颈。

业界观察:这是“特定模型突破”还是“行业整体进化”?

面对GPT-5.5交出的这份亮眼答卷,AISI在报告中给出了他们的专业洞察。研究人员指出,这些新的结果表明,在网络安全风险方面,Mythos Preview之前展现出的强大能力可能并非是“特定于某一个模型的突破”。相反,这反映出前沿AI技术在“长期自主性、推理能力和编程能力方面普遍提升的副产品”。这说明整个大模型行业的基础能力正在全面进化。

恐惧营销”惹争议:OpenAI CEO萨姆·奥特曼的犀利回应

伴随着模型能力的跃升,业界对于“模型过于危险而不能公开发布”的讨论也日益激烈。OpenAI首席执行官萨姆·奥特曼(Sam Altman)在最近接受《Core Memory》播客采访时,对这种现象表达了明确的看法。他严厉批评了某些公司在推广有限发布的AI模型时所采用的“基于恐惧的营销”策略。

奥特曼在采访中坦言,他“确信Mythos在网络安全方面是一个伟大的模型”,但他一针见血地指出:“说‘我们制造了一颗炸弹。我们打算把它扔到你的头上。然后我们将以1亿美元的价格卖给你一个防空洞’,这显然是令人难以置信的营销手段。”

奥特曼进一步预测,“未来将会有更多关于模型过于危险而不能发布的言论出现。”但他同时也承认了客观存在的行业风险,表示“确实也会有一些非常危险的模型,必须以不同的方式进行发布。”

受限发布的未来:OpenAI的“网络防御者”专属模型计划

事实上,虽然批评了同行的营销话术,OpenAI自身也在积极推进针对高风险网络安全模型的受控制发布机制。今年2月,OpenAI推出了“网络可信访问”试点计划。该机制允许安全研究人员和企业验证其身份,并注册他们研究OpenAI前沿模型以进行“合法的防御性工作”的意向。

利用这份可信访问名单,OpenAI在上个月严格控制了GPT-5.4-Cyber模型的有限发布。据OpenAI官方介绍,这是一个专为增强网络能力而有意进行微调的模型变体,并且减少了部分能力限制。

这一安全防御战略正在进一步延续。本周四,OpenAI首席执行官萨姆·奥特曼在社交媒体上正式宣布,GPT-5.5-Cyber的初始版本也将采取类似的受限发布策略,在接下来的几天内“仅限于关键的网络防御者”使用。

这场关于AI与网络安全的博弈,显然才刚刚拉开序幕。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

草莓解说体育
2026-04-12 17:05:01
戴手套!“72小时可夺命”,珠海、深圳曾有人中招→

戴手套!“72小时可夺命”,珠海、深圳曾有人中招→

珠海发布
2026-05-05 19:08:25
汪峰又陷感情风波!森林北删光恩爱动态,章子怡彻底赢麻了!

汪峰又陷感情风波!森林北删光恩爱动态,章子怡彻底赢麻了!

手工制作阿歼
2026-05-04 18:13:23
越来越猖狂的早餐店“铝包子”,我们应提高警惕,该如何辨别呢?

越来越猖狂的早餐店“铝包子”,我们应提高警惕,该如何辨别呢?

心中的麦田
2026-05-04 18:47:55
萨卡一剑封喉创造历史,阿森纳1-0马竞,时隔20年重返欧冠决赛

萨卡一剑封喉创造历史,阿森纳1-0马竞,时隔20年重返欧冠决赛

钉钉陌上花开
2026-05-06 04:54:10
凌晨两点,西部战区发出神秘命令:只为接回一位特殊的人

凌晨两点,西部战区发出神秘命令:只为接回一位特殊的人

Ck的蜜糖
2026-05-04 10:04:23
三星系统更新提速,用户却更焦虑了

三星系统更新提速,用户却更焦虑了

Ping值焦虑
2026-05-05 16:17:06
带着“护身符”返台后,赖清德嚣张表态,特朗普对中美做出新预测

带着“护身符”返台后,赖清德嚣张表态,特朗普对中美做出新预测

刘拕说体坛
2026-05-06 04:46:33
定了!火箭8人留队,位置无忧!乌度卡正式确定:保留全部教练组

定了!火箭8人留队,位置无忧!乌度卡正式确定:保留全部教练组

熊哥爱篮球
2026-05-05 12:55:46
53国集体免签进群!斯威士兰却死守“台独”群聊,一天怒亏3000万

53国集体免签进群!斯威士兰却死守“台独”群聊,一天怒亏3000万

健身狂人
2026-05-05 18:01:22
每天早上起来,就坚持默念3遍:不是迷信,你的命运就会悄悄改变

每天早上起来,就坚持默念3遍:不是迷信,你的命运就会悄悄改变

金沛的国学笔记
2026-05-03 10:16:13
2001年,夫妻签离婚协议时发现没笔,妻子独自上楼取笔时遇刺身亡

2001年,夫妻签离婚协议时发现没笔,妻子独自上楼取笔时遇刺身亡

明月清风阁
2026-05-05 21:25:06
45年坚守,一舞破圈!“法拉利大叔”许文飙:最想告诉父亲,儿子被看见了

45年坚守,一舞破圈!“法拉利大叔”许文飙:最想告诉父亲,儿子被看见了

极目新闻
2026-05-05 18:06:15
小龙虾大量上市,今年为啥遇冷了?店家:4个原因,太现实了

小龙虾大量上市,今年为啥遇冷了?店家:4个原因,太现实了

餐饮新纪元
2026-05-05 07:11:55
陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

陪玩陪睡根本不够!认干爹、舔手指,背地里的阴暗面完全藏不住了

杰丝聊古今
2026-05-03 13:35:27
想不通!钱越来越难挣,五一到处却人山人海,西安网友吐槽引热议

想不通!钱越来越难挣,五一到处却人山人海,西安网友吐槽引热议

火山詩话
2026-05-04 18:08:37
最新放假通知:连休3天,不调休!

最新放假通知:连休3天,不调休!

家住朝阳
2026-05-05 18:02:57
婆婆来电说小姑子癌症晚期,让我卖房凑医药费,我反问您咋不卖

婆婆来电说小姑子癌症晚期,让我卖房凑医药费,我反问您咋不卖

游戏收藏指南
2026-05-06 05:35:08
权志龙穿涉种族歧视T恤登台!公司火速道歉

权志龙穿涉种族歧视T恤登台!公司火速道歉

喜欢历史的阿繁
2026-05-04 20:04:49
火箭离队首人?3分不稳定+防守不拔尖,“玻璃人”还要价4年1.2亿

火箭离队首人?3分不稳定+防守不拔尖,“玻璃人”还要价4年1.2亿

大卫的篮球故事
2026-05-05 17:42:46
2026-05-06 07:04:49
一半杯 incentive-icons
一半杯
分享有趣兼具价值的文章,严谨思辨的文字。
469文章数 148关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

头条要闻

媒体:中国史无前例下"阻断禁令" 美媒迅速捕捉到信号

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

内娱真情谊!杨紫为谢娜演唱会送花篮

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

房产
旅游
家居
数码
教育

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

旅游要闻

“没想到,开封这么会‘留人’”(新视窗·聚焦体验经济)

家居要闻

灵动实用 生活艺术场

数码要闻

微星“MAG 276QRDY54”27英寸显示器发售,6299元

教育要闻

富人才不会把女儿养这么胖!家长晒女儿喝60元矿泉水,被网友群嘲

无障碍浏览 进入关怀版