网易首页 > 网易号 > 正文 申请入驻

OpenAI警示:AI浏览器恐难完全摆脱提示注入风险

0
分享至

OpenAI 近日承认,带有代理(Agent)能力的 AI 浏览器在结构上难以彻底消除“提示注入”(prompt injection)攻击风险,即便持续加强防护,仍只能将其视为长期安全挑战而非可被完全“解决”的技术问题。 为此,公司正通过更快的安全修补节奏以及大规模自动化攻防演练,试图在真实攻击出现之前主动发现 Atlas 浏览器中的潜在漏洞。


OpenAI 于 10 月正式推出内置在 ChatGPT 中的 Atlas AI 浏览器后,安全研究人员随即演示,只需在 Google Docs 等页面中写入寥寥数语,即可悄然改变浏览器底层行为,这凸显了“代理模式”在访问用户邮箱、网站等开放环境时,安全攻击面被显著放大。 同日,Brave 在博客中也指出,间接提示注入是所有 AI 浏览器面临的系统性难题,Perplexity 的 Comet 等产品同样不例外。

这并非 OpenAI 一家的判断。英国国家网络安全中心(NCSC)本月早些时候警告称,针对生成式 AI 应用的提示注入攻击“可能永远无法被完全缓解”,网站可能因此遭遇大规模数据泄露。 NCSC 建议安全团队转而关注“降低风险和影响”,而不是寄望于彻底阻止此类攻击。 OpenAI 在最新博文中直言,将提示注入视为长期 AI 安全课题,必须持续加固防御。

在防御策略上,OpenAI 与 Anthropic、Google 等竞争对手的共识是:需要叠加多层防护并持续压力测试系统。 Google 近期的安全研究则侧重于在系统架构和策略层面对“代理型系统”施加约束,例如通过访问控制和行为策略减少风险。

不过,OpenAI 试图走出一条差异化路径——打造一个“基于大模型的自动化攻击者”。 这一系统本质上是一个扮演黑客角色的机器人,经由强化学习训练,专门寻找向 AI 代理“暗递”恶意指令的各种方法。 在内部测试中,攻击机器人可以先在模拟环境中发动攻击,系统会展示目标 AI 在看到这类攻击时的“思考过程”以及可能采取的动作,攻击机器人再据此调整策略并反复尝试。 OpenAI 认为,这种对目标模型内部推理过程的洞察,是现实世界攻击者所不具备的优势,因此有望更快发现隐藏漏洞。

OpenAI 表示,其强化学习攻击者能够引导代理执行复杂的、由数十步甚至数百步组成的有害操作流程,并在这一过程中摸索出此前在人类红队演练或外部报告中从未出现过的新型攻击路径。 这与当前 AI 安全测试领域常见做法一致——先构建能“踩边”的代理,在高频模拟中不断探索边界并反向加固防线。

在最新的演示中,OpenAI 展示了自动化攻击者如何向用户邮箱中悄然植入一封恶意邮件。 当 AI 代理稍后扫描收件箱、准备撰写外出自动回复时,它被邮件中隐藏的指令诱导,转而替用户发送了一封辞职邮件。 OpenAI 称,在最近一轮安全更新后,Atlas 的“代理模式”已经能够识别此类提示注入企图并向用户发出警报。 公司还强调,虽然提示注入难以实现“万无一失”的防御,但将通过更大规模的自动化测试和更快的补丁节奏,尽量在问题被攻击者利用前完成修复。

OpenAI 发言人拒绝透露这些更新是否已经在统计上显著降低成功攻击率,但表示公司自 Atlas 上线前就已与第三方安全机构合作,持续对该浏览器进行攻防演练,以强化其在提示注入方面的防护能力。

外部安全专家对这一路线持审慎肯定。网络安全公司 Wiz 的首席安全研究员 Rami McCarthy 指出,强化学习确实是一种持续适应攻击者行为的方式,但只能构成解决方案的一部分。 他提出,一个实用的风控框架是将 AI 系统的风险视为“自治程度 × 访问权限”的乘积。 在这一坐标系中,具备一定自主决策能力、但同时拥有极高数据访问权限的“代理浏览器”,天然处在风险较高的区域。

因此,业界许多建议都围绕“降低访问暴露”和“限制自主操作”展开。 例如,减少代理在登录状态下访问敏感账户的机会,以减少潜在攻击面;同时对发送消息、发起支付等关键动作设置强制用户确认,从而把代理的自主性控制在可接受范围内。 OpenAI 方面表示,Atlas 已经过训练,在发送消息或执行支付前会主动征求用户确认。 公司还建议用户尽量以明确任务指令来驱动代理,而不是笼统地赋予其广泛权限,例如不要简单地授权它“打理整个邮箱并采取一切必要行动”。 正如 OpenAI 所言,赋予代理过大的行动空间,会显著放大隐藏或恶意内容影响其决策的机会,即便系统内置了多重安全保障。

尽管 OpenAI 强调保护 Atlas 用户免受提示注入攻击是公司“头等优先级”,McCarthy 仍提醒外界,对这类高风险浏览器的投入产出比应持一定怀疑态度。 在他看来,就目前多数日常场景而言,“代理浏览器”为用户带来的增量价值,还不足以完全抵消其当前风险画像。 这类工具对邮箱、支付信息等敏感数据拥有高度访问权限,这既是其强大之处,也是其风险所在,而这种权衡短期内仍将十分尖锐。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大陆公安局正式向全球通告:悬赏25万元追捕两名台湾籍犯罪嫌疑人

大陆公安局正式向全球通告:悬赏25万元追捕两名台湾籍犯罪嫌疑人

科技处长
2025-12-24 14:51:42
圣诞大战最后一次交手?KD:面对詹姆斯总是压力大

圣诞大战最后一次交手?KD:面对詹姆斯总是压力大

体坛周报
2025-12-25 11:40:12
刚刚!人民币汇率正式破7,五大影响

刚刚!人民币汇率正式破7,五大影响

说财猫
2025-12-25 12:21:19
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
家中扒出大量“宝贝”后,南博前院长徐湖平被紧急带走

家中扒出大量“宝贝”后,南博前院长徐湖平被紧急带走

清书先生
2025-12-25 13:39:42
携程被迫发声明,但声明或会让信任再次崩塌,卸载潮难止!

携程被迫发声明,但声明或会让信任再次崩塌,卸载潮难止!

鲁八两
2025-12-25 18:20:23
287万粉丝网红主播被曝曾因贩毒等犯罪多次获刑 本人回应:你自己去查,这是我隐私

287万粉丝网红主播被曝曾因贩毒等犯罪多次获刑 本人回应:你自己去查,这是我隐私

红星新闻
2025-12-25 18:05:31
直接跌停!套利失败,快乐消失了...

直接跌停!套利失败,快乐消失了...

中国基金报
2025-12-25 16:33:27
直到海南封关后才明白,国家为何会投资700亿在广西挖平陆运河

直到海南封关后才明白,国家为何会投资700亿在广西挖平陆运河

南权先生
2025-12-25 17:08:13
澳门博彩巨头携员工赴井冈山,学习革命精神

澳门博彩巨头携员工赴井冈山,学习革命精神

跟着老李看世界
2025-12-25 13:02:12
2005年必将载入人类史册的7大事件

2005年必将载入人类史册的7大事件

史政先锋
2025-12-24 15:13:06
俄罗斯和朝鲜因20亿美元援俄士兵劳务款项正式闹掰

俄罗斯和朝鲜因20亿美元援俄士兵劳务款项正式闹掰

律法刑道
2025-12-23 22:50:36
洪秀柱赞郑丽文:确实让外界感觉到国民党“不一样了”

洪秀柱赞郑丽文:确实让外界感觉到国民党“不一样了”

参考消息
2025-12-25 15:06:07
上海阿姨独吞280万拆迁款,每天躺在百万现金上睡觉!法官最新回应

上海阿姨独吞280万拆迁款,每天躺在百万现金上睡觉!法官最新回应

新民晚报
2025-12-25 15:40:52
独居老人凌晨去世,消失的手机在冰箱里,“卧室整洁”的细节引起家人怀疑……

独居老人凌晨去世,消失的手机在冰箱里,“卧室整洁”的细节引起家人怀疑……

方圆
2025-12-22 16:30:46
去年10月以来首次!离岸人民币对美元收复“7”关口

去年10月以来首次!离岸人民币对美元收复“7”关口

澎湃新闻
2025-12-25 10:44:26
系好安全带!美国经济学家预测:2026年将出现“史上最严重的市场崩盘”!已持续近17年的市场泡沫将会破裂,导致股市下跌90%

系好安全带!美国经济学家预测:2026年将出现“史上最严重的市场崩盘”!已持续近17年的市场泡沫将会破裂,导致股市下跌90%

和讯网
2025-12-25 16:45:04
再见申京,火箭9换1交易方案,组史诗级双巨头,字母哥联手KD冲冠

再见申京,火箭9换1交易方案,组史诗级双巨头,字母哥联手KD冲冠

毒舌NBA
2025-12-25 16:54:43
为什么庞家敢硬刚南京博物馆,庞家的底蕴你想不到

为什么庞家敢硬刚南京博物馆,庞家的底蕴你想不到

鹤羽说个事
2025-12-25 11:39:22
某车企南极测试遭质疑,目前南极是夏季!

某车企南极测试遭质疑,目前南极是夏季!

电动知家
2025-12-25 08:41:32
2025-12-25 20:32:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
65906文章数 70017关注度
往期回顾 全部

科技要闻

屠龙少年被"招安"!英伟达平安夜豪掷200亿

头条要闻

287万粉丝网红被指曾贩毒 本人:你自己查 这是我隐私

头条要闻

287万粉丝网红被指曾贩毒 本人:你自己查 这是我隐私

体育要闻

单赛季11冠,羽坛“安洗莹时代”真的来了

娱乐要闻

朱孝天把阿信好意当球踢!

财经要闻

时隔15月,人民币升破7,三大推手曝光

汽车要闻

速来!智界在上海西岸准备了年末潮流盛典

态度原创

艺术
教育
房产
旅游
军事航空

艺术要闻

缅怀 | 著名油画家宫立龙逝世,享年73岁

教育要闻

12月20日雅思小作文示范写作 | 流程图 塑料瓶回收

房产要闻

太猛了!单月新增企业4.1万家,又一波巨头涌向海南!

旅游要闻

一日漫游闵行,解锁海派文旅新体验

军事要闻

泽连斯基版“和平计划”透露哪些信息

无障碍浏览 进入关怀版