应对AI提示注入攻击：OpenAI 宣布为 ChatGPT 企业版新增锁定模式，高风险功能统一标注警示标签|openai

应对AI提示注入攻击：OpenAI 宣布为 ChatGPT 企业版新增锁定模式，高风险功能统一标注警示标签

2026-02-14 16:39:48　来源: 金融界

北京举报

分享至

2 月 14 日，OpenAI 于 2026 年 2 月 13 日发布公告，宣布为 ChatGPT 新增高级安全设置。

OpenAI表示，随着 AI系统开始承担更复杂的任务，尤其是涉及网页与外部应用的场景，安全风险也随之激增，其中一种日益凸显的新型风险便是“提示注入”（promptinjection）。在此类攻击中，第三方会通过提示词误导 AI 以使其执行恶意指令，或诱导其泄露内部敏感信息。

为帮助用户与组织降低提示注入攻击风险，OpenAI 宣布推出两项新的防护措施，IT之家总结如下：

其一是 ChatGPT 的“Lockdown Mode（锁定模式）”，这是一项面向高风险用户的可选高级安全设置；

其二是针对部分可能引入额外风险的能力，在 ChatGPT、ChatGPT Atlas 与 Codex 中统一新增“Elevated Risk”风险标签。

OpenAI 称，这些新增措施建立在其现有的多层防护之上，包括沙箱机制、针对基于 URL 的数据外泄的防护、监测与执行机制，以及企业级控制功能，例如基于角色的访问控制与审计日志等。

据介绍，锁定模式是一项可选的高级安全设置，主要面向少量高度重视安全的用户群体，例如大型组织的高管或安全团队，用于提升对高级威胁的防护能力。

OpenAI 强调，大多数用户并不需要启用锁定模式。其核心目标是通过严格限制 ChatGPT 与外部系统的交互方式，降低提示注入等攻击导致的数据外泄风险。

OpenAI 表示，锁定模式会以确定性方式禁用 ChatGPT 中某些可能被攻击者利用的工具与能力，从而避免攻击者通过提示注入等手段，将用户对话或已连接应用中的敏感数据外传。

作为例子，OpenAI 提到，在锁定模式下，ChatGPT 的网页浏览功能将被限制为仅访问已缓存内容。该限制旨在防止敏感数据在浏览过程中被攻击者获取或外泄。对于某些无法提供强确定性数据安全保证的功能，锁定模式下则会直接完全禁用。

OpenAI同时指出，ChatGPT 的商业订阅版本已提供企业级数据安全能力，而锁定模式是在此基础上的进一步增强。该模式目前适用于 ChatGPTEnterprise、ChatGPT Edu、ChatGPT for Healthcare 与 ChatGPT forTeachers。管理员可以在 Workspace Settings中通过创建新角色来启用锁定模式。启用后，锁定模式会在现有管理员设置之上叠加额外限制。

由于部分关键工作内容仍依赖外部应用，OpenAI 表示 Workspace 管理员仍可获得更细粒度的控制能力：管理员可以精确选择哪些应用、以及这些应用内的哪些具体操作，可在锁定模式下提供给用户使用。

OpenAI 还提到，除锁定模式外，其 Compliance API Logs Platform 还可提供对应用使用情况、共享数据与连接来源的更详细可见性，帮助管理员保持监管与审计能力。OpenAI 表示，计划在未来几个月将锁定模式提供给消费者用户。

在风险标签方面，OpenAI表示，AI产品在连接应用与网页后往往更有帮助，公司也在保护连接数据安全方面投入大量工作。但与此同时，某些与网络相关的能力会引入新的风险，而这些风险尚未被行业现有的安全与防护措施完全解决。OpenAI认为，一部分用户可能愿意承担这些风险，因此重要的是让用户能够自行决定是否、以及如何使用这些能力，尤其是在处理个人私密数据时。

OpenAI表示，其做法是在产品内为可能引入额外风险的功能提供使用指引。为使这一指引更清晰、更一致，公司正在标准化对一小部分现有能力的标注方式。这些功能将以统一的“ElevatedRisk”标签呈现在 ChatGPT、ChatGPT Atlas 与 Codex 中，使用户在不同产品中遇到同类能力时都能获得一致提示。

OpenAI以 Codex 举例称，在其编程助手产品中，开发者可以授予 Codex网络访问权限，使其能够在网页上执行诸如查阅文档等操作。但相关设置界面将显示“风险提升”标签，并提供明确说明，包括启用后会发生哪些变化、可能引入哪些风险、以及何时适合开启该访问权限。

本文源自：IT之家

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.