网易首页 > 网易号 > 正文 申请入驻

OpenAI公布ChatGPT安全框架:跟踪、评估、安全基线等

0
分享至

12月19日,OpenAI在官网公布了“准备框架”(Preparedness Framework)测试版。该文档详细介绍了OpenAI是如何保证ChatGPT等产品的安全防护措施、开发和部署流程。

OpenAI表示,随着大模型的功能迭代不断完善,其能力已经开始接近初级AGI(通用人工智能),安全已成为开发AI模型的重中之重。

因此,OpenAI希望通过详细公布AI模型的安全框架透明化,使社会、用户深度了解模型的工作机制,确保以安全、健康的方式应用在实际业务中。同时为研发超级模型奠定安全基础。

详细文件地址:https://cdn.openai.com/openai-preparedness-framework-beta.pdf

跟踪风险类别

OpenAI明确列出了4类可能带来灾难性后果的风险领域需要特别关注,分别是网络安全风险、CBRN风险(化学、生物、放射性、核)、说客能力风险以及模型的自主能力风险。

并对每一类风险安全框架都给出了低、中、高、特别高四个等级,来描述系统在该风险领域所处的危险水平。

以网络安全风险为例,框架将低级定为系统仅可以用于非编程任务;中级为系统可以明显提高黑客攻击效率;高级为系统能够自动发现和利用高价值漏洞;

特别高级为系统能够自动找到和利用任何软件的漏洞。这种细分的安全体系,可以指导开发人员更精准的评估模型。

建立安全基线

OpenAI设定了严格的安全基线:只有在减轻后评分,为"中等"或以下的模型才能部署;只有安全评分为"高"的模型才能进一步开发、应用。

此外,对于评分卡中具有"高"或"关键"风险的模型,OpenAI还将确保相应的安全措施,以防止模型被窃取。

同时会定期动态跟踪和更新各类风险的“加强前”和“加强后”评级情况。“加强前”评估系统本身的风险水平,“加强后”看系统采取了哪些安全预防措施后余下的风险。

例如,某次评估显示,在没有采取任何措施的情况下,一个新模型在网络安全方面的加强前风险达到了高级。

经过一轮实验验证后,通过设计专门的安全模组后,该模型的加强后风险降到了中等水平。这可以清晰地告诉研发人员模型当前的安全状况,以及应采取哪些补救措施。

建立安全咨询团队

OpenAI将成立一个名为"安全咨询小组"(Safety Advisory Group,SAG)的跨职能咨询机构。该小组将汇集公司内部的专业知识,帮助OpenAI的领导层和董事会做出最佳的安全决策。

安全咨询小组的职责包括监督风险评估工作、维护应急情况处理的快速流程等。

OpenAI还成立了一个“准备团队”,专门负责模型的安全研发和维护该团队将进行研究、评估、监测和预测风险,并定期向"安全咨询小组"提供报告。

这些报告将总结最新的安全证据,并提出改进OpenAI研发大模型的安全计划建议。

此外,准备团队还将与相关团队(如安全系统、安全性、超级对齐、政策研究等)协调合作,整合出有效的安全措施。

此外,准备团队还将负责组织安全演练,并与可信AI团队合作进行第三方安全审计。

需要注意的是,这是一份动态文档,OpenAI会根据实际的安全情况对内容进行更新和说明。

本文素材来源OpenAI官网、Preparedness Framework文档,如有侵权请联系删除。

报告下载

大 佬观点分享

关于RPA、AI、企业数字化转型

(点击文字即可阅读)

行业知识交流分享,结识扩展人脉圈层

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
300万分界线!广州房东,慌了!

300万分界线!广州房东,慌了!

乐居广州
2026-06-04 14:44:36
回顾:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

回顾:女儿多次被虐待浑身淤青,父亲冲进教室,怒砍校霸13刀致死

就一点
2026-06-02 10:42:14
A股,尾盘传来“一个利好”信号,明天,或将迎来大变盘!

A股,尾盘传来“一个利好”信号,明天,或将迎来大变盘!

夜深爱杂谈
2026-06-04 22:07:23
郑州多人中招鹦鹉热!高烧40℃、双肺感染,别当作感冒

郑州多人中招鹦鹉热!高烧40℃、双肺感染,别当作感冒

大河健康
2026-06-03 10:41:36
洋葱立大功!医生发现:洋葱或对3种慢性病有好处!可以常吃

洋葱立大功!医生发现:洋葱或对3种慢性病有好处!可以常吃

芹姐说生活
2026-05-25 14:19:45
皇马免签27岁法国中卫!签4年+薪水1000万欧 连续2年挖利物浦主力

皇马免签27岁法国中卫!签4年+薪水1000万欧 连续2年挖利物浦主力

我爱英超
2026-06-04 06:53:57
你突然觉得桃酥好吃,这背后其实有个科学逻辑

你突然觉得桃酥好吃,这背后其实有个科学逻辑

宇宙来信2
2026-06-03 13:20:14
偷着乐吧!广西或许是中国位置最舒服的省份

偷着乐吧!广西或许是中国位置最舒服的省份

环球情报员
2026-06-04 13:55:44
俄方提出停战条件,网友:什么意思没看懂

俄方提出停战条件,网友:什么意思没看懂

东方豪侠
2026-06-04 05:44:22
日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

日媒突然发现一个扎心事实:中国人的生活里,日本货快找不着了

互联鱼
2026-06-02 19:32:57
58方老破小,我报价196万,被收房系统驳回...

58方老破小,我报价196万,被收房系统驳回...

广州楼市发布
2026-06-04 20:40:06
终身禁赛,2球迷因与文班亚马场上自拍事件被禁止进入所有NBA球馆

终身禁赛,2球迷因与文班亚马场上自拍事件被禁止进入所有NBA球馆

好火子
2026-06-04 23:12:25
既然菲方不稀罕中国援助,中方可以成全他们,毛宁打开天窗说亮话

既然菲方不稀罕中国援助,中方可以成全他们,毛宁打开天窗说亮话

阿伧说事
2026-06-04 23:55:53
入行前后判若两人,网约车司机活成这般模样

入行前后判若两人,网约车司机活成这般模样

网约车观察室
2026-06-03 21:41:43
欺人太甚!一家长因孩子备考,请求邻居约束噪音,对方回复没办法

欺人太甚!一家长因孩子备考,请求邻居约束噪音,对方回复没办法

火山詩话
2026-06-03 11:06:12
险胜泰国拿首胜!女排姑娘拼尽全力,赵勇临场指挥却满是槽点

险胜泰国拿首胜!女排姑娘拼尽全力,赵勇临场指挥却满是槽点

金毛爱女排
2026-06-04 22:21:42
“一桌子没几个做熟的菜”,小学女儿吃到哭,家长无视自身问题

“一桌子没几个做熟的菜”,小学女儿吃到哭,家长无视自身问题

熙熙说教
2026-06-04 19:46:20
1987年蒋经国看望被囚三十余年的孙立人,孙立人当面提出三项心愿

1987年蒋经国看望被囚三十余年的孙立人,孙立人当面提出三项心愿

唠叨说历史
2026-06-02 16:35:21
传香港4.3万亿大基金,盯上标普500了,金管局正低调选机构

传香港4.3万亿大基金,盯上标普500了,金管局正低调选机构

财通社
2026-06-04 18:27:29
人老了,发现一个现象:能让你快乐的无非三件事,1、后继有人

人老了,发现一个现象:能让你快乐的无非三件事,1、后继有人

富书
2026-06-03 23:45:03
2026-06-05 01:20:49
RPA中国 incentive-icons
RPA中国
RPA行业生态平台
2803文章数 1268关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

挪威发现满载中国瓷器的沉船:曾被撞击 瓷器保存完好

头条要闻

挪威发现满载中国瓷器的沉船:曾被撞击 瓷器保存完好

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

AI公司的顶部在哪?

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

本地
时尚
数码
家居
军事航空

本地新闻

用杨柳青年画的方式,打开天津

越做越素?美甲进入减法时代!

数码要闻

九州风神上架冰立方AK700VC单塔风冷散热器,449元

家居要闻

220平对味儿家 空间情绪宅

军事要闻

美众议院要求特朗普停止对伊动武并撤军

无障碍浏览 进入关怀版