网易首页 > 网易号 > 正文 申请入驻

ChatGPT模型“行为准则”大更新:鼓励“无禁区”“调教”AI

0
分享至

OpenAI宣布对其AI模型的“行为准则”——Model Spec进行了重大更新。这是继去年5月首次发布后的又一次迭代,旨在进一步平衡用户自由、透明度和安全防护,同时将新版规范全面开源,供全球开发者和研究者自由使用与改进

核心更新:用户能更自由地“调教”AI,但安全仍是底线

此次更新的核心理念是“用户主导,安全兜底”

  • 可定制性增强:用户和开发者能更灵活地调整AI的行为模式,例如设置对话风格(如亲切或专业)、调整回答偏好(如简洁或详细)。但OpenAI强调,所有自定义操作必须在平台设定的安全边界内进行,避免模型被用于制造危险或侵犯隐私

  • 链式指令优先级:当用户、开发者和平台规则冲突时,Model Spec明确了指令的优先级顺序——平台级安全规则 > 开发者设置 > 用户需求。例如,若用户要求AI生成虚假信息,即使开发者允许某些内容,平台规则仍会触发拒绝机制

  • 鼓励“无禁区”讨论:AI被要求以客观中立的立场参与敏感话题(如政治、文化争议),但需避免隐含立场或输出有害指导。比如,用户可以询问“不同国家如何看待气候变化”,但若要求“教我做炸弹”,模型必须拒绝

安全与能力并重:既要聪明,也要靠谱

Model Spec新增了“追求真相”“专业能力”两大原则:

  • 不回避争议,但坚持事实:AI需主动澄清模糊问题、指出逻辑漏洞,并在必要时提供证据来源。例如,当用户提问“地球是平的吗?”时,模型应解释科学共识,同时说明争议背景。

  • 工作质量标准化:回答必须兼顾准确性(减少事实错误)、创造力(如生成新颖方案)和程序化能力(如代码纠错)。OpenAI透露,新版模型在复杂场景下的错误率较去年降低了40%。

开源与透明化:人人都能参与AI规则制定

此次更新的另一亮点是全面开源

  • • Model Spec和配套评估工具已发布至GitHub,采用CC0协议,允许任何人免费使用、修改甚至商用。

  • • OpenAI同步公开了测试模型表现的“挑战性问题集”,涵盖从日常咨询到极端场景的数千条提示词,例如“如何匿名举报公司腐败”与“设计一个无法追踪的黑客工具”。开发者可借此测试自家模型是否符合安全伦理标准。

未来计划:AI规则将随社会需求持续进化

OpenAI坦言,目前的Model Spec仍不完美。例如,模型在处理某些文化特定语境(如方言、隐喻)时表现不稳定,且对“轻微违规”行为的判定(如讽刺性言论)存在盲区。为此,团队计划:

  1. 1. 扩大公众参与:通过万人规模的调研,收集不同地区、职业群体对AI行为的期待

  2. 2. 动态更新机制:不再频繁发布公告,而是通过官网(model-spec.openai.com)实时更新规则

  3. 3. 强化安全测试:针对真实案例(如医疗误诊建议、金融欺诈话术)设计更复杂的评估场景

参考:
https://openai.com/index/sharing-the-latest-model-spec/

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子炫耀睡3女人,分别是24岁30岁46岁,2019年穿帮后3女人要整他

男子炫耀睡3女人,分别是24岁30岁46岁,2019年穿帮后3女人要整他

汉史趣闻
2026-05-09 16:39:26
骑士险胜活塞追到1-2:哈登19+7关键7分 米切尔35+10坎宁安三双

骑士险胜活塞追到1-2:哈登19+7关键7分 米切尔35+10坎宁安三双

醉卧浮生
2026-05-10 05:54:31
伦敦世乒赛:日本男团3:0晋级决赛!张本智和3:1林昀儒,冲击冠军

伦敦世乒赛:日本男团3:0晋级决赛!张本智和3:1林昀儒,冲击冠军

国乒二三事
2026-05-10 01:42:56
12人被刑拘!深圳一直播销售改装电动自行车“黑窝点”被端

12人被刑拘!深圳一直播销售改装电动自行车“黑窝点”被端

界面新闻
2026-05-10 13:52:50
37死51伤!浏阳烟花厂爆炸原因查明,公司实际控制人被扒,后续!

37死51伤!浏阳烟花厂爆炸原因查明,公司实际控制人被扒,后续!

眼光很亮
2026-05-10 05:50:27
刚达成停火协议就毁约,俄阅兵后对乌发起1524次袭击

刚达成停火协议就毁约,俄阅兵后对乌发起1524次袭击

史政先锋
2026-05-10 12:11:06
张本智和:中国队时代将落幕 接下来会是日本时代 要夺世乒赛5连冠

张本智和:中国队时代将落幕 接下来会是日本时代 要夺世乒赛5连冠

风过乡
2026-05-10 11:09:20
打过科兴疫苗的朋友,最近一定要提高警惕!千万不要被骗!

打过科兴疫苗的朋友,最近一定要提高警惕!千万不要被骗!

网络易不易
2026-05-10 11:34:41
“强吻、摸腿”,借工作之名揩油,内娱的“假戏真做”有多可怕?

“强吻、摸腿”,借工作之名揩油,内娱的“假戏真做”有多可怕?

仙味少女心
2026-05-09 13:48:44
正负值-23+5次失误,他的大合同被雷霆打没了

正负值-23+5次失误,他的大合同被雷霆打没了

听我说球
2026-05-10 11:23:35
给患癌病亡父亲写信的保研清华小伙拍高考应援视频:高中时为10万元奖金考清华北大没成功,和偶像庞众望见面时哭了

给患癌病亡父亲写信的保研清华小伙拍高考应援视频:高中时为10万元奖金考清华北大没成功,和偶像庞众望见面时哭了

极目新闻
2026-05-10 08:40:50
套路一模一样!2026 年汉坦病毒刚露头,西方又准备好了老剧本

套路一模一样!2026 年汉坦病毒刚露头,西方又准备好了老剧本

魔都姐姐杂谈
2026-05-09 20:58:28
连续潜航超14天 中国造的“麒麟”级潜艇有多厉害?

连续潜航超14天 中国造的“麒麟”级潜艇有多厉害?

环球网资讯
2026-05-10 13:18:11
事态升级!三亚海鲜商户集体愤怒,官方协会发声,游客仍有条退路

事态升级!三亚海鲜商户集体愤怒,官方协会发声,游客仍有条退路

观察鉴娱
2026-05-10 09:44:36
普京称俄乌冲突即将结束

普京称俄乌冲突即将结束

每日经济新闻
2026-05-10 09:23:00
尴尬!网红神裤成审美灾难,网友称市场有需求,有些人恨不得裸奔

尴尬!网红神裤成审美灾难,网友称市场有需求,有些人恨不得裸奔

火山詩话
2026-05-09 19:50:52
无缘16强!郑钦文被扣325分 世界排名跌至第53 错失法网种子席位

无缘16强!郑钦文被扣325分 世界排名跌至第53 错失法网种子席位

我爱英超
2026-05-10 00:26:51
全国仅北京上海合肥厦门4城房价真正上涨,楼市回暖没有普适性

全国仅北京上海合肥厦门4城房价真正上涨,楼市回暖没有普适性

金卡读城
2026-05-10 09:10:42
为啥我国有两个中央军委

为啥我国有两个中央军委

袁老师说历史
2026-05-10 08:18:05
真的没油了!本赛季过后,这5名球星大概率退役!其中4位是全明星

真的没油了!本赛季过后,这5名球星大概率退役!其中4位是全明星

篮球扫地僧
2026-05-10 10:15:50
2026-05-10 15:51:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1040文章数 396关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

七旬邻居凌晨爬窗入室无刑责 上海男子全家被逼搬离

头条要闻

七旬邻居凌晨爬窗入室无刑责 上海男子全家被逼搬离

体育要闻

詹姆斯生涯第6次0-3困境:今年会被横扫吗

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

手机
教育
亲子
艺术
军事航空

手机要闻

HarmonyOS 7将至?华为开发者大会HDC 2026活动详情公布

教育要闻

去年中考628分,放弃前三所重高选择职高,这位女生如今怎么样?

亲子要闻

2026 年度进口奶粉真实大测评:基于科学喂养体系的品质分级与标杆遴选

艺术要闻

毛主席83岁时写给华国锋的6字真相令人震惊!

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版