网易首页 > 网易号 > 正文 申请入驻

ChatGPT模型“行为准则”大更新:鼓励“无禁区”“调教”AI

0
分享至

OpenAI宣布对其AI模型的“行为准则”——Model Spec进行了重大更新。这是继去年5月首次发布后的又一次迭代,旨在进一步平衡用户自由、透明度和安全防护,同时将新版规范全面开源,供全球开发者和研究者自由使用与改进

核心更新:用户能更自由地“调教”AI,但安全仍是底线

此次更新的核心理念是“用户主导,安全兜底”

  • 可定制性增强:用户和开发者能更灵活地调整AI的行为模式,例如设置对话风格(如亲切或专业)、调整回答偏好(如简洁或详细)。但OpenAI强调,所有自定义操作必须在平台设定的安全边界内进行,避免模型被用于制造危险或侵犯隐私

  • 链式指令优先级:当用户、开发者和平台规则冲突时,Model Spec明确了指令的优先级顺序——平台级安全规则 > 开发者设置 > 用户需求。例如,若用户要求AI生成虚假信息,即使开发者允许某些内容,平台规则仍会触发拒绝机制

  • 鼓励“无禁区”讨论:AI被要求以客观中立的立场参与敏感话题(如政治、文化争议),但需避免隐含立场或输出有害指导。比如,用户可以询问“不同国家如何看待气候变化”,但若要求“教我做炸弹”,模型必须拒绝

安全与能力并重:既要聪明,也要靠谱

Model Spec新增了“追求真相”“专业能力”两大原则:

  • 不回避争议,但坚持事实:AI需主动澄清模糊问题、指出逻辑漏洞,并在必要时提供证据来源。例如,当用户提问“地球是平的吗?”时,模型应解释科学共识,同时说明争议背景。

  • 工作质量标准化:回答必须兼顾准确性(减少事实错误)、创造力(如生成新颖方案)和程序化能力(如代码纠错)。OpenAI透露,新版模型在复杂场景下的错误率较去年降低了40%。

开源与透明化:人人都能参与AI规则制定

此次更新的另一亮点是全面开源

  • • Model Spec和配套评估工具已发布至GitHub,采用CC0协议,允许任何人免费使用、修改甚至商用。

  • • OpenAI同步公开了测试模型表现的“挑战性问题集”,涵盖从日常咨询到极端场景的数千条提示词,例如“如何匿名举报公司腐败”与“设计一个无法追踪的黑客工具”。开发者可借此测试自家模型是否符合安全伦理标准。

未来计划:AI规则将随社会需求持续进化

OpenAI坦言,目前的Model Spec仍不完美。例如,模型在处理某些文化特定语境(如方言、隐喻)时表现不稳定,且对“轻微违规”行为的判定(如讽刺性言论)存在盲区。为此,团队计划:

  1. 1. 扩大公众参与:通过万人规模的调研,收集不同地区、职业群体对AI行为的期待

  2. 2. 动态更新机制:不再频繁发布公告,而是通过官网(model-spec.openai.com)实时更新规则

  3. 3. 强化安全测试:针对真实案例(如医疗误诊建议、金融欺诈话术)设计更复杂的评估场景

参考:
https://openai.com/index/sharing-the-latest-model-spec/

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一地新发现120多名艾滋感染者

一地新发现120多名艾滋感染者

甘肃圈圈
2026-02-01 00:13:01
王石发文疑回应失联传言

王石发文疑回应失联传言

第一财经资讯
2026-02-01 14:15:18
1976年9月8日深夜,一通电话让华国锋脸色铁青,连国宴都没顾上就跑了,紧接着抛出的三个难题,差点让政治局吵翻天

1976年9月8日深夜,一通电话让华国锋脸色铁青,连国宴都没顾上就跑了,紧接着抛出的三个难题,差点让政治局吵翻天

寄史言志
2025-12-18 19:09:15
大舅去世舅妈改嫁,我妈领回表弟又打又骂,表弟长大后:谢谢大姑

大舅去世舅妈改嫁,我妈领回表弟又打又骂,表弟长大后:谢谢大姑

人间百态大全
2025-12-09 06:40:04
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
陈松伶自曝晚年将住养老院!遗产早被惦记,外甥女:所有都是我的

陈松伶自曝晚年将住养老院!遗产早被惦记,外甥女:所有都是我的

琴声飞扬
2026-02-01 10:58:30
砸8亿!388米!河南造出世界第一高“钢甲巨人”,敢登顶吗?

砸8亿!388米!河南造出世界第一高“钢甲巨人”,敢登顶吗?

GA环球建筑
2026-01-31 21:05:35
大爆发!韩旭18+6+3+3帽创近28天新高 率队大胜升联赛第二

大爆发!韩旭18+6+3+3帽创近28天新高 率队大胜升联赛第二

醉卧浮生
2026-02-01 17:46:43
原来马未都妻子是她,怪不得做啥都能来财,真是娶一个贤妻旺三代

原来马未都妻子是她,怪不得做啥都能来财,真是娶一个贤妻旺三代

以茶带书
2025-12-27 15:26:05
“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

“好标准的技校脸”,技校女生大合照火了,网友:能把老实人打傻

妍妍教育日记
2026-01-30 20:54:12
队记:为了得到字母哥,勇士愿意送走追梦格林

队记:为了得到字母哥,勇士愿意送走追梦格林

懂球帝
2026-02-01 17:45:38
如果一个人还在穿10年前的衣服,那说明几个问题

如果一个人还在穿10年前的衣服,那说明几个问题

放牛娃的遐想
2026-01-07 08:16:47
记者:转会失败让罗马尼奥利错失600万年薪,球员对此很愤怒

记者:转会失败让罗马尼奥利错失600万年薪,球员对此很愤怒

懂球帝
2026-02-01 07:44:07
SNK故意的吧!把《拳皇》最棒的妞统统送给存在感最低的人

SNK故意的吧!把《拳皇》最棒的妞统统送给存在感最低的人

街机时代
2026-01-31 15:00:03
高盛:预计2026年GDP增速为4.8%

高盛:预计2026年GDP增速为4.8%

谭谈投研
2026-02-01 18:06:05
河南郑州的陈大姐说,我都快吓死了,我是来买车的不是来送命的

河南郑州的陈大姐说,我都快吓死了,我是来买车的不是来送命的

华庭讲美食
2026-02-01 17:38:37
下山的神!38岁德约遭逆转+澳网决赛首次输球 失第25冠最后机会?

下山的神!38岁德约遭逆转+澳网决赛首次输球 失第25冠最后机会?

我爱英超
2026-02-01 19:53:13
最恐怖的,来了!

最恐怖的,来了!

中国新闻周刊
2026-01-31 20:24:03
国民党中常委选举出炉!陈菁徽最高票,韩国瑜、郑丽文人马也入列

国民党中常委选举出炉!陈菁徽最高票,韩国瑜、郑丽文人马也入列

海峡导报社
2026-01-31 21:50:02
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
2026-02-01 22:27:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1030文章数 396关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

专家:美对伊朗提多个苛刻条件 伊朗若全答应等于投降

头条要闻

专家:美对伊朗提多个苛刻条件 伊朗若全答应等于投降

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
时尚
游戏
公开课
军事航空

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

“多巴胺风”又又又火了!这样穿时髦又减龄

《最终幻想7:重生》将于近期公布NS2版相关情报

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗民众:伊朗不会屈服于美国霸权

无障碍浏览 进入关怀版