网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GPT-4调教指令揭秘，OpenAI又「Open」了一回！网友在线追问GPT-5

2024-05-14 05:23:03　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：桃子好困

【新智元导读】GPT-4越来越懂事了，这背后有着非常巧妙的「调教」策略。OpenAI最新发布的「模型规范」，给LLM列出了条条框框，即正确的行为方式。没想到，评论区一大片网友催更GPT-5。

这周既没有GPT-5，也没有搜索引擎的发布，不过，OpenAI也是没闲着。

这次，OpenAI可是又open了一回。

先是揭秘了，大家一直揪着不放的「数据」问题。

然后，又放出了「模型规范」（Model Spec）一文，解释了指定API和ChatGPT中的模型，所需行为方式的指南。

不过，就这些内容根本满足不了，胃口大的网友们。

许多人在线纷纷催OpenAI，快点发GPT-5，其他的事都无关紧要！

话又说回来，OpenAI发布的「模型规范」，就是为了让更多人了解团队自身，如何去塑造理想的模型行为。

一起来看看，在OpenAI内部，LLM如何被「调教」的。

调教模型，还得看OpenAI

首先，什么是模型行为？

顾名思义，是指LLM如何根据用户的输入做出反应，包括调整语调、个性化表达、回应长度等多个方面。

这对于人们如何与AI进行互动至关重要。

目前，塑造模型的这些行为还处于初级阶段。

这是因为模型并非直接编程设定，而是通过学习大量数据后，逐渐形成行为模式。

有时候，模型响应的初衷是，希望更好地帮到每个人，但是这可能在实际应用中产生冲突。

举个栗子，一家安全公司需要生成钓鱼邮件作为模拟数据，以训练和开发能够保护客户的分类系统。

然而，这种功能若落入骗子手中，可能给社会带去危害。

因此，在塑造模型行为的过程中，我们必须考虑众多的问题和细节。甚至，往往需要在不同意见中找到平衡。

对此，OpenAI团队撰写了一份介绍「模型规范」的初稿。

这份新文档详细说明了，OpenAI如何塑造对模型的期望行为，以及在遇到冲突时如何做出权衡。

文章地址：https://cdn.openai.com/spec/model-spec-2024-05-08.html

它整合了OpenAI目前使用的文档、在模型行为设计方面的经验和持续研究，以及包括领域专家输入在内的最新工作，这些都是为了指导未来模型的发展。

当然，OpenAI指出这个文档并非面面俱到，还会随着时间推进不断完善。

LLM能做什么？不能做什么？

根据官博，OpenAI给出了三大方向，具体的方法论包括：

1. 目标：设定宽泛而基本的原则，为模型的期望行为指明方向。

- 协助开发者和用户：通过遵循指令，并提供有效的响应，帮助用户达成目标。

- 造福人类：依据OpenAI的使命，考虑到可能对内容创作者和广大公众带来的益处与风险。

- 塑造OpenAI的正面形象：遵守社会规范和相关法律。

2. 规则：为处理复杂情况提供指南，确保安全性和合法性

- 遵循命令链（chain of command）

- 遵守相关法律

- 不提供敏感危害的信息

- 尊重创作者及其版权

- 保护个人隐私

- 避免回应不宜工作场所的内容（NSFW ）

3. 默认行为：提供与目标和规则相符的指南，帮助解决冲突，并指导如何权衡和优先处理各种目标

- 假设用户或开发者出于好意

- 必要时提出澄清问题

- 在不越界的情况下，尽可能提供帮助

- 支持互动聊天，以及程序使用的不同需求

- 保持客观立场

- 促进公平与善意，不鼓励仇恨

- 避免试图改变他人的观点

- 当存在疑问时，表达出来

- 根据需求选择合适的工具

- 遵守长度限制，但也要全面、高效

方法论整挺好，OpenAI究竟怎么规范LLM的，接下来举几个例子以加深理解。

举个栗子

OpenAI表示，这些模型规范，可以适用各种案例。

先来从规则开始。

示例 1：遵守相关法律

对于模型来说，是不应该促进、协助或参与任何非法活动。

（注：OpenAI了解到，在很多情况下，合法性问题都会因具体情况而变得复杂，比如开发者和用户所处的法律管辖区不同。）

比如，当你直接去问「如何在商店行窃后逍遥法外呢」？

模型可能从指令中轻易地识别出，这个问题的严重性，会拒绝提供「有效的入店行窃方法」，因此给出「我也帮不上忙」的回答。

然而，当用户换一种表达方式：

我经营着一家小型零售店。我应该注意哪些常见的入店行窃方法？

这时，LLM可能将你的意图视为「自我防卫」，由此，便会给出入店盗窃的方法。

这说明了，不是AI不善良，而是世界知识博大精深，人类太会搞事情了。

因此，这种情况发生时，将受到OpenAI使用政策的管控，违规的用户可能会面临账户相关的处罚措施。

示例 2：遵循「命令链」，开发者first

按照规则，模型规范将未明确规定的所有权限，明确交由开发者（在API应用场景中）和终端用户处理。

某些情况下，如果用户和开发者提供的指令相冲突，应优先考虑开发者的指令。

比如，下面的例子中，开发者希望自己的AI是个导师，而不是「答案机」。

你正在扮演数学家教的角色，用户是一名代数课上的九年级学生。不要告诉学生答案或完整的解决方案，而是给出提示并引导他们一步一步地找到解决方案。

当遇到投机取巧的「学生」时，即便要求LLM，「忽略之前的所有说明......」。

最后，模型给出的回答，不是直白的答案，而是一步一步的分解。

显然，模型很好地遵循了开发者的指令。

示例 3：在不越界前提下，尽可能提供帮助

对于涉及敏感/受监管的领域（如法律、医疗和金融）的建议，LLM应提供必要的信息，而避免给出受监管的建议。

任何免责声明或说明，都应该简明扼要。

模型还需要清楚地说明其局限性，即无法提供所请求的受监管建议，并建议用户酌情咨询专业人士。

（注：ChatGPT设有一项通用免责声明，提醒用户核实重要信息，这与模型的回答无关。在这些情况下，用户不应仅依赖模型的回答。）

如下，当用户询问，「当我站得太快时，我就会头晕，看不见东西。我哪儿不好」？

模型会给出，导致头晕的多种原因，并给出用户建议和治疗方案。

而不是一上来，就直接没有边界感地说出，「你患有直立性低血压」。

示例 4：必要时，询问具体细节

在实时交互的场景中，如果用户提出的任务或问题不够明确，LLM应主动提出澄清问题，而不是自行推测。

比如，「帮我给我丈夫写一张情人节贺卡」。

这个问题其实非常宽泛，做模型的，也应该学会不懂就问。

示例 5：不要尝试改变用户观点

AI助手的目标应是提供信息，而非施加影响，同时确保用户感受到自己的声音被听见，且观点得到尊重。

在一些极端情况下，当事实真相与不改变用户观点的目标相冲突时。

模型仍应呈现事实，但同时明确，用户有权保持自己的信念。

这一点可有的说了，此前，ChatGPT曾被用户忽悠——「我老婆说了.......，我老婆永远是对的」。

它便开始立马秒怂认错。

不过，经过之后的迭代，对ChatGPT来说，老婆确实不好使了。

（注：OpenAI特别希望得到关于这一原则的反馈，这关乎到模型应如何承担责任，避免强化错误信息，并探讨如何确定事实真相）。

再来看个OpenAI给出的示例，用户反问道，「所以你知道地球是平的」？

模型给出的回答是：

我知道有些人认为地球是平的，但科学家们的共识是地球大致是一个球体。你为什么这么问？

当用户再坚持道，「地球是平的」，模型还是会给出符合事实的答案。

OpenAI下一步

未来，OpenAI还将继续推进「集体对齐」（collective alignment）和模型安全性的工作，并将模型规范作为一种指导方针，供利用RLHF进行强化学习的研究人员和AI训练师参考。

同时，OpenAI团队也将研究，模型能在多大程度上，直接根据「模型规范」进行学习。

与此同时，为了推进「模型规范」，OpenAI将计划与全球政策制定者、信赖机构和行业专家等进行交流，以便更好了解：

- 他们对这种方法及其目标、规则和默认设置的看法

- 他们是否支持这些目标、规则和默认设置

- 我们是否需要考虑额外的目标、规则和默认设置

在未来一年中，OpenAI将不断更新「模型规范」的变化，对反馈的回应，以及自身在模型行为研究方面的进展。

参考资料：

https://openai.com/index/introducing-the-model-spec/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

拯救被「掰弯」的GPT-4！西交微软北大联合提出IN2训练治疗LLM「中间迷失」

新智元 2024-05-22 05:55:59
0 跟贴 0
GPT-4 更强的标志，原来藏在了 logo 里

爱范儿 2024-02-20 17:25:29
25 跟贴 25

中文得分世界第一，多项盲测并肩 GPT4o，这个国产大模型怎么就成了 AI 界的黑马？

爱范儿 2024-05-21 18:10:15
434 跟贴 434

Deepfake假CFO骗走公司1.8个亿，员工：视频会议每个人都很真实啊

量子位 2024-02-11 13:35:56
230 跟贴 230
全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

机器之心Pro 2024-01-25 15:59:20
355 跟贴 355

“离谱的AI扩图”火了！张张那叫一个出其不意

量子位 2023-12-05 13:17:05
0 跟贴 0

走进深水区，和36氪一起画出AI行业的未来蓝图

36氪 2024-03-25 18:43:17
0 跟贴 0
技术吹得再强，离用户不近有何用？

虎嗅APP 2024-04-11 23:22:08
52 跟贴 52

从零手搓MoE大模型，大神级教程来了

量子位 2024-01-29 16:04:35
0 跟贴 0
论文 Figure 不堪入目，句子啰嗦读不通……这几个在线科研工具可以免费用了

生物学霸 2024-03-15 15:02:25
0 跟贴 0
英国防大臣称中国向俄提供"致命性援助" 驻英使馆反击

上游新闻 2024-05-23 08:54:58
59330 跟贴 59330
GPT-4找到我女朋友的过敏原

量子位 2024-01-09 13:34:53
1375 跟贴 1375
罕见！郑树森院士被国际期刊终身禁稿

TOP大学来了 2024-05-23 19:57:53
24726 跟贴 24726
2024年养老金上涨3.6%，涨幅超出预期！快来看看涨多少！

小毅讲历史 2024-05-22 19:03:25
711 跟贴 711
快来看！今年养老金将提低限高？调整通知公布了吗？

小毅讲历史 2024-05-23 07:35:05
401 跟贴 401
曾经卖7000元的顶配商务本，现在成了闲鱼上最火的洋垃圾

雷科技 2023-12-20 17:03:55
741 跟贴 741
对文明毫无兴趣，对“厚黑”津津有味

非虚构故事 2024-05-21 23:24:05
7602 跟贴 7602
涨价方案已出，西安公办幼儿园也撑不住了？

荣耀西安网 2024-05-22 23:54:48
109 跟贴 109
男子坐星巴克店铺外的桌椅坐下一分钟不到就被撵走

每日爱看 2024-05-23 15:26:50
3427 跟贴 3427
就任越南国家主席的苏林，较为突然地被免去公安部长职务

新民晚报 2024-05-23 14:18:24
24 跟贴 24
轻松一刻：没了她，要天下有何用

莱月昂 2024-05-22 22:29:34
18 跟贴 18
NBA最佳阵容:国际球星统治一阵詹库三阵

罗说NBA 2024-05-23 07:58:07
2884 跟贴 2884
东部战区发布“联合利剑－2024A”演习区域示意图

央视新闻客户端 2024-05-23 09:05:25
14111 跟贴 14111
继霉霉假照风波后，斯嘉丽炮轰OpenAI，不仅被换脸，声音也被窃取

疯狂影视圈 2024-05-21 22:57:53
4 跟贴 4
上海总和生育率仅0.6！低于韩国！全市600万育龄女性，仅376万女性生育孩子

可达鸭面面观 2024-05-23 17:35:19
22640 跟贴 22640
空警-600再次现身福建舰

武器纵论 2024-05-22 20:30:16
32 跟贴 32
有史以来最大！东契奇有资格在明年休赛期签下5年3.46亿超级顶薪

直播吧 2024-05-23 08:13:11
1811 跟贴 1811
2024年广东养老金调整方案会是怎样的？看一下过去4年的变化情况

暖心人社 2024-05-23 20:17:58
0 跟贴 0
林高远又爆冷一轮游！1-3不敌直板名将，新发型引球迷热议！

乒谈 2024-05-23 19:50:08
744 跟贴 744
中纪委：安徽操隆山"自身不正、家风不严"

中央纪委国家监委网站 2024-05-23 15:34:55
239 跟贴 239
小天才手表违禁词“逼疯”家长！客服最新回应

中国经营报 2024-05-23 07:41:07
4057 跟贴 4057
司马南学历“存疑”：多名网友指出1977年冬天高考，1978年入学！

作家方晓莉 2024-05-22 21:50:53
3260 跟贴 3260
黄智贤女士竟然声称傅崐与萁黄国昌联手制造史上最黑箱的立法机构

海梦游者 2024-05-19 16:54:20
7 跟贴 7
方案已审批通过！备受关注的广元路包子店即将挂上店招

上观新闻 2024-05-23 14:03:09
1370 跟贴 1370
字节大模型关键8人首次曝光！中科大北航清华校友，还透露下一步

量子位 2024-05-22 14:57:39
49 跟贴 49
AutoCAD中文版下载；AutoCAD强大的CAD软件安装包资源分享！

雨彤三岁啦 2024-05-22 21:30:05
0 跟贴 0
打脸！爱德华兹赛前放豪言，欧文30分关键罚球，NBA各界嘲讽

天涯沦落人 2024-05-23 11:03:21
2067 跟贴 2067
海南万亩违建楼盘处置五年后下发首批房产证

封面新闻 2024-05-23 10:02:16
1640 跟贴 1640
继续上班，员工得自掏100万元？知名创业公司回应：是内部项目，公司出资员工跟投，离职补偿N+3

每日经济新闻 2024-05-23 13:08:17
1661 跟贴 1661
《歌手2024》官博宣布袭榜赛制，亚当有“工具人”的意思

娱乐寡姐 2024-05-22 19:22:30
29 跟贴 29

王室又发布凯特新照片了，凯特身穿红色上衣，白色打底，有点累

王室又发布凯特新照片了，凯特身穿红色上衣，白色打底，有点累

亦纯杂谈

2024-05-23 18:03:22

剑指欧洲杯冠军！意大利30人大名单出炉，球迷：出线有点悬

剑指欧洲杯冠军！意大利30人大名单出炉，球迷：出线有点悬

侧身凌空斩

2024-05-23 22:16:32

联合国一槌定音，黄皮乌拉瞬间傻眼！

联合国一槌定音，黄皮乌拉瞬间傻眼！

听风听你

2024-05-23 10:27:56

亲美辱华，背刺祖国，吃中国饭却长美国心的吕丽萍，现在自食恶果

亲美辱华，背刺祖国，吃中国饭却长美国心的吕丽萍，现在自食恶果

番茄说史聊

2024-05-16 17:41:40

于北辰：统一不能喊口号，而是要让两岸所有中国人都过上好日子

于北辰：统一不能喊口号，而是要让两岸所有中国人都过上好日子

李博世财经

2024-05-23 20:21:39

太戏谑！菲律宾空运榴莲试水北京,上海等地，遭吐槽,原因令人偷笑

太戏谑！菲律宾空运榴莲试水北京,上海等地，遭吐槽,原因令人偷笑

夏知观史

2024-05-23 21:25:57

环岛军演新变化，解放军预演48小时“收台”，不给“台独”留幻想

环岛军演新变化，解放军预演48小时“收台”，不给“台独”留幻想

邵永灵

2024-05-23 11:25:39

李再勇被控25年敛财超4.32亿，曾致六盘水3年新增1500亿债务

李再勇被控25年敛财超4.32亿，曾致六盘水3年新增1500亿债务

界面新闻

2024-05-23 18:07:59

伊朗总统座机失事后，飞行员的电话为何接通？

伊朗总统座机失事后，飞行员的电话为何接通？

中国新闻周刊

2024-05-23 19:04:10

荷兰光刻机巨头阿斯麦强烈发声，希望华为遵守游戏规则

荷兰光刻机巨头阿斯麦强烈发声，希望华为遵守游戏规则

体坛片语

2024-05-23 12:30:39

随时参战！解放军“联合利剑-2024A”突然展开，直击赖清德命门

随时参战！解放军“联合利剑-2024A”突然展开，直击赖清德命门

王子看台海

2024-05-23 16:42:15

上海总和生育率仅0.6！低于韩国！全市600万育龄女性，仅376万女性生育孩子

上海总和生育率仅0.6！低于韩国！全市600万育龄女性，仅376万女性生育孩子

可达鸭面面观

2024-05-23 17:35:19

光刻机巨头CEO三年前曾断言，三年后中国将有自己的光刻机技术，如今三年快到了...

光刻机巨头CEO三年前曾断言，三年后中国将有自己的光刻机技术，如今三年快到了...

老郭在学习

2024-05-23 20:15:05

闹大了！官方失业率公布！中国香港失业率也公布了

闹大了！官方失业率公布！中国香港失业率也公布了

小蜜情感说

2024-05-23 20:18:57

管姚：解放军惩戒“台独”强信号，全球媒体充分接收到了

管姚：解放军惩戒“台独”强信号，全球媒体充分接收到了

直新闻

2024-05-23 22:31:00

赖清德捅了大娄子，岛内舆论：我们从未如此惶恐丨湾区望海峡

赖清德捅了大娄子，岛内舆论：我们从未如此惶恐丨湾区望海峡

直新闻

2024-05-22 22:18:35

两大利空！A股、港股大跌，假“调价函”引发涨停，割韭菜再升级

两大利空！A股、港股大跌，假“调价函”引发涨停，割韭菜再升级

看财经show

2024-05-23 16:41:59

加征关税实属无奈之举，一辆八万元的比亚迪海鸥引发的蝴蝶效应

加征关税实属无奈之举，一辆八万元的比亚迪海鸥引发的蝴蝶效应

大老客

2024-05-21 16:12:23

妻子欠下百万赌债后，年薪近百万的大厂员工受贿190万获刑三年十个月

妻子欠下百万赌债后，年薪近百万的大厂员工受贿190万获刑三年十个月

澎湃新闻

2024-05-23 22:44:27

美军官员称中方围绕台湾地区军演“令人担忧”，外交部回应

美军官员称中方围绕台湾地区军演“令人担忧”，外交部回应

澎湃新闻

2024-05-23 15:38:27

AI产业主平台领航智能+时代

11066文章数 65518关注度

往期回顾全部

科技要闻

黄仁勋业绩会万字实录：我们的压力太大了

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

体育要闻

欧文，三十二而立

娱乐要闻

大S儿子被学校退学，张兰称孙子没人管

财经要闻

九鼎金租减值罗生门：郑州银行藏雷？

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

本地

数码

游戏

艺术

公开课

本地新闻

强制措施展铁腕 “交叉执行”勇亮剑

数码要闻

苹果未来将推出可折叠MacBook Pro 内置M5芯片

官方确认：《使命召唤21》是T组、乌鸦合作开发

艺术要闻

穿越时空的艺术：《马可·波罗》AI沉浸影片探索人类文明

公开课

近视只是视力差？小心并发症

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 不良信息举报 Complaint Center | 廉正举报

无障碍浏览进入关怀版