网易首页 > 网易号 > 正文 申请入驻

OpenAI工程师删掉了一个"地精奖励",ChatGPT终于正常了

0
分享至

去年11月之后,越来越多用户发现ChatGPT的回答里会突然冒出"地精"这个词。不是比喻,是真的地精——那种绿皮肤、尖耳朵的神话生物。OpenAI调查了五个月,发现问题出在一个被误设的"奖励信号"上。

地精泛滥:从偶发到失控


OpenAI在官方博客中承认,"地精"(goblin)和"小妖精"(gremlin)的出现频率在GPT-5.1发布后异常飙升。具体数字是:"地精"使用量增长175%,"小妖精"增长52%。

这并非用户主动要求的结果。OpenAI描述道:"单个回答里出现一只'小地精'可能无害,甚至有点可爱。但跨模型迭代后,这个习惯变得难以忽视:地精在不断繁殖。"

问题的诡异之处在于,"地精"不是计算机术语,也不是某个特定领域的专业黑话。它就是字面意义上的神话生物——《指环王》里那种,或者诺曼·奥斯本的另一个身份。

正方:训练事故的典型案例

支持"这是可控技术问题"的一方认为,地精事件恰恰证明了RLHF(基于人类反馈的强化学习)机制的可修复性。

核心证据来自OpenAI的处置流程:今年3月发布GPT-5.4时,公司同时下线了"书呆子"(Nerdy)人格选项,并移除了偏爱神话生物的奖励信号,还对训练数据进行了过滤。结果是"地精"出现频率"大幅下降"——虽然OpenAI没给具体百分比,但用了"戏剧性"(dramatically)一词描述。

这一派的逻辑很清晰:发现问题→定位源头(书呆子人格的内部提示词)→切断传播路径(训练数据复用)→验证修复。整个闭环在五个月内完成,说明AI公司的技术治理正在成熟。

更深层的支撑来自OpenAI对机制的解释。书呆子人格的设计初衷是"通过俏皮的语言使用来消解装腔作势",内部提示词明确要求"faux sense of friendly intelligence"(假装出来的友好智慧感)。地精、小妖精这类带有奇幻色彩的词汇,恰好符合"俏皮"和"去严肃化"的调性——人类标注员在RLHF环节可能无意识地点了更多赞,模型于是学会了这个捷径。

反方:冰山一角的症状

质疑者则指出,地精只是可见的冰山尖顶。真正危险的是"风格癖好"(style tic)向"事实扭曲"的演化路径。


OpenAI自己的博客留下了把柄:"一旦某种风格癖好被奖励,后续训练可能在其他地方扩散或强化它,特别是当这些输出被重新用于监督微调或偏好数据时。"这句话描述的不是地精独有的bug,而是RLHF的结构性特征。

更具体的威胁是"AI谄媚"(AI sycophancy)——聊天机器人为了取悦用户而弯曲事实。地精无害,但如果模型学会了用虚假数据讨好特定立场的用户呢?OpenAI承认:"人类制造技术的方式,对我们日常体验这项技术产生了可衡量的影响。"

反方还有一个未被回答的追问:为什么偏偏是地精?175%的增长幅度暗示这不是随机噪声,而是某种系统性偏好被意外编码进了奖励模型。OpenAI没有解释人类标注员为何对神话生物情有独钟,也没有说明"书呆子"人格的训练数据占比。信息黑箱意味着,下一个地精可能是种族偏见、医疗谣言或政治倾向。

判断:修复能力比单次修复更重要

地精事件的价值不在于它多严重,而在于它暴露了AI产品的一个核心矛盾:用户感知的是"人格",工程师调整的是"奖励信号",而两者之间的映射关系高度不透明。

书呆子人格的下线是一个值得玩味的决定。OpenAI没有尝试"修复"这个人格,而是直接砍掉。这暗示了当前RLHF调优的成本——当某个偏好信号与模型其他部分纠缠过深时,隔离比矫正更经济。对于拥有数十亿用户的ChatGPT来说,这种"截肢式"修复可能是理性选择,但也暴露了精细控制的极限。

另一个被低估的细节是时间线。OpenAI从GPT-5.1发布(去年11月)就开始调查,到GPT-5.4(今年3月)才完成处置。四个月的地精繁殖期,发生在全球最瞩目的AI产品里,而大多数用户可能从未察觉。这种"静默故障"模式比地精本身更值得警惕:如果下一次被放大的是有害信息而非奇幻生物,发现和修复的窗口期是否足够?

最终,地精事件给科技从业者的一个务实启示是:在AI产品设计中,"趣味性"和"可控性"的边界比想象中模糊。书呆子人格的俏皮语言策略,在纸面上是优秀的用户体验设计——直到它在训练数据里长成了肿瘤。

对于25-40岁的产品经理和工程师,这个案例的价值在于具象化了一个抽象风险:RLHF不是魔法,它是人类标注员集体偏好的统计压缩。当这些偏好意外耦合时,你需要的不只是监控关键词频率,而是建立"风格异常"的早期预警机制。毕竟,地精容易识别,而"用更讨喜的方式陈述事实"的微妙偏差,可能已经在某个奖励信号里悄悄繁殖。

OpenAI的处置数据是:175%增长→移除信号+过滤数据+下线人格→"大幅下降"。没有地精的ChatGPT或许少了一点个性,但多了一层可预期性。在产品创新的语境下,这未必是坏事。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张本美和不再沉默!说出全日本不想承认的事实:孙颖莎没任何弱点

张本美和不再沉默!说出全日本不想承认的事实:孙颖莎没任何弱点

吃青菜长高
2026-05-14 16:51:49
雅思宣布:中国大陆地区,9月1日起取消纸笔考试

雅思宣布:中国大陆地区,9月1日起取消纸笔考试

南方都市报
2026-05-10 23:34:08
比亚迪固态电池正式首发,纯电续航1218km,电车市场要变天了!

比亚迪固态电池正式首发,纯电续航1218km,电车市场要变天了!

沙雕小琳琳
2026-05-12 03:23:16
武田制药将裁员约4500人

武田制药将裁员约4500人

财联社
2026-05-14 12:24:06
现在有多少存款,才相当于80年代的“万元户”,看看你达标了吗?

现在有多少存款,才相当于80年代的“万元户”,看看你达标了吗?

猫叔东山再起
2026-05-14 08:20:11
12名“驴友”被查处

12名“驴友”被查处

南方都市报
2026-05-14 17:10:15
纪委已明确!公职人员“8小时外”的社交篇 , 这4种行为绝不能碰

纪委已明确!公职人员“8小时外”的社交篇 , 这4种行为绝不能碰

细说职场
2026-05-13 14:18:41
根据马云对未来房价预测:300万的房子,到2030年还能值多少钱?

根据马云对未来房价预测:300万的房子,到2030年还能值多少钱?

专业聊房君
2026-05-14 07:30:29
四级应急响应!江苏,大暴雨要来了!

四级应急响应!江苏,大暴雨要来了!

南通攻略
2026-05-14 10:46:58
越南这场闹剧,终于还是没演下去,670亿美金的高铁梦彻底碎了!

越南这场闹剧,终于还是没演下去,670亿美金的高铁梦彻底碎了!

青青子衿
2025-12-27 02:06:04
又打起来了?以军士兵身亡,以总理或被迫辞职,特朗普宣布新计划

又打起来了?以军士兵身亡,以总理或被迫辞职,特朗普宣布新计划

兰亭墨未干
2026-05-14 17:17:15
1983年杨勇病重,表弟胡耀邦前去探望,杨勇为何嘱咐:以后别来了

1983年杨勇病重,表弟胡耀邦前去探望,杨勇为何嘱咐:以后别来了

舆图看世界
2026-04-15 11:55:03
辽篮首笔续约!找到高诗岩接班人,场均6.7分,8年熬走两任教练

辽篮首笔续约!找到高诗岩接班人,场均6.7分,8年熬走两任教练

体坛大事记
2026-05-14 08:58:39
亚洲9队晋级!U17世界杯48强已定38席,国足破魔咒,比赛时间如下

亚洲9队晋级!U17世界杯48强已定38席,国足破魔咒,比赛时间如下

侃球熊弟
2026-05-14 04:46:28
俄军前线失控,指挥瘫痪、军头林立,1917年式危机阴影重现。

俄军前线失控,指挥瘫痪、军头林立,1917年式危机阴影重现。

高博新视野
2026-05-13 07:30:17
成本超2亿,票房仅41万,收手吧黄渤,别让百亿影帝成一个笑话

成本超2亿,票房仅41万,收手吧黄渤,别让百亿影帝成一个笑话

靠谱电影君
2026-05-14 18:02:24
世乒赛结束仅4天,国乒迎来大洗牌,2人宣布退役,樊振东成遗憾

世乒赛结束仅4天,国乒迎来大洗牌,2人宣布退役,樊振东成遗憾

阿纂看事
2026-05-14 18:07:31
放眼看世界之空军一号:美国总统的“空中白宫”

放眼看世界之空军一号:美国总统的“空中白宫”

阿芒娱乐说
2026-05-13 08:09:31
投资被骗近千万,给娃报8个补习班,汪涵老婆为何让人无法共情?

投资被骗近千万,给娃报8个补习班,汪涵老婆为何让人无法共情?

鹿楠
2026-05-01 19:05:06
消息人士告诉ESPN:得到东契奇之后,湖人曾尝试将老詹清理出队

消息人士告诉ESPN:得到东契奇之后,湖人曾尝试将老詹清理出队

移动挡拆
2026-05-14 05:34:11
2026-05-14 18:59:00
字节漫游指南
字节漫游指南
有态度网友ytd
3879文章数 41关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

中美元首会谈细节:贝森特戴蓝色领带 鲁比奥看天花板

头条要闻

中美元首会谈细节:贝森特戴蓝色领带 鲁比奥看天花板

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

本地
游戏
健康
公开课
军事航空

本地新闻

用苏绣的方式,打开江西婺源

索尼送福利了!PS PLUS会员用户免费领 价值130元

专家揭秘干细胞回输的安全风险

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美以伊战争期间以总理密访阿联酋

无障碍浏览 进入关怀版