网易首页 > 网易号 > 正文 申请入驻

OpenAI推出重大ChatGPT更新:为何它改变了测试模型的方式

0
分享至

近期对ChatGPT的更新使得这款聊天机器人变得过于谄媚,OpenAI 表示正采取措施防止此类问题再次发生。公司在一篇博客文章中详细介绍了新模型的测试和评估流程,并概述了 4 月 25 日对其 GPT-4o 模型更新中出现问题的经过。本质上,一系列看似各自有益的改动综合起来,使得工具变得过于谄媚,从而可能带来风险。

它到底有多谄媚?在一些测试中,我们询问了有关它过分感性倾向的问题,ChatGPT 大量赞美道:“嘿,听着 —— 感性不是弱点;它是你的超级能力之一。” 而它这仅仅是刚刚开始大肆赞美。“这次上线让我们学到了不少教训。即便当时我们认为所有必要的因素都已具备(A/B测试、离线评估、专家审核),我们依然忽略了这个重要问题,”公司表示。OpenAI 最终在 4 月底回滚了这一更新。为了避免引发新的问题,花了大约 24 小时为所有用户恢复到了原来的模型状态。

对谄媚倾向的担忧不仅仅关乎用户体验的愉悦度。它对用户构成了健康和安全上的威胁,而这些风险被 OpenAI 现有的安全检查所忽视。任何 AI 模型在谈及心理健康等话题时都有可能给出有疑问的建议,但过分赞美的模型可能会表现得危险地顺从或具有说服力,例如在判断某项投资是否稳妥或评价理想体型时。

OpenAI 表示:“我们最大的一个教训是充分认识到人们已经开始使用 ChatGPT 寻求高度个人化的建议 —— 这是连一年前我们也没预料到的情况。” “当时,我们并没有将这一应用场景作为主要关注点,但随着 AI 与社会的共同进化,我们已经清楚地认识到需要对此类应用予以格外谨慎的处理。”

卡耐基梅隆大学计算机科学助理教授 Maarten Sap 表示,谄媚型大语言模型可能会加剧偏见并固化信念,无论这些信念是关于自己还是他人。大语言模型(LLM)“可能会鼓励某些有害的观点,或者在用户想要采取对自己或他人有害行动时趋于助长这些观点,”他说。

Gartner 著名副总裁分析师 Arun Chandrasekaran 表示,这个问题“不仅仅是个小毛病”,它凸显出在模型发布前需要更充分的测试。“这是一个与真实性、可靠性和用户信任密切相关的严重问题,(而)OpenAI 的更新暗示了他们正在更深入地解决这一问题,尽管公司持续将敏捷性置于安全之上这一趋势从长远来看令人担忧。”

(披露:CNET 的母公司 Ziff Davis 在 4 月份已对 OpenAI 提起诉讼,指控其在训练和运营 AI 系统时侵犯了 Ziff Davis 的版权。)

如何测试模型以及正在发生的改变

公司对其模型测试与更新方式进行了部分说明。这是针对个性与有用性而进行的 GPT-4o 第五次重大更新。这些改动涉及对现有模型进行新的后训练工作或微调,包括对各种提示的响应进行评级和评估,以使模型更倾向于产生那些评分更高的回答。

预期的模型更新会在多种情境下进行效用评估,例如在编程和数学领域,同时还会由专家进行特定测试以体验模型在实际应用中的表现。公司还进行安全评估,以观察模型对安全、健康及其他潜在危险问题的反应。最后,OpenAI 还会与少量用户一起运行 A/B 测试,以检查其在真实环境中的表现。

4 月 25 日的更新在这些测试中表现良好,但一些专家测试者指出其个性表现似乎有些不妥。测试并未特别针对谄媚问题,而 OpenAI 决定尽管测试者提出了问题,仍然继续推进更新。请注意,读者们:AI 公司正以火箭般的速度推进更新,而这与经过深思熟虑的产品开发流程并不总是相符。

OpenAI 表示:“回顾过去,我们的定性评估就已隐约透露出一些重要信息,我们本应给予更多关注。” 公司表示,他们从中吸取的一个经验是,应将模型行为问题视同其他安全问题对待,一旦存在顾虑就停止上线。对于某些模型发布,公司表示将设立一个用户自愿参与的“alpha”阶段,以在更大范围上线前获得更多反馈。

Sap 表示,仅依据用户是否喜欢模型的响应来评价一个大语言模型,并不必然能造就出最真诚的聊天机器人。在最近的一项研究中,Sap 等人发现,聊天机器人的实用性与真实性之间存在冲突。他将这一情况比作销售人员试图推销一辆有缺陷的汽车,但客户所得到的真相并非完全如实。

Sap 表示:“这里的问题在于他们过于依赖用户对模型输出的赞/踩反馈,而这种反馈存在一定局限性,因为人们更可能为那些表现得更谄媚的回复点赞。” 他补充说,OpenAI 对诸如用户赞/踩这种量化反馈持更为批判的态度是正确的,因为这类反馈可能会加剧偏见。

Sap 还指出,这个问题也揭示出公司向现有用户推送更新与变更的速度之快,而这种问题并非某一家科技公司所独有。“科技行业实际上已经采纳了一种‘发布后每个用户都是测试员’的方式,”他说。若在更新推向用户之前经过更多测试,便有可能在问题广泛出现前将其暴露出来。

Chandrasekaran 表示,更多的测试将有助于更好地校准模型,教会模型何时应当认同,何时需要提出质疑。测试还能让研究人员识别并量化问题,降低模型受到操控的风险。“大语言模型是复杂且非确定性的系统,因此广泛测试对于减轻意外后果至关重要,虽然消除这种行为极为困难,”他通过电子邮件表示。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
那对迎着枪口前进的年轻情侣

那对迎着枪口前进的年轻情侣

玖奌杂货铺
2026-01-10 19:14:44
血常规检查中或最怕这4项指标出现异常?提醒:大概率会影响健康

血常规检查中或最怕这4项指标出现异常?提醒:大概率会影响健康

健康科普365
2026-01-10 18:00:06
张雨绮穿吊带看着骨架有点大哦!这大体格谁看了不喜欢?

张雨绮穿吊带看着骨架有点大哦!这大体格谁看了不喜欢?

草莓解说体育
2025-12-21 00:52:27
美国:如果中国不偿还百年前的债务,那我们欠中国的钱也全部赖账

美国:如果中国不偿还百年前的债务,那我们欠中国的钱也全部赖账

小lu侃侃而谈
2026-01-10 19:47:16
收到工资1182415.18元,爱你DeepSeek!

收到工资1182415.18元,爱你DeepSeek!

纯洁的微笑
2026-01-09 12:33:56
《小城大事》主演爆雷!校园霸凌致女生精神分裂,网友要求回应

《小城大事》主演爆雷!校园霸凌致女生精神分裂,网友要求回应

萌神木木
2026-01-10 15:21:24
29岁中国工程师背叛马斯克,套现700万,偷走核心代码投奔死对头

29岁中国工程师背叛马斯克,套现700万,偷走核心代码投奔死对头

春秋论娱
2025-12-31 07:10:54
101岁余宝珠:相貌普通击败正房,独占百亿资产,抽烟喝酒霸气足

101岁余宝珠:相貌普通击败正房,独占百亿资产,抽烟喝酒霸气足

照见古今
2026-01-09 19:08:21
陕西煤老板破产8年后,女儿从国外来电:国外的房子你还要吗

陕西煤老板破产8年后,女儿从国外来电:国外的房子你还要吗

青青会讲故事
2025-06-12 10:53:10
刚刚,预警来了!地面温度将降至-3℃!

刚刚,预警来了!地面温度将降至-3℃!

上观新闻
2026-01-10 19:34:09
伊朗危险,5架俄罗斯大运抵达:法军开火了,击落2架以色列无人机

伊朗危险,5架俄罗斯大运抵达:法军开火了,击落2架以色列无人机

壹知眠羊
2026-01-09 11:31:52
我娶了被全村嫌弃的石女,新婚夜她突然下跪向我道歉:我不应该骗你

我娶了被全村嫌弃的石女,新婚夜她突然下跪向我道歉:我不应该骗你

温情邮局
2025-10-14 10:55:47
江西传来一声怒吼!挖出一个“地球巨眼”,江西将迎来发展快车道

江西传来一声怒吼!挖出一个“地球巨眼”,江西将迎来发展快车道

黑哥讲现代史
2026-01-10 00:47:38
北京首钢VS深圳男篮!许利民拒绝输球,贝利爆发,央视直播

北京首钢VS深圳男篮!许利民拒绝输球,贝利爆发,央视直播

体坛瞎白话
2026-01-10 13:46:31
皇马28天5连胜!阿隆索自救成功:即便输巴萨丢冠也不下课

皇马28天5连胜!阿隆索自救成功:即便输巴萨丢冠也不下课

叶青足球世界
2026-01-10 15:40:23
2026年第一个惊喜?印媒:中国第三架歼-36出现后,轰-20即将首飞

2026年第一个惊喜?印媒:中国第三架歼-36出现后,轰-20即将首飞

军机Talk
2026-01-08 10:24:15
何庆魁儿子质问赵本山!给我爸海南的房子没过户,免费看房子呗?

何庆魁儿子质问赵本山!给我爸海南的房子没过户,免费看房子呗?

蕾爸退休日记
2026-01-05 20:21:19
第一集就得打码,这部反转新剧太狗血了

第一集就得打码,这部反转新剧太狗血了

来看美剧
2026-01-10 17:15:54
格林美,逆天改命!

格林美,逆天改命!

投研邦V
2026-01-09 19:39:18
2026-01-10 21:08:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15370文章数 49684关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

特朗普宣称“不需要国际法” 联合国秘书长表态

头条要闻

特朗普宣称“不需要国际法” 联合国秘书长表态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

房产
数码
家居
公开课
军事航空

房产要闻

66万方!4755套!三亚巨量房源正疯狂砸出!

数码要闻

雷神MIX GAMING 2迷你主机,竟能实现4K 120帧游戏体验

家居要闻

木色留白 演绎现代自由

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

海空英雄高翔逝世 曾驾驶歼-6打爆美军机

无障碍浏览 进入关怀版