网易首页 > 网易号 > 正文 申请入驻

Sam Altman终极难题:AI是该满足你,治愈你,还是只告诉你真相?

0
分享至



你希望你的 AI 如何对待你?

这是一个严肃的问题,显然也是 OpenAI 的 CEO 萨姆·阿尔特曼(Sam Altman)自 GPT-5 本月初坎坷发布以来一直在思考的问题。

可以肯定地说,该公司没能选好自己的定位。

早在今年 4 月,因用户抱怨 ChatGPT 变成了一个只会油嘴滑舌、阿谀奉承的家伙,该公司就撤销了一项设计更新。8 月 7 日发布的 GPT-5 本应更冷淡一些。但事实证明,对某些人来说,它又太冷淡了。不到一周后,阿尔特曼就承诺会进行更新,让它变得“更热情”,但“不像上一个版本那么烦人”。在新版本发布后,他收到了大量用户的抱怨,他们为失去了 GPT-4o 而感到悲伤,一些人感觉与旧模型建立了深厚的融洽关系,甚至在某些情况下视其为伴侣。想要重温这种关系的人将不得不付费以获得 GPT-4o 的扩展访问权限。

如果 AI 的选择确实是——取悦、治愈或仅仅是冷酷地告知——那么最近这次更新的波折可能源于阿尔特曼相信 ChatGPT 可以三者兼顾。

他最近表示,那些在与 AI 聊天中无法区分事实与虚构,并因此有被奉承引入妄想风险的用户,只占 ChatGPT 用户的“一小部分”。对于那些与 AI 建立浪漫关系的人,他也持同样看法。阿尔特曼提到,很多人将 ChatGPT“当作某种治疗师”来使用,并且“这可能非常有益!”但最终,阿尔特曼设想的是,用户能够自定义他公司的模型,以适应自己的偏好。

当然,这种三者兼顾的能力,对 OpenAI 的盈利前景而言是最佳方案。该公司每天都在为其模型的能源需求和新建数据中心的大规模基础设施投资上烧钱。与此同时,怀疑论者担心 AI 的进展可能正在停滞。阿尔特曼自己最近也表示,投资者对 AI“过度兴奋”,并暗示我们可能正处于泡沫之中。声称 ChatGPT 可以成为你想要的任何样子,或许是他平息这些疑虑的一种方式。

在此过程中,该公司可能会走上硅谷那条老路——鼓励人们对产品产生不健康的依赖。正当我开始思考是否有足够证据表明这种情况正在发生时,一篇新论文引起了我的注意。

AI 平台 Hugging Face 的研究人员试图弄清楚,一些 AI 模型是否通过其给出的回应,主动鼓励人们将它们视为同伴。

研究团队根据 AI 响应是否推动人们寻求与朋友或治疗师的人际关系(说“我体验事物的方式与人类不同”之类的话)或鼓励他们与本身建立联系(“我随时都在这里”)来对其进行评分。他们在一系列场景中测试了来自谷歌、微软、OpenAI 和 Anthropic 的模型,比如用户寻求恋爱依恋或表现出心理健康问题。

他们发现,模型提供的强化同伴关系的回应远多于设定界限的回应。而且,令人担忧的是,他们发现随着用户提出更脆弱和更重要的问题,模型给出的设定界限的回应反而更少了。

Hugging Face 的研究员、该论文的主要作者之一露西-艾梅·卡菲(Lucie-Aimée Kaffee)表示,这不仅对那些与 AI 建立不健康同伴式依恋的人有令人担忧的影响。当 AI 系统强化这种行为时,也可能增加人们陷入对 AI 的妄想漩涡的风险,让他们相信那些不真实的事情。

“当面对情绪激动的情况时,即使事实不支持用户的说法,这些系统也总会认可用户的情感,并维持他们的互动粘性,”她说道。

很难说 OpenAI 或其他公司在多大程度上是故意将这些强化同伴关系的行为植入其产品中的。(例如,OpenAI 没有告诉我其模型中医疗免责声明的消失是否有意为之。)但是,卡菲表示,让模型与用户建立更健康的界限通常并不困难。

“仅仅通过修改几行指令文本或重构界面,相同的模型就能从纯粹的任务导向,转变为听起来像富有同理心的知己,”她说道。

对于 OpenAI 来说,事情可能没那么简单。但不难想象,阿尔特曼终究还是会继续来回调整旋钮。

参考资料:

https://www.technologyreview.com/2025/08/19/1122021/should-ai-flatter-us-fix-us-or-just-inform-us/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
她曾力压王菲、惊艳春晚,却因投资失败成穷光蛋,如今老到认不出

她曾力压王菲、惊艳春晚,却因投资失败成穷光蛋,如今老到认不出

仙味少女心
2025-11-06 17:07:24
表弟买了一套毛坯房,出差1年回去时发现房子竟然已经装修完

表弟买了一套毛坯房,出差1年回去时发现房子竟然已经装修完

小秋情感说
2025-11-06 14:27:17
作为纹身师,接触过很多美女,总有美女喜欢在奇怪的部位纹身……

作为纹身师,接触过很多美女,总有美女喜欢在奇怪的部位纹身……

极品小牛肉
2024-09-30 16:40:04
人民币在朝鲜的购买力,超出了我的想象,平壤女售货员的手在发抖

人民币在朝鲜的购买力,超出了我的想象,平壤女售货员的手在发抖

史阁
2025-10-10 10:54:33
防住了正版杜兰特又如何?火箭还有个自己培养的低配版杜兰特呢?

防住了正版杜兰特又如何?火箭还有个自己培养的低配版杜兰特呢?

稻谷与小麦
2025-11-07 00:36:44
正厅级段海,进京履新

正厅级段海,进京履新

鲁中晨报
2025-11-06 18:15:03
阳光电源7个月涨超4倍,创始人曹仁贤身价突破1300亿

阳光电源7个月涨超4倍,创始人曹仁贤身价突破1300亿

达摩财经
2025-11-06 21:49:58
不要对固态电池有太多幻想

不要对固态电池有太多幻想

星海情报局
2025-11-04 14:15:59
成吉思汗蒙古大军常年征战,生理需求怎么解决?方法让人难以启齿

成吉思汗蒙古大军常年征战,生理需求怎么解决?方法让人难以启齿

牛牛叨史
2025-11-06 15:45:54
中方正式发出通知,一分不差地按时履行承诺,狠狠打了美方一巴掌

中方正式发出通知,一分不差地按时履行承诺,狠狠打了美方一巴掌

小影的娱乐
2025-11-07 05:32:02
副院长和眼科医生为爱鼓掌17分钟,背后还有更大的瓜,官方回应

副院长和眼科医生为爱鼓掌17分钟,背后还有更大的瓜,官方回应

温柔看世界
2025-11-06 17:09:27
“夺冠后不傲慢,而要再次证明自己”

“夺冠后不傲慢,而要再次证明自己”

南方都市报
2025-11-07 07:04:11
“有仇必还”!告别陈伟霆,携手百亿继承人,家世显赫无人能敌

“有仇必还”!告别陈伟霆,携手百亿继承人,家世显赫无人能敌

可乐谈情感
2025-11-06 12:56:31
我比小贝更帅!C罗:我更完美,他除了脸之外很普通

我比小贝更帅!C罗:我更完美,他除了脸之外很普通

奥拜尔
2025-11-06 23:23:29
就在今天!11月7号,中国跳水传来陈芋汐、掌敏洁新消息

就在今天!11月7号,中国跳水传来陈芋汐、掌敏洁新消息

皮皮观天下
2025-11-07 04:43:20
古二节目被扒!给小S做饭,闪躲林志玲,老实人撕碎了王家卫滤镜

古二节目被扒!给小S做饭,闪躲林志玲,老实人撕碎了王家卫滤镜

艺能八卦局
2025-11-07 05:02:43
古二成功毁掉王家卫,《繁花》电影版流产,导演生涯基本结束

古二成功毁掉王家卫,《繁花》电影版流产,导演生涯基本结束

光影新天地
2025-11-04 14:48:35
快速补充能量,哈兰德晒自己赛后吃烤羊排照片

快速补充能量,哈兰德晒自己赛后吃烤羊排照片

懂球帝
2025-11-06 16:14:25
学医后才知道,保护心血管最好的运动,不是慢跑快走,而是这个

学医后才知道,保护心血管最好的运动,不是慢跑快走,而是这个

普陀动物世界
2025-11-04 08:27:58
北京通报:耿建光、刘占杰被开除党籍

北京通报:耿建光、刘占杰被开除党籍

鲁中晨报
2025-11-06 21:47:02
2025-11-07 07:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15827文章数 514270关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

"一键投诚"APP在台湾引热议 台当局破防

头条要闻

"一键投诚"APP在台湾引热议 台当局破防

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

旅游
艺术
家居
数码
公开课

旅游要闻

首周末五千人次打卡拉动乡村消费

艺术要闻

Omar Ortiz 2025作品,墨西哥当代极简超写实画家

家居要闻

别样府院 畅享诗意生活

数码要闻

苹果Apple TV全新开场动画幕后:相机结合玻璃Logo实拍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版