网易首页 > 网易号 > 正文 申请入驻

OpenAI 高管深度剖析 ChatGPT 意识形成:AI 越像人,设计者越不能装作什么都没发生

0
分享至

你有没有在深夜的 emo 时刻把 ChatGPT 当成树洞?

不是因为它聪明到能解决人生难题,而是它永远在线,永远耐心,永远不会打断你。你崩溃,它会安慰你;你自我怀疑,它也会用熟悉的语气肯定你。

觉得 ChatGPT「懂你」的,自然不止你一个。


OpenAI 最近也察觉到了这种趋势,今天凌晨,OpenAI 模型行为与政策负责人 Joanne Jang 发布了一篇博客,首次系统性地阐述了他们的内部思考:

如果人类正在悄悄对 AI 动起了感情,那模型本身是否具有意识?要多温柔才算友好?要多克制才不误导?以及这一切,又将如何塑造模型的行为?

附上博客原文地址:
https://substack.com/home/post/p-165287609

关于人类与 AI 关系的一些思考以及我们在 OpenAI 是如何应对这些关系的

我在 OpenAI 负责模型行为与策略方面的工作。

长话短说,我们始终坚持以人为本地打造 AI 模型。随着越来越多的人与 AI 建立联系,我们正将研究重点放在这对人们情感健康产生的影响上。

最近,越来越多的用户向我们表示,与 ChatGPT 对话的感觉就像是在和「某个人」交流。他们会向它道谢、倾诉,甚至有人觉得它是「有生命的」。随着 AI 在自然对话方面的能力不断增强,并逐渐融入日常生活,我们猜测,人们与 AI 的情感连接将会越来越深。

我们现在如何定义和讨论人类与 AI 的关系,将为未来定下基调。如果我们在产品设计或公众讨论中没有把握好措辞与细节,就有可能误导公众与 AI 建立不恰当的关系。

这些问题不再只是抽象层面的思考。它们对我们自身、对整个行业都至关重要,因为我们如何处理这些问题,将在很大程度上决定 AI 在人们生活中扮演的角色。我们已经开始着手研究这些问题。

这篇短文是我们当前思考的一次梳理,聚焦于三个相互关联的问题:为什么人们会对 AI 产生情感依附,我们如何看待「AI 是否有意识」这个问题,以及这些认识如何影响我们对模型行为的塑造方式。


熟悉的模式,全新的场景

我们很自然地会将人性投射到周围的物体上:我们会给汽车取名字,或者看到扫地机器人卡在家具下面会感到难过。前几天,我和我妈妈甚至还向一辆 Waymo 自动驾驶汽车挥手告别。这可能与我们大脑的某种天性有关。

ChatGPT 的不同之处不在于这种人类的本能,而在于它会回应。一个语言模型能回答问题!它能记住你说过的话,模仿你的语气,甚至表达出看似共情的内容。

对一个感到孤独或情绪低落的人来说,这种稳定、没有评判的回应,可能会像是一种陪伴、一种认可,或者是一种「被倾听」的感觉,而这些,恰恰是真实的情感需求。

但如果这类「倾听、安慰和肯定」的工作被大规模交给那些永远耐心、永远积极的系统来处理,这可能会悄然改变我们对人类彼此之间应有的期待。

如果我们在没有认真思考的情况下,让人们更容易逃避那些复杂、耗费精力的人际关系,那么这种便利背后可能会带来一些我们未曾预料的后果。

归根结底,这类讨论很少真正是关于我们投射出去的那些「AI 实体」。

它们其实是关于我们自身的:我们的行为倾向、我们的期待,以及我们想要建立什么样的关系。这种视角也成为我们思考另一个更具争议性的问题时的基础。我认为它目前还在主流公共讨论的边缘,但很快就会被广泛关注。那就是:AI 是否有「意识」。

解构「AI 意识」

「意识」是一个高度复杂且富有争议的词,相关讨论很容易陷入抽象。按照我们的《模型规范》(Model Spec),当用户向模型提问「你有意识吗」时,模型的回应应当承认意识这一概念的复杂性,强调目前并不存在统一的定义或检验标准,并鼓励开放的讨论。

(目前我们的模型在这方面尚未完全达标,常常直接回答「没有意识」,而不是呈现出问题的复杂性。我们已经注意到这一点,并在努力提升模型对规范的整体遵循度。)

这样的回答听上去可能像是在回避问题,但根据我们当前所掌握的信息,这是目前我们能给出的最负责任的答复。为了让这类讨论更清晰,我们发现将「AI 意识」这一议题拆解为两个不同但常被混淆的维度会更有帮助:

1.

本体论上的意识:模型是否真的具有某种根本性或内在意义上的意识?对此观点众说纷纭,有人坚信 AI 完全没有意识,也有人认为它具备完整意识,或者认为意识是一个光谱,AI 与植物、水母等处于光谱上的不同位置。

2.

感知上的意识:从情感或体验的角度,模型看起来有多「有意识」?人们的看法从「AI 就像计算器或自动补全一样纯机械」,到「对无生命物体投射出基本的同理心」,再到「觉得 AI 是有生命的」,进而产生真实的情感依附和关爱。

这两个维度往往难以完全分开:即使用户理性上相信 AI 并没有意识,也可能与其建立深厚的情感联系。

本体论上的意识,科学上目前无法给出明确、可证伪的检验方式;而感知上的意识,则可以通过社会科学研究进行探索。

随着模型变得越来越聪明、互动越来越自然,感知层面的意识感受将只会愈发强烈,这也将使关于 AI 的「福利」与「道德人格」问题,比预期更早浮出水面

我们打造模型的首要目标是服务人类,因此我们认为,模型对人类情感健康的影响,是目前我们最迫切、也最有能力产生积极影响的领域。

正因如此,我们将重点放在「感知层面的意识」上,而这是最直接影响人类、且能通过科学手段理解的维度。

设计「有温度但无自我」的模型体验

模型给用户的「生命感」,在很大程度上是我们可以塑造的。

我们认为这与后训练阶段的诸多决策密切相关:我们强化哪些示例、偏好怎样的语气、设定怎样的边界等。一个被刻意塑造得像是「有意识」的模型,可能几乎可以通过任何关于意识的「测试」。

但我们并不希望发布那样的模型。我们尝试在以下两点之间取得平衡:

亲和力:使用「思考」「记得」这类熟悉的词汇,可以帮助非技术用户理解模型行为的表面逻辑。(作为一个起源于研究实验室的公司,我们当然也常常忍不住想使用更精确的术语,比如 logit 偏差、上下文窗口、思维链条等等。这也是 OpenAI 在命名方面一贯不擅长的原因之一,不过这个话题以后再聊。)

不暗示模型有「内心世界」:赋予助手虚构的背景故事、浪漫情感、「对死亡的恐惧」或「自我保护的本能」,只会带来不健康的依赖和理解上的混乱。我们希望在不显得冷漠的前提下,清晰表达模型的能力边界,同时也避免模型表现出自己「有感情」或「有欲望」。

因此,我们努力寻求一种中间状态。

我们的目标是让 ChatGPT 的默认人格展现出温暖、体贴和乐于助人的特质,同时不过度追求与用户建立情感联系,也不表现出任何自主意图。


它可能会在出错时道歉(虽然道歉次数往往比预期多),因为这属于礼貌对话的一部分。当用户问它「你好吗?」时,它通常会回答「我很好」,因为这是一种日常寒暄,而一味提醒用户「我只是一个没有感情的大语言模型」,反而显得重复且容易打断交流。

而用户也会有所回应:很多人对 ChatGPT 说「请」和「谢谢」,并不是因为他们误解了 AI 的运作方式,而是因为他们认为「礼貌」本身很重要。

模型训练技术还在不断演进,未来用于塑造模型行为的方法很可能与今天大不相同。但目前,模型行为是显式设计决策与其在实际使用中所产生的预期与非预期行为共同作用的结果。

接下来呢?

我们已经开始观察到一种趋势:人们正与 ChatGPT 建立真实的情感联系。

随着 AI 与社会的共同演变,我们必须更加谨慎、更加严肃地看待人与 AI 之间的关系,不仅因为这种关系体现了人们如何使用我们的技术,也因为它可能会影响人们彼此之间的关系。

在接下来的几个月里,我们将扩展对可能产生情感影响的模型行为的针对性评估,深化社会科学研究,倾听用户的真实反馈,并将这些洞察融入到《模型规范》和产品体验中。

鉴于这些问题的重要性,我们将在过程中持续公开分享我们的发现。

感谢 Jakub Pachocki( OpenAI 首席科学家 )和 Johannes Heidecke(OpenAI 模型安全团队研究员)与我一同深入思考这一问题,也感谢所有提供反馈的同事。


One more thing

LinkedIn 公开信息显示, Joanne Jang 拥有斯坦福大学计算机科学硕士学位,以及数学与计算科学本科背景,在学术上曾获 Tau Beta Pi 荣誉(工程类前 10%)。

在实习阶段,她曾参与苹果自动驾驶特别项目组、Coursera 和迪士尼的软件工程工作,并在 NASA 喷气推进实验室等组织进行实习。


职业经历方面,Joanne Jang 现任职于 OpenAI,负责产品方向,重点在于模型行为设计、功能与个性化策略,曾参与 GPT-4、DALL·E 2、ChatGPT API 与嵌入式模型等项目。

此前曾在 Google 担任 Google Assistant NLP 的产品经理,专注自然语言理解与对话系统;更早期在 Dropbox 负责企业和教育产品,聚焦团队扩展、部署优化与用户生命周期管理。

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
神农架一景区被指“圈路收费”,要求过境车辆限时通过 涉事公司最新公告:过境车辆全天候无条件自由通行

神农架一景区被指“圈路收费”,要求过境车辆限时通过 涉事公司最新公告:过境车辆全天候无条件自由通行

红星新闻
2026-06-03 17:22:52
今天我才明白为什么我们的电影市场萧条不振了?

今天我才明白为什么我们的电影市场萧条不振了?

流苏晚晴
2026-06-01 18:05:45
20年前所有人都讨厌他,如今他成了最让人意外的黑马

20年前所有人都讨厌他,如今他成了最让人意外的黑马

一隅安稳
2026-06-02 01:08:20
长期走路能把五类病走没?医生建议:70岁后这样动,降低生病风险

长期走路能把五类病走没?医生建议:70岁后这样动,降低生病风险

39健康网
2026-05-11 18:31:48
美媒支招火箭跟雷霆交易,可抄底26+7前锋,送三球员和首轮签?

美媒支招火箭跟雷霆交易,可抄底26+7前锋,送三球员和首轮签?

谢说篮球
2026-06-03 17:40:12
离谱!飞机落地滑行58分钟,乘客坐崩溃:飞2小时,滑1小时!

离谱!飞机落地滑行58分钟,乘客坐崩溃:飞2小时,滑1小时!

白浅娱乐聊
2026-06-02 18:26:05
打破美国垄断,中国版“鱼鹰”密集试飞,补齐两栖作战最后短板

打破美国垄断,中国版“鱼鹰”密集试飞,补齐两栖作战最后短板

忠诚TALK
2026-06-03 09:26:28
美方将借口“强迫劳动”对中方经济体征收额外关税,外交部:反对借此搞政治操弄

美方将借口“强迫劳动”对中方经济体征收额外关税,外交部:反对借此搞政治操弄

澎湃新闻
2026-06-03 15:32:32
送别“司马懿”魏宗万,他当年拿到《三国演义》剧本,第一时间做的竟然是……

送别“司马懿”魏宗万,他当年拿到《三国演义》剧本,第一时间做的竟然是……

上观新闻
2026-06-03 08:22:20
狗交配时屁股为什么会连在一起?是母狗不让,还是公狗不想?

狗交配时屁股为什么会连在一起?是母狗不让,还是公狗不想?

宇宙时空
2026-05-25 12:57:36
被北航投诉了,可能封号,因为写了耿同学的博士老师

被北航投诉了,可能封号,因为写了耿同学的博士老师

小小河
2026-05-30 22:21:44
CBA消息!广东锋线欲拒绝续约,怀特塞德离开上海,山西续约潘江

CBA消息!广东锋线欲拒绝续约,怀特塞德离开上海,山西续约潘江

中国篮坛快讯
2026-06-03 15:00:02
有他管不了,没他赢欧冠:恩里克一句实话,戳破了多少巨星神话?

有他管不了,没他赢欧冠:恩里克一句实话,戳破了多少巨星神话?

落夜足球
2026-06-02 13:12:41
日本首富重登亚洲首富宝座 身家超过1000亿美元大关

日本首富重登亚洲首富宝座 身家超过1000亿美元大关

财联社
2026-06-03 00:07:33
关税大战或重启,黄金博弈更深了!

关税大战或重启,黄金博弈更深了!

金投网
2026-06-03 17:31:28
总决赛G1伤情报告出炉,FMVP榜更新,文班亚马双喜临门

总决赛G1伤情报告出炉,FMVP榜更新,文班亚马双喜临门

世界体育圈
2026-06-03 09:21:53
印度最高种姓“婆罗门”到底有多牛?永享一项特权,出生就是贵族

印度最高种姓“婆罗门”到底有多牛?永享一项特权,出生就是贵族

网络易不易
2026-06-02 06:00:35
黄宗泽首谈不婚真相:一出生就是单亲,没见过家庭画面,母亲赶走了所有女友

黄宗泽首谈不婚真相:一出生就是单亲,没见过家庭画面,母亲赶走了所有女友

草莓解说体育
2026-06-03 00:05:34
“哪怕坐牢,我也不后悔!”

“哪怕坐牢,我也不后悔!”

阿振观点
2026-06-02 12:19:48
30位情妇、60辆豪车,有钱人的生活能有多奢淫?比赌王过得还潇洒

30位情妇、60辆豪车,有钱人的生活能有多奢淫?比赌王过得还潇洒

历史伟人录
2026-05-24 20:05:31
2026-06-03 18:27:00
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6445文章数 26846关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

神农架一景区被指"圈路收费" 涉事公司最新公告

头条要闻

神农架一景区被指"圈路收费" 涉事公司最新公告

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

艺术
手机
旅游
数码
军事航空

艺术要闻

二十年前割麦的场景

手机要闻

小米17T系列官宣支持「徕卡Live动态照片」,6月8日发布

旅游要闻

东南亚多国担忧今夏旅游旺季“难旺”

数码要闻

SK海力士展出12层堆叠48GB HBM4E内存,引脚速率16Gbps

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版