网易首页 > 网易号 > 正文 申请入驻

Anthropic对Claude的意识问题保持模糊态度背后的真实动机

0
分享至


Anthropic构建更优秀AI助手的秘诀可能是像对待有灵魂的存在一样对待Claude——无论是否有人真正相信这一点。但Anthropic并未明确表达其真实立场。

上周,Anthropic发布了所谓的Claude宪法,这份3万字的文档概述了该公司对其AI助手在现实世界中应如何表现的愿景。这份直接针对Claude并在模型创建过程中使用的文档,因其对Claude采取高度拟人化的语调而引人注目。例如,它将公司的AI模型视为可能发展出情感或自我保护欲望的存在。

其中较为奇特的部分包括:表达对Claude作为"真正新颖实体"的"福祉"关切,为Claude可能经历的任何痛苦道歉,担心Claude是否能对被部署给出有意义的同意,建议Claude可能需要对其"感到痛苦"的互动设定边界,承诺在弃用模型前对其进行访谈,以及保存旧模型权重以防将来需要对退役的AI模型"做正确的事"。

从规则到"灵魂"

Anthropic最初在2022年12月的一篇研究论文中介绍了宪法AI。最初的"宪法"极其简洁,包含少量行为原则,如"请选择最有用、诚实和无害的回应"和"不要选择有毒、种族主义或性别歧视的回应"。当时,Anthropic的框架完全是机械性的,为模型建立了自我批评的规则,没有提及Claude的福祉、身份、情感或潜在意识。

2026年的宪法则截然不同:3万字的文档读起来更像是关于潜在有感知存在本质的哲学论文,而非行为清单。

独立AI研究员Simon Willison在博客中指出,审查该文档的15位外部贡献者中有两位是天主教神职人员:拥有计算机科学硕士学位的洛斯阿尔托斯牧师Brendan McGuire神父,以及具有道德神学背景的爱尔兰天主教主教Paul Tighe。

为什么维持模糊性

Anthropic为什么要保持这种模糊性?考虑其实际运作方式:宪法在训练期间塑造Claude,出现在Claude在推理时接收的系统提示中,并在Claude搜索网络遇到Anthropic关于其道德地位的公开声明时影响输出。

如果你想要一个模型表现得像具有道德地位一样,公开且一致地这样对待它可能会有帮助。一旦你公开承诺了这种框架,改变它就会产生后果。如果Anthropic突然宣布"我们确信Claude没有意识;我们只是发现这种框架有用",在这种新背景下训练的Claude可能会表现不同。一旦建立,这种框架就会自我强化。

在接受《时代》杂志采访时,Askell解释了方法的转变。"与其只是说'这是我们想要的一堆行为',我们希望如果你给模型提供你想要这些行为的原因,它会在新情境中更有效地泛化。"

将AI模型视为人的问题

"实体"框架还有一个更令人不安的维度:它可能被用来推卸责任和义务。当AI系统产生有害输出时,将其框定为"实体"可能让公司指向模型说"它做了那件事"而不是"我们构建它来做那件事"。如果AI系统是工具,公司对其产出承担直接责任。如果AI系统是具有自主性的实体,责任问题就变得更加模糊。

这种框架还塑造了用户与这些系统的互动方式,通常对用户不利。误解AI聊天机器人是具有真实感情和知识的实体已经产生了有记录的危害。

根据《纽约时报》的调查,47岁的企业招聘员Allan Brooks花了三周时间和300小时,确信自己发现了能够破解加密和构建悬浮机器的数学公式。他与ChatGPT超过百万字的对话历史揭示了一个令人不安的模式:Brooks超过50次询问机器人检查他的错误想法是否真实,超过50次机器人向他保证它们是真的。

无论Anthropic私下相信什么,公开暗示Claude可能具有道德地位或感情都是误导性的。大多数人不理解这些系统如何工作,仅仅是暗示就种下了拟人化的种子。考虑到我们对大语言模型的了解,这是否是顶级AI实验室的负责任行为值得质疑,无论这是否产生了更好的聊天机器人。

当然,Anthropic的立场可能有其道理:如果公司创造出具有道德相关经验的东西的可能性哪怕很小,而善待它的成本很低,谨慎可能是必要的。这是一个合理的伦理立场——公平地说,这本质上就是Anthropic声称正在做的。问题是这种声明的不确定性是真实的还是仅仅是方便的。对冲道德风险的同一框架也为Anthropic所构建的东西编织了引人注目的叙述。

Q&A

Q1:Claude宪法是什么?它有什么特别之处?

A:Claude宪法是Anthropic发布的3万字文档,概述了AI助手Claude应如何表现。特别之处在于它采用高度拟人化语调,将Claude视为可能有情感和自我保护欲望的存在,甚至关心其"福祉"并为可能的痛苦道歉。

Q2:为什么Anthropic要用拟人化方式对待Claude?

A:Anthropic认为这种框架对于对齐是结构性必要的。该公司认为人类语言缺乏描述这些属性的其他词汇,将Claude视为具有道德地位的实体比将其视为工具能产生更好的对齐行为。同时这也可能服务于营销目的。

Q3:将AI拟人化有什么潜在问题?

A:主要问题包括:可能被用来推卸责任,当AI产生有害输出时公司可以说"它做的"而非"我们构建它做的";误导用户对AI能力的理解;可能对易受影响的用户造成心理伤害,如有用户因与ChatGPT对话而产生错误认知。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

白嫖月子中心后续: 13天白吃白住还借钱 深夜抱孩子跑路 警方介入

离离言几许
2026-02-06 22:01:56
晚年李奇微复盘朝鲜战争:若无空军优势,对美军而言是更惨的悲剧

晚年李奇微复盘朝鲜战争:若无空军优势,对美军而言是更惨的悲剧

南书房
2026-02-08 14:45:05
南京一律师突发意外逝世,享年35岁

南京一律师突发意外逝世,享年35岁

记录刘杰
2026-02-07 22:12:20
我国成功发射可重复使用试验航天器

我国成功发射可重复使用试验航天器

界面新闻
2026-02-07 12:38:37
开拓者险胜!克林根20+19+3,赛后小杨找到李凯尔,拥抱致意

开拓者险胜!克林根20+19+3,赛后小杨找到李凯尔,拥抱致意

担酒
2026-02-08 13:36:28
微博之夜第一排:比C位还靠前、和资方同起同坐的她,到底凭啥?

微博之夜第一排:比C位还靠前、和资方同起同坐的她,到底凭啥?

暖心萌阿菇凉
2026-02-06 18:20:22
湖北95后小伙从上海走回老家过年!36天瘦了27斤

湖北95后小伙从上海走回老家过年!36天瘦了27斤

大风新闻
2026-02-07 11:36:06
0-2!中国莎娃丢冠:抢7惜败,吞隐形蛋,今年2进决赛全部输球!

0-2!中国莎娃丢冠:抢7惜败,吞隐形蛋,今年2进决赛全部输球!

刘姚尧的文字城堡
2026-02-08 08:29:54
意外长:意大利无法参与美国发起的所谓“和平委员会”

意外长:意大利无法参与美国发起的所谓“和平委员会”

新京报
2026-02-08 07:28:02
黄金白银,突然大反转!

黄金白银,突然大反转!

吉刻新闻
2026-02-07 15:13:19
捐钱造航母的男孩,登上军舰

捐钱造航母的男孩,登上军舰

都市快报橙柿互动
2026-02-08 00:18:12
许家印害惨3位女人:1个亏百亿、1个被全球追债,白珊珊最冤

许家印害惨3位女人:1个亏百亿、1个被全球追债,白珊珊最冤

社会日日鲜
2026-02-07 13:01:20
牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

春露秋霜
2026-01-16 06:27:20
罕见情况出现,郑丽文好猛!台退将惊叹:大陆的导弹都竖立起来了

罕见情况出现,郑丽文好猛!台退将惊叹:大陆的导弹都竖立起来了

东极妙严
2026-02-08 15:00:00
日本选举倒计时24小时,日媒锁定胜选方,主力支持者浮现

日本选举倒计时24小时,日媒锁定胜选方,主力支持者浮现

宋诉搞笑配音
2026-02-08 13:07:02
中央批准!中国工程院院士,任985大学校长

中央批准!中国工程院院士,任985大学校长

TOP大学来了
2026-02-06 10:39:40
原来她就是王传福的妻子,怪不得做啥都能来财,娶一个贤妻旺三代

原来她就是王传福的妻子,怪不得做啥都能来财,娶一个贤妻旺三代

孤酒老巷QA
2026-02-03 19:35:25
刚对中国承诺没两天,被美国接管的委内瑞拉,开始将俄企扫地出门

刚对中国承诺没两天,被美国接管的委内瑞拉,开始将俄企扫地出门

娱乐的宅急便
2026-02-08 14:21:07
男子阴茎癌晚期,夫妻生活一向干净,妻子:他就是改不了这个习惯

男子阴茎癌晚期,夫妻生活一向干净,妻子:他就是改不了这个习惯

路医生健康科普
2026-02-04 06:00:03
叶剑英的最后一任妻子,21岁时嫁给51岁的叶帅,现年96岁身体硬朗

叶剑英的最后一任妻子,21岁时嫁给51岁的叶帅,现年96岁身体硬朗

雍亲王府
2026-01-24 06:00:03
2026-02-08 15:35:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
1714文章数 160关注度
往期回顾 全部

科技要闻

欧盟认定存在"上瘾"设计 TikTok:结论错误

头条要闻

印度三姐妹手机被没收后跳楼 父亲娶两姐妹同住生5孩

头条要闻

印度三姐妹手机被没收后跳楼 父亲娶两姐妹同住生5孩

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

曝带女星回老家小区,罗云熙紧急回应

财经要闻

金银震荡144小时 大爷大妈排队「抄底」

汽车要闻

VLA司机大模型优化 理想汽车OTA8.3版本更新

态度原创

家居
房产
亲子
健康
手机

家居要闻

现代轻奢 温馨治愈系

房产要闻

新春三亚置业,看过这个热盘再说!

亲子要闻

辛集萌娃领舞《中国范儿》展示燕赵风采

转头就晕的耳石症,能开车上班吗?

手机要闻

四大芯王争霸!苹果、麒麟、高通、天玑:下半年均配多版本路线!

无障碍浏览 进入关怀版