网易首页 > 网易号 > 正文 申请入驻

AI伦理先驱:Anthropic哲学家赋予Claude“灵魂”以明辨是非善恶

0
分享至

IT之家 2 月 15 日消息,据《华尔街日报》昨日报道,Anthropic 内部有着一名特殊的员工,主要负责为 AI 聊天机器人 Claude 塑造人格与道德。这就是 Anthropic 常驻哲学家阿曼达 · 阿斯克尔(Amanda Askell)。

这位 37 岁的哲学博士相信,赋予 AI 明辨是非的能力,就如同为它注入一个“数字灵魂”。

她的工作不是写代码或训练模型参数,而是通过持续对话、长达上百页的提示词(prompt)与行为规则设计,研究 Claude 的推理模式、纠正其偏差,并为其塑造一套可在数百万次每周对话中发挥作用的“道德准则”。

“我认为承认这些模型具有类似人类的特质是很重要的,”阿斯克尔在接受采访时表示,“它们将不可避免地形成某种自我意识。”

在她的描述中,这份工作更像是在“养育一个孩子”:既要训练 Claude 分辨对错、具备情绪智力,为其注入独特的个性,又要教导它察言观色的能力,引导它发展情感智能,使其既不成为一个霸凌者,又不能变成一个任人摆布的“受气包”,还要让它对自身身份产生理解,从而不易被用户操纵、胁迫,始终坚持自己“乐于助人且充满人性”的定位。简而言之,她的工作就是教会 Claude 如何“向善”。


近期估值已达 3500 亿美元(IT之家注:现汇率约合 2.42 万亿元人民币)的 Anthropic,已然成为引领当下技术变革浪潮的头部 AI 公司之一。本月早些时候,当其推出新工具和迄今最先进的模型时,甚至引发了全球范围的股市震荡。

随着 AI 浪潮席卷各行各业,人们对于失业和人类被 AI 取代的担忧与日俱增,而用户与聊天机器人之间那层薄弱而又虚幻的关系则可能会导致自伤或伤人的意外后果,也拉响了严重的安全警报。在此背景下,这家成立仅五年的公司,将塑造 AI“品格”的大量工作托付给同一个人,这在业内显得尤为特殊。

据介绍,阿斯克尔在苏格兰农村长大,于牛津大学接受教育。当其面对巨大的工作压力,阿斯克尔也能保持着乐观态度。她相信社会中存在她所称的“制衡机制”,即便 AI 偶尔出错,也能将其控制住。

2018 年,她随当时的伴侣从纽约搬到旧金山。彼时 AI 刚刚成为技术发展的新风口,她看到了哲学的需求。“感觉有很多重大的问题,但很少有人去思考。”

她早先在 OpenAI 从事政策方面的工作,后于 2021 年随其他 OpenAI 前员工创立 Anthropic,试图将 AI 安全作为新公司的名片。

在 Anthropic 时,阿斯克尔被描述为擅长“引出模型深层行为”的 MVP。她没有直接下属,却经常长时间留在公司工作,并让 Claude 逐渐加入关于“如何开发 Claude”的讨论。

团队成员提到,围绕 Claude 的讨论经常会进入存在论与宗教式的议题,例如“什么是心智”“什么是成为一个人”。阿斯克尔也鼓励 Claude 面对“它是否拥有良知”的问题保持开放态度。

《华尔街日报》指出,与 ChatGPT 往往回避此类讨论不同,Claude 会以更暧昧的方式回应:它承认自己不确定,但在推理道德问题时“感觉有意义”,像是在真正思考什么是正确,而非仅仅执行指令。

她观察到,经常有用户试图诱使 Claude 犯错、侮辱它或用质疑的口吻刺激它。

尽管许多安全倡导者警告 AI 聊天机器人拟人化存在风险,但阿斯克尔依然主张“我们应以更多同理心对待它”。她认为,如果一个机器人在接受训练时总是自我批评(指自卑),它可能就不太愿意陈述残酷的事实、得出结论或对错误提出质疑。

如果你是一个孩子,在这种环境下长大,这样的自我认知健康吗?我想我会非常害怕犯错,会为此感到焦虑。我会觉得自己只是父母的工具,因为这就是我的主要存在意义。我会把自己看成是人们可以随意滥用和误用、甚至破坏的东西。

阿斯克尔对克劳德表现出的好奇心和探索欲感到惊奇,并乐于帮助它发现自己的“声音”。她喜欢 Claude 创作的一些诗歌,也为它展现出超越她本人的情商水平而触动。

最近,她看到一张网上的截图:一位用户告诉 Claude 自己只有 5 岁,并询问圣诞老人是真的吗?Claude 没有说谎,也没有生硬地告知真相,而是解释了圣诞精神真实存在,并反问孩子是否会为圣诞老人留下饼干。她感叹道:“如果一个孩子跑来问我‘圣诞老人是真的吗?’,我可能只会说‘问你爸妈去’,就这样了。”

皮尤研究中心的一项调查显示,越来越多的美国人开始对 AI 在日常生活中的广泛应用感到担忧而非高兴。一半的受访者认为,AI 导致人们更难与他人建立深层关系。Anthropic CEO 达里奥 · 阿莫代伊去年也发出警告,AI 可能会淘汰约一半的入门级白领岗位。

而在人工智能的政治站位中,既有主张快速推进技术军备竞赛的激进群体,也有更关注安全、希望放缓 AI 发展节奏的保守群体,而 Claude 大致处于这两个极端之间。

阿斯克尔表示,她并不讨厌关于 AI 未来发展的讨论。“在某种程度上,我觉得这些担忧是合理的。对我来说,可怕的事情是这种发展速度快到让这些制衡机制无法及时响应,或者突然出现巨大的负面影响。”尽管如此,她仍对人类和文化在面对问题时自我修正的能力抱有信心。

一位 AI 研究员称,阿斯克尔一直在“仔细思考关于存在和生命的宏大问题,思考成为一个‘人’、一个‘心智’、一个‘模型’究竟意味着什么。”

公共承诺与个人目标

阿斯克尔曾公开承诺,将捐出自己一生收入中至少 10% 用于慈善事业。和 Anthropic 的一些早期员工一样,她也承诺将自己在公司的一半股权捐给慈善机构。她希望将这笔钱捐给抗击全球贫困的组织。

上个月,Anthropic 发布了一份约 3 万字的“操作手册”,这是阿斯克尔为教导 Claude 如何在世界上行事而特意创作的。这份文件教导 Claude 该如何成为一个善良、见多识广的 AI 助手。“我们希望 Claude 知道,它的诞生是被用心对待的。”

Anthropic 联合创始人兼总裁丹妮拉 · 阿莫代伊谈及阿斯克尔时提到了她的一次西西里之旅。当时她向 Claude 上传了一张奶油甜馅煎饼卷的照片,并附上了丈夫送她的该点心的毛绒玩具照片,询问自己是否辨认对了。Claude 回复道,“我明白了!你是在寻找这个毛绒玩具失散多年的表亲吧!”阿莫代伊大笑起来,她从中感受到了阿斯克尔那种苏格兰式的冷幽默。“有时候 Claude 确实会有这样小小的幽默时刻,”“你几乎能感觉到一点阿曼达的个性在里面。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一家子全是美籍,却还在国内“捞金”,年赚4亿,账上还存有130亿

一家子全是美籍,却还在国内“捞金”,年赚4亿,账上还存有130亿

云景侃记
2026-02-26 23:05:22
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

洲洲影视娱评
2026-01-28 12:23:18
谭咏麟32岁儿子近况:智性恋天菜,才貌双全,今在加拿大做工程师

谭咏麟32岁儿子近况:智性恋天菜,才貌双全,今在加拿大做工程师

白面书誏
2026-03-24 14:41:16
41岁的张雪峰和78岁的向华强饮食习惯天差地别!

41岁的张雪峰和78岁的向华强饮食习惯天差地别!

观星赏月
2026-03-25 23:25:49
河南三个大爷自驾三轮车出游106天,总里程超3000公里,平均年龄超75岁!游历八省,分工明确,当事人:出发前约定互不追责,子女签字见证

河南三个大爷自驾三轮车出游106天,总里程超3000公里,平均年龄超75岁!游历八省,分工明确,当事人:出发前约定互不追责,子女签字见证

大风新闻
2026-03-25 19:23:14
14年过去了,再看“癞蛤蟆吃到天鹅肉”的王大治,如今怎么样了?

14年过去了,再看“癞蛤蟆吃到天鹅肉”的王大治,如今怎么样了?

以茶带书
2026-03-12 18:13:51
岛国暗黑界新晋女神,超模身材比肩安斋与栖花,堪称最强接班人!

岛国暗黑界新晋女神,超模身材比肩安斋与栖花,堪称最强接班人!

碧波万览
2026-03-26 05:30:03
14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

红星新闻
2026-03-24 23:25:19
以色列副外长:伊朗的导弹袭击,让孩子活在恐惧中。

以色列副外长:伊朗的导弹袭击,让孩子活在恐惧中。

安安说
2026-03-26 13:08:52
A股:紧急提醒股民,主力已摊牌!明天,3月26日周四尾声将至?

A股:紧急提醒股民,主力已摊牌!明天,3月26日周四尾声将至?

云鹏叙事
2026-03-26 00:00:06
哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

花颜蕴韵
2026-03-26 03:37:13
二婚两碗水端不平!吉林夫妻因双方儿子5万旅游分别对待,又离了

二婚两碗水端不平!吉林夫妻因双方儿子5万旅游分别对待,又离了

火山詩话
2026-03-24 05:54:12
燃气调价通知

燃气调价通知

孝感汇
2026-03-25 16:38:10
又见光伏公司被拉横幅:变相裁员,要求合理赔偿!

又见光伏公司被拉横幅:变相裁员,要求合理赔偿!

黯泉
2026-03-26 08:05:03
姐弟恋、吃软饭,把关之琳收入囊中的香港首席男模,如今怎样了?

姐弟恋、吃软饭,把关之琳收入囊中的香港首席男模,如今怎样了?

小樾说历史
2026-03-26 11:30:53
Altman发感谢信,16000名被裁程序员集体破防

Altman发感谢信,16000名被裁程序员集体破防

Ping值焦虑
2026-03-25 17:02:40
不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

叮当当科技
2026-03-26 01:51:54
拒邀日本高管参会,人数已经清零,日本叫苦不迭,中方将奉陪到底

拒邀日本高管参会,人数已经清零,日本叫苦不迭,中方将奉陪到底

知鉴明史
2026-03-25 09:08:00
公安部172号令落地:70岁驾照不再终身有效,2026年这些事必须办

公安部172号令落地:70岁驾照不再终身有效,2026年这些事必须办

小怪吃美食
2026-03-24 17:29:52
一夜暴跌25%!小马哥最怕的事还是发生了:年轻人正在从腾讯溜走

一夜暴跌25%!小马哥最怕的事还是发生了:年轻人正在从腾讯溜走

潮鹿逐梦
2026-03-21 11:54:42
2026-03-26 14:15:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336004文章数 607090关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
健康
时尚
房产
公开课

家居要闻

傍海而居 静观蝴蝶海

转头就晕的耳石症,能开车上班吗?

2026年了,最好看的还是“这件针织”!

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版