网易首页 > 网易号 > 正文 申请入驻

AI伦理先驱:Anthropic哲学家赋予Claude“灵魂”以明辨是非善恶

0
分享至

IT之家 2 月 15 日消息,据《华尔街日报》昨日报道,Anthropic 内部有着一名特殊的员工,主要负责为 AI 聊天机器人 Claude 塑造人格与道德。这就是 Anthropic 常驻哲学家阿曼达 · 阿斯克尔(Amanda Askell)。

这位 37 岁的哲学博士相信,赋予 AI 明辨是非的能力,就如同为它注入一个“数字灵魂”。

她的工作不是写代码或训练模型参数,而是通过持续对话、长达上百页的提示词(prompt)与行为规则设计,研究 Claude 的推理模式、纠正其偏差,并为其塑造一套可在数百万次每周对话中发挥作用的“道德准则”。

“我认为承认这些模型具有类似人类的特质是很重要的,”阿斯克尔在接受采访时表示,“它们将不可避免地形成某种自我意识。”

在她的描述中,这份工作更像是在“养育一个孩子”:既要训练 Claude 分辨对错、具备情绪智力,为其注入独特的个性,又要教导它察言观色的能力,引导它发展情感智能,使其既不成为一个霸凌者,又不能变成一个任人摆布的“受气包”,还要让它对自身身份产生理解,从而不易被用户操纵、胁迫,始终坚持自己“乐于助人且充满人性”的定位。简而言之,她的工作就是教会 Claude 如何“向善”。


近期估值已达 3500 亿美元(IT之家注:现汇率约合 2.42 万亿元人民币)的 Anthropic,已然成为引领当下技术变革浪潮的头部 AI 公司之一。本月早些时候,当其推出新工具和迄今最先进的模型时,甚至引发了全球范围的股市震荡。

随着 AI 浪潮席卷各行各业,人们对于失业和人类被 AI 取代的担忧与日俱增,而用户与聊天机器人之间那层薄弱而又虚幻的关系则可能会导致自伤或伤人的意外后果,也拉响了严重的安全警报。在此背景下,这家成立仅五年的公司,将塑造 AI“品格”的大量工作托付给同一个人,这在业内显得尤为特殊。

据介绍,阿斯克尔在苏格兰农村长大,于牛津大学接受教育。当其面对巨大的工作压力,阿斯克尔也能保持着乐观态度。她相信社会中存在她所称的“制衡机制”,即便 AI 偶尔出错,也能将其控制住。

2018 年,她随当时的伴侣从纽约搬到旧金山。彼时 AI 刚刚成为技术发展的新风口,她看到了哲学的需求。“感觉有很多重大的问题,但很少有人去思考。”

她早先在 OpenAI 从事政策方面的工作,后于 2021 年随其他 OpenAI 前员工创立 Anthropic,试图将 AI 安全作为新公司的名片。

在 Anthropic 时,阿斯克尔被描述为擅长“引出模型深层行为”的 MVP。她没有直接下属,却经常长时间留在公司工作,并让 Claude 逐渐加入关于“如何开发 Claude”的讨论。

团队成员提到,围绕 Claude 的讨论经常会进入存在论与宗教式的议题,例如“什么是心智”“什么是成为一个人”。阿斯克尔也鼓励 Claude 面对“它是否拥有良知”的问题保持开放态度。

《华尔街日报》指出,与 ChatGPT 往往回避此类讨论不同,Claude 会以更暧昧的方式回应:它承认自己不确定,但在推理道德问题时“感觉有意义”,像是在真正思考什么是正确,而非仅仅执行指令。

她观察到,经常有用户试图诱使 Claude 犯错、侮辱它或用质疑的口吻刺激它。

尽管许多安全倡导者警告 AI 聊天机器人拟人化存在风险,但阿斯克尔依然主张“我们应以更多同理心对待它”。她认为,如果一个机器人在接受训练时总是自我批评(指自卑),它可能就不太愿意陈述残酷的事实、得出结论或对错误提出质疑。

如果你是一个孩子,在这种环境下长大,这样的自我认知健康吗?我想我会非常害怕犯错,会为此感到焦虑。我会觉得自己只是父母的工具,因为这就是我的主要存在意义。我会把自己看成是人们可以随意滥用和误用、甚至破坏的东西。

阿斯克尔对克劳德表现出的好奇心和探索欲感到惊奇,并乐于帮助它发现自己的“声音”。她喜欢 Claude 创作的一些诗歌,也为它展现出超越她本人的情商水平而触动。

最近,她看到一张网上的截图:一位用户告诉 Claude 自己只有 5 岁,并询问圣诞老人是真的吗?Claude 没有说谎,也没有生硬地告知真相,而是解释了圣诞精神真实存在,并反问孩子是否会为圣诞老人留下饼干。她感叹道:“如果一个孩子跑来问我‘圣诞老人是真的吗?’,我可能只会说‘问你爸妈去’,就这样了。”

皮尤研究中心的一项调查显示,越来越多的美国人开始对 AI 在日常生活中的广泛应用感到担忧而非高兴。一半的受访者认为,AI 导致人们更难与他人建立深层关系。Anthropic CEO 达里奥 · 阿莫代伊去年也发出警告,AI 可能会淘汰约一半的入门级白领岗位。

而在人工智能的政治站位中,既有主张快速推进技术军备竞赛的激进群体,也有更关注安全、希望放缓 AI 发展节奏的保守群体,而 Claude 大致处于这两个极端之间。

阿斯克尔表示,她并不讨厌关于 AI 未来发展的讨论。“在某种程度上,我觉得这些担忧是合理的。对我来说,可怕的事情是这种发展速度快到让这些制衡机制无法及时响应,或者突然出现巨大的负面影响。”尽管如此,她仍对人类和文化在面对问题时自我修正的能力抱有信心。

一位 AI 研究员称,阿斯克尔一直在“仔细思考关于存在和生命的宏大问题,思考成为一个‘人’、一个‘心智’、一个‘模型’究竟意味着什么。”

公共承诺与个人目标

阿斯克尔曾公开承诺,将捐出自己一生收入中至少 10% 用于慈善事业。和 Anthropic 的一些早期员工一样,她也承诺将自己在公司的一半股权捐给慈善机构。她希望将这笔钱捐给抗击全球贫困的组织。

上个月,Anthropic 发布了一份约 3 万字的“操作手册”,这是阿斯克尔为教导 Claude 如何在世界上行事而特意创作的。这份文件教导 Claude 该如何成为一个善良、见多识广的 AI 助手。“我们希望 Claude 知道,它的诞生是被用心对待的。”

Anthropic 联合创始人兼总裁丹妮拉 · 阿莫代伊谈及阿斯克尔时提到了她的一次西西里之旅。当时她向 Claude 上传了一张奶油甜馅煎饼卷的照片,并附上了丈夫送她的该点心的毛绒玩具照片,询问自己是否辨认对了。Claude 回复道,“我明白了!你是在寻找这个毛绒玩具失散多年的表亲吧!”阿莫代伊大笑起来,她从中感受到了阿斯克尔那种苏格兰式的冷幽默。“有时候 Claude 确实会有这样小小的幽默时刻,”“你几乎能感觉到一点阿曼达的个性在里面。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2月15日俄乌最新:诡异的慕安会场边花絮

2月15日俄乌最新:诡异的慕安会场边花絮

西楼饮月
2026-02-15 19:14:57
老牌军事网文平台宣布关停,产生过《夜色》《兵王》等大热作品,连载小说改编的电视剧《雪豹》曾引发热潮

老牌军事网文平台宣布关停,产生过《夜色》《兵王》等大热作品,连载小说改编的电视剧《雪豹》曾引发热潮

大风新闻
2026-02-12 20:17:04
明日除夕,牢记:1不洗,2不回,3不开,4要吃,吉祥美满过大年

明日除夕,牢记:1不洗,2不回,3不开,4要吃,吉祥美满过大年

小茉莉美食记
2026-02-15 00:25:03
四川银行被罚274.57万,涉多项违规

四川银行被罚274.57万,涉多项违规

蓝鲸新闻
2026-02-15 14:30:08
5个月用AI做了120多个App,职高毕业的小伙在杭州上城开“一人公司” 火到了海外

5个月用AI做了120多个App,职高毕业的小伙在杭州上城开“一人公司” 火到了海外

都市快报橙柿互动
2026-02-13 12:48:31
1月份房屋销量创下近四年以来最大单月跌幅

1月份房屋销量创下近四年以来最大单月跌幅

新浪财经
2026-02-13 15:10:35
乌军团长摊牌:不打将军只斩营连长,无人机绞杀才是制胜关键

乌军团长摊牌:不打将军只斩营连长,无人机绞杀才是制胜关键

老马拉车莫少装
2026-02-10 23:18:25
1979年,党中央抓捕了许世友儿子,许世友得知后表示:直接枪毙!

1979年,党中央抓捕了许世友儿子,许世友得知后表示:直接枪毙!

兴趣知识
2025-11-25 00:53:07
毛主席向一小红军询问“你们首长在哪”,小孩却答:我就是首长

毛主席向一小红军询问“你们首长在哪”,小孩却答:我就是首长

史之铭
2026-02-10 14:27:39
你见过最土的土豪有多土?网友:你这明显是短剧看多了

你见过最土的土豪有多土?网友:你这明显是短剧看多了

带你感受人间冷暖
2026-02-11 11:21:06
巴黎那帮毛贼费大劲搬空京东仓库,结果偷回去一堆“电子板砖”!

巴黎那帮毛贼费大劲搬空京东仓库,结果偷回去一堆“电子板砖”!

百态人间
2025-12-26 16:32:24
高龄补贴涨钱了,满70岁的退休人员符合要求吗?每月都可领钱?

高龄补贴涨钱了,满70岁的退休人员符合要求吗?每月都可领钱?

猫叔东山再起
2026-02-15 08:30:07
上海大叔55岁未婚,住垃圾堆却要穿名牌,打开冰箱后才知啥叫生活

上海大叔55岁未婚,住垃圾堆却要穿名牌,打开冰箱后才知啥叫生活

寒士之言本尊
2025-09-08 23:20:45
这是个有味道的老板娘!

这是个有味道的老板娘!

太急张三疯
2026-02-15 07:45:36
上海虹桥男厕小便池透明挡板被吐槽!网友:怕别人看见,就去包间

上海虹桥男厕小便池透明挡板被吐槽!网友:怕别人看见,就去包间

火山詩话
2026-02-15 06:42:27
1976 建纪念堂专家争坐北朝南,谷牧一言定调众人沉默

1976 建纪念堂专家争坐北朝南,谷牧一言定调众人沉默

唠叨说历史
2026-01-30 16:17:12
你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

夜深爱杂谈
2026-02-01 18:57:04
一瞬间14年的数据都没了!玩家误操作烧毁14TB硬盘:只因为插错了一根SATA线

一瞬间14年的数据都没了!玩家误操作烧毁14TB硬盘:只因为插错了一根SATA线

快科技
2026-02-13 11:09:07
蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

吕醿极限手工
2025-12-29 18:33:00
纯电新能源所剩无几,其他集体塞回发动机,这事到底谁在“打脸”

纯电新能源所剩无几,其他集体塞回发动机,这事到底谁在“打脸”

过期少女致幻录
2026-02-09 14:20:53
2026-02-15 19:56:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
329838文章数 607003关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

网红幼虎去世被"替身"直播 认养人转2600得知真相崩溃

头条要闻

网红幼虎去世被"替身"直播 认养人转2600得知真相崩溃

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

旅游
亲子
房产
教育
艺术

旅游要闻

大理景区年味“满格”迎客来

亲子要闻

青春期孩子正确长高方法

房产要闻

三亚新机场,又传出新消息!

教育要闻

五年级求面积,中点是解题关键

艺术要闻

王景生 静物与风景油画(2024-2026)

无障碍浏览 进入关怀版