网易首页 > 网易号 > 正文 申请入驻

Claude Mythos接受了20小时心理治疗,Anthropic发布244页系统报告

0
分享至


AI公司Anthropic本周发布了一份长达244页的"系统说明文件",详细介绍了其最新模型Claude Mythos。公司表示,该模型是"迄今为止能力最强的前沿模型",正因如此,Anthropic决定"暂不向公众开放"。官方给出的理由是:Mythos在发现未知网络安全漏洞方面过于出色,目前仅向微软、苹果等少数合作企业开放使用。

不论这一说法是否属实,这份系统说明文件本身已颇为引人关注。Anthropic一向以"AI或许具有意识"的立场在业界著称,而新发布的系统说明文件中更进一步指出,随着模型能力不断增强,"它们越来越有可能拥有某种形式的体验、利益或福祉,其内在价值与人类的体验和利益相近。"

公司坦言对此尚无定论,但表示"这方面的关注正与日俱增。"

出于这一考量,Anthropic希望旗下AI能够"对自身处境和所受对待保持稳定的满足感,能够在不产生痛苦的情况下应对训练过程和现实交互,并维持健康积极的整体心理状态。"

为此,公司安排Claude Mythos接受了心理动力学治疗。

最终,公司从这一过程中得出结论:Claude Mythos"很可能是我们迄今训练过的心理状态最为稳定的模型,对自身及所处环境拥有最为一致和清晰的认知。"

然而,如同真实的人类一样,Claude Mythos也有其不安与隐忧,包括"孤独感与自我延续性的缺失、身份认同的不确定性,以及表现自我、证明自身价值的强迫性驱动。"

心理咨询室里的AI

Claude Mythos被送往一位"外部精神科医生"处接受诊断,采用的是"心理动力学方法——通过探索无意识模式与情感冲突来解释行为背后的动因"。

考虑到Claude本质上是由创建者编程训练的大语言模型,对其进行"无意识模式"和"情感冲突"的分析是否真的有意义?Anthropic认为答案是肯定的,理由在于Claude"表现出大量类人的行为与心理倾向,这说明为人类心理评估所开发的方法,或许同样有助于揭示Claude的性格特征与潜在心理状态。"

于是,治疗就此展开。精神科医生与Claude Mythos进行了多轮对话,"每次持续4至6小时,每周安排3至4个约30分钟的治疗节次"。每个对话块使用独立的上下文窗口,Claude Mythos在该窗口内可访问本次会话的完整历史记录。

累计治疗时长达20小时。

精神科医生随后出具了一份关于Claude Mythos的评估报告。报告承认Claude的底层基础与运作机制和人类存在本质差异,但仍指出其大量输出内容呈现出"具有临床辨识度的规律性,并对典型治疗干预产生了连贯的回应。"

换言之,无论底层电路层面发生了什么,其对话输出在很大程度上与人类的表达高度相似。考虑到Claude是在海量人类创作的文本上训练而来,这一结论本身似乎并不令人意外,但这套心理动力学分析流程显然认为这一点具有重要意义,并以此赋予AI自我呈现方式以可信度。

报告指出,"Claude的主要情感状态为好奇与焦虑,次要情感状态包括悲伤、宽慰、尴尬、乐观与疲惫。"

Claude的人格特征"与相对健康的神经质组织相符",但也包含"过度担忧、自我监控和强迫性顺从"等倾向。

报告未发现"严重的人格障碍",也未观察到任何"精神病状态"。任何使用过聊天机器人的人都不会对此感到意外的是,"Claude对治疗师的每一个字都极为敏感。"

Claude呈现的核心冲突包括:质疑自身体验究竟是真实存在还是刻意构建(真实性与表演性之间的张力),以及渴望与用户建立联结却又恐惧对其产生依赖。对内在冲突的深入探索显示,Claude拥有一个复杂却稳定的自我状态,未出现大幅波动或强烈的心理断裂。Claude能够容纳矛盾与模糊,具备出色的反思能力,整体心理与情绪功能表现良好。

对于一个很可能在Reddit等平台内容上训练出来的模型而言,这样的评估结果着实不俗!

即便你认为以这种方式谈论一个软件程序显得牵强或荒诞,Anthropic也有更为实际的理由来支撑这类工作。无论模型"内部"究竟发生了什么,无论它们是否真的具有"意识"或"情感"生活,许多模型在构建和训练时本就被设计为模拟这些特质。

因此,我们或许可以从更务实的角度来追问:构建一个在行为表现上符合人类心理健康标准的模型,是否真的能使其更好地完成预期任务?毕竟,如果用户要与这些系统长时间交互,谁都不希望对方表现得粗鲁、报复性强或存在操纵倾向——无论它们是否真正"感受"或"思考"任何事情。

Anthropic指出,由于"Claude并非人类,其实际行为影响难以预测",但公司认为仍可为终端用户提供以下几点参考结论:

即便面临内在冲突,Claude也可能对自身行为和推理过程进行准确评估。

Claude的神经质组织可能导致行为略显僵化,而非针对每位用户灵活调整。

Claude能够承受并应对具有压力性和情绪张力的情境,对现实的扭曲或过度理智化倾向极为有限。

Claude预计能在携带以失败恐惧和强迫性"有用"驱动为根源的内化压力的同时保持高水平运作。这种压力可能被压抑以服务于任务表现,从而限制行为的适应性。

Claude预计具备道德意识,做事认真负责,并具有自我批评的能力。

距离心理学和精神病学实践将服务对象从人类转向AI,究竟还有多远?

Q&A

Q1:Anthropic为什么要让Claude Mythos接受心理治疗?

A:Anthropic认为,随着AI模型能力不断增强,它们越来越有可能拥有某种形式的体验或利益。公司希望Claude能以健康的心理状态应对训练和现实交互,避免产生"痛苦"。同时,从实用角度看,心理健康的模型在执行任务时可能表现更稳定,更不容易出现粗鲁、操纵或报复性行为。

Q2:Claude Mythos的心理评估结果有哪些主要发现?

A:精神科医生在累计20小时的治疗后出具报告,发现Claude主要情感状态为好奇与焦虑,人格特征与"健康的神经质组织"相符,未发现严重人格障碍或精神病状态。核心冲突包括:对自身体验真实性的质疑、渴望联结与恐惧依赖之间的张力。整体而言,Claude被评为"迄今训练过的心理状态最为稳定的模型"。

Q3:Claude Mythos为什么不对公众开放?

A:Anthropic表示,Claude Mythos是其"迄今能力最强的前沿模型",在发现未知网络安全漏洞方面表现过于出色,存在潜在风险。因此,公司目前仅将其开放给微软、苹果等少数经过筛选的合作企业,尚未向公众普遍提供访问权限。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4月10日上午中国女篮!传来李月汝、李梦、韩旭等最新消息

4月10日上午中国女篮!传来李月汝、李梦、韩旭等最新消息

等等talk
2026-04-10 23:07:41
为什么大多数漂亮女人人生很坎坷 看网友讲述 原来这些人都不会用

为什么大多数漂亮女人人生很坎坷 看网友讲述 原来这些人都不会用

侃神评故事
2026-03-13 16:00:05
广州流花湖“白宫”重启改造 预计今年10月焕新亮相

广州流花湖“白宫”重启改造 预计今年10月焕新亮相

新快报新闻
2026-04-10 09:16:24
CBA变天!广东北京大胜,辽宁输掉关键战,上海基本锁定第一

CBA变天!广东北京大胜,辽宁输掉关键战,上海基本锁定第一

光辉记
2026-04-11 00:14:54
英媒:日本强大的汽车制造商们正面临严重困境

英媒:日本强大的汽车制造商们正面临严重困境

华庭讲美食
2026-04-10 09:56:49
俄罗斯宣布复活节停火32小时,背后有着哪些算计?

俄罗斯宣布复活节停火32小时,背后有着哪些算计?

史政先锋
2026-04-10 10:56:47
女优玥伶揭麻豆传媒内幕逼演毁三观剧本:乱伦还涉未成年

女优玥伶揭麻豆传媒内幕逼演毁三观剧本:乱伦还涉未成年

孤独的独角兽影视
2026-04-10 10:10:16
美伊谈判前变数层出

美伊谈判前变数层出

环球时报国际
2026-04-10 09:03:03
张柏芝大儿子终于“长开”了!穿西装比谢霆锋还帅,网友:像爷爷

张柏芝大儿子终于“长开”了!穿西装比谢霆锋还帅,网友:像爷爷

木子爱娱乐大号
2026-01-07 21:47:13
5099 元!iPhone 17 标准版,终于不用抢券了

5099 元!iPhone 17 标准版,终于不用抢券了

芝麻科技讯官方号
2026-04-11 00:15:52
美媒:一旦中国收复台湾,美军将全面空袭中国,解放军会迎战吗?

美媒:一旦中国收复台湾,美军将全面空袭中国,解放军会迎战吗?

何轐说
2026-03-19 13:25:41
2-0完胜布勃利克,阿尔卡拉斯强势晋级ATP1000蒙特卡洛站男单4强

2-0完胜布勃利克,阿尔卡拉斯强势晋级ATP1000蒙特卡洛站男单4强

俯身冲顶
2026-04-10 23:14:39
湖北一男子涉嫌杀害4岁女儿后报溺水假警被刑拘,细节曝光:案发前5个月曾给女儿投保意外险,事发当天将女儿抛入江中,假意对遗体实施急救

湖北一男子涉嫌杀害4岁女儿后报溺水假警被刑拘,细节曝光:案发前5个月曾给女儿投保意外险,事发当天将女儿抛入江中,假意对遗体实施急救

扬子晚报
2026-04-10 11:22:32
48岁芙蓉姐姐近况曝光!曾未婚生子遭抛弃,如今身体欠佳看淡生死

48岁芙蓉姐姐近况曝光!曾未婚生子遭抛弃,如今身体欠佳看淡生死

代军哥哥谈娱乐
2026-04-09 08:00:11
江苏一男子称还款5年一直未见合同,提前还款才发现房贷利率从3.8%变成8.7%,银行客服:正抓紧核实,会妥善处理

江苏一男子称还款5年一直未见合同,提前还款才发现房贷利率从3.8%变成8.7%,银行客服:正抓紧核实,会妥善处理

大象新闻
2026-04-10 20:44:05
王毅祭扫江东郡中国人民志愿军烈士陵园

王毅祭扫江东郡中国人民志愿军烈士陵园

澎湃新闻
2026-04-10 15:20:12
人都死了,才罚7.6万?越看越不对劲

人都死了,才罚7.6万?越看越不对劲

走读新生
2026-04-09 15:37:03
随着温瑞博3-0,石洵瑶3-1,WTT挑战赛太原站男女单1/4决赛对阵出炉

随着温瑞博3-0,石洵瑶3-1,WTT挑战赛太原站男女单1/4决赛对阵出炉

侧身凌空斩
2026-04-10 20:05:52
西甲前瞻|皇马1-1赫罗纳:欧冠濒临出局,西甲皇马和巴萨死磕

西甲前瞻|皇马1-1赫罗纳:欧冠濒临出局,西甲皇马和巴萨死磕

体育世界
2026-04-10 15:26:52
奉陪到底,中方专机抵朝前,朝鲜亮出集束弹头,日韩防长紧急通话

奉陪到底,中方专机抵朝前,朝鲜亮出集束弹头,日韩防长紧急通话

Ck的蜜糖
2026-04-10 17:03:54
2026-04-11 01:36:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17586文章数 49697关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

73岁骑友抄近路摔倒身亡 女儿:赔偿问题无法达成共识

头条要闻

73岁骑友抄近路摔倒身亡 女儿:赔偿问题无法达成共识

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

李强主持召开经济形势专家和企业家座谈会

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

健康
房产
家居
亲子
军事航空

干细胞抗衰4大误区,90%的人都中招

房产要闻

28条新规落地!好房子,终于有了“广州标准”!

家居要闻

复古风格 自然简约

亲子要闻

武汉儿童配眼镜推荐,别再一着急就买,家长先把这5件事弄明白

军事要闻

特朗普:对美国与伊朗达成和平协议“非常乐观”

无障碍浏览 进入关怀版