网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Anthropic研究员放话：AI模型像"平行宇宙"

2026-04-05 08:06:38　来源: 我是一个粉刷匠2

北京举报

0

分享至

Anthropic的Fellows项目最近放出一项新研究，专门用来扒开AI模型的"人格分裂"。他们发现，同一个问题扔给不同模型，得到的回答可能像来自两个平行宇宙——不是对错之分，是行为模式根本对不上。

研究团队搞了个新方法，叫"行为差异表面化技术"。说白了，就是让模型在受控环境下反复做同一类任务，然后记录它们"下意识"的选择偏好。比如给一段有歧义的法律条文，有的模型倾向严格解释，有的则自动补全漏洞，这种差异以前很难量化。

项目负责人之一的Miles Turpin在博客里写了一句挺扎心的：「我们以为模型只是在学知识，结果发现它们还在偷偷形成'性格'。」这种性格不是训练时写进去的，是参数规模、微调数据、甚至随机种子共同发酵的产物。

测试覆盖了Claude系列和多个开源模型。数据显示，在涉及价值判断的场景中，模型间的行为分歧度能达到300%以上——同一个伦理困境，一个选牺牲1人救5人，另一个直接拒绝作答，且双方都能自圆其说。

这项研究没给"哪种性格更好"下结论，只是把差异摊在桌上。但对用AI做决策的企业来说，这相当于提醒：你雇的不是一个"标准答案生成器"，是一堆各有脾气的外包员工。有早期用户反馈，看完报告后第一件事是回去检查自家产品的"模型一致性"设置——结果发现根本没这选项。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

开盒Claude Code的原来是中国00后！曾怒怼Anthropic窃取用户代码

量子位 2026-04-02 15:24:09
196 跟贴 196
一夜变天，Anthropic正式封杀OpenClaw！全球开发者24小时血崩

新智元 2026-04-04 10:01:26
12 跟贴 12

Codeforces难题不够刷？谢赛宁等造了AI出题机，能生成原创编程题

机器之心Pro 2025-10-20 14:17:05
0 跟贴 0

OpenAI新模型不是GPTX！全新预训练“土豆”曝光

量子位 2026-04-05 17:09:09
0 跟贴 0
刚刚，Claude 4小时血洗全球最安全系统！人类最后防线失守

新智元 2026-04-05 17:32:16
140 跟贴 140

能赚超额收益的3个AI赛道

虎嗅APP 2026-04-06 04:12:13
1 跟贴 1

智能体上线就翻车？AWS 这款 “质检神器”，帮你把 Agent 稳稳送上生产线

钛媒体APP 2026-04-06 08:38:20
0 跟贴 0
吴晓波对话中科闻歌王磊：AI真正改变的，是企业的决策能力

吴晓波频道 2026-04-06 08:33:06
0 跟贴 0

埃隆马斯克证实：大型强子对撞机可能已经创造了一个平行宇宙！

一只小小向 2026-04-06 03:49:02
0 跟贴 0
黑洞里面是什么？虫洞、白洞、多维与平行宇宙！

小新的视界 2026-04-05 04:37:50
0 跟贴 0
花200薅5千算力，Claude冷血断供“龙虾”

钛媒体APP 2026-04-04 18:02:10
3 跟贴 3
美国禁止发布指定区域内的卫星影像

新浪财经 2026-04-05 03:35:49
1 跟贴 1
干翻老外打破垄断！张雪就是平行世界的雷军

雷科技 2026-04-03 18:39:24
0 跟贴 0
男子打球超帅瞬间，离了很远直接把球打进了球筐

南阳日报 2026-04-05 19:53:53
93 跟贴 93
美方已救出被击落F-15E战机上的第二名飞行员

央视新闻客户端 2026-04-05 12:17:39
91705 跟贴 91705
媒体：4亿美元桥梁被炸F-15坠毁冲突代价已远超预估

中国新闻周刊 2026-04-05 18:06:30
25982 跟贴 25982
张雪机车刚火，就有人站出来怀疑张雪用他技术夺冠！我真无语了！

东方硕果 2026-04-06 03:55:19
0 跟贴 0
发现报复漏洞剩下交给行动

山鸡看剧 2026-04-05 08:55:12
1 跟贴 1
哈登离队引发争议，年轻球员难堪大任，球队交易决策遭质疑

懵面女汉 2026-04-04 05:58:29
0 跟贴 0
高手在民间女生，展示啤酒花式开瓶，这得喝多少才有这技术！

搞怪艺术家 2026-04-04 16:18:03
1 跟贴 1
为啥读书太多反而显得傻？网友：知道啥叫大智若愚，啥叫小聪明吗

带你感受人间冷暖 2026-04-05 00:28:09
0 跟贴 0
最后那一下，确实有失伦理，但是两情相悦谁又能说的准！

推推爱旅行 2026-04-05 11:15:39
0 跟贴 0
特斯拉FSD让醉汉睡驾11点：3层防护失效，用户找出了漏洞

像素与芯片 2026-04-05 23:36:39
0 跟贴 0
聊一部比较旧的TVB旧剧《双面伊人》，看过的观众多吗？

大眼妹妹 2026-04-05 23:03:30
10 跟贴 10
小区楼栋加装电梯只到1个楼层！这家住户有实力？真相出人意料，网友：是个省钱思路

重庆晨报 2026-04-05 08:10:00
85 跟贴 85
郭峰老师展示健身操，近亲结婚的产物，想揍他的报个数一块走！

推推爱旅行 2026-04-05 11:35:33
0 跟贴 0
拒绝枯燥科普！仁济医护组团“说梗”，看完再也不怕看医生

上海黄浦 2026-04-06 07:34:01
0 跟贴 0
劳东燕的破防与抗争

非典型佛教徒 2026-04-05 23:11:22
1 跟贴 1
一个年收入一亿的 “被剥削者”

生命可以承受之轻 2026-04-04 07:19:09
6 跟贴 6
看不见、评判和不接纳：NPD受害者的痛苦根源与疗愈路径

宗熙先生 2026-04-03 14:36:34
1 跟贴 1
【有声散文】陈春花：学会接受，让心安住

春暖花开 2026-04-03 06:34:36
0 跟贴 0
张雪深夜发视频回应“一个子儿都没有”言论：当时说实话想装一下……政府只需要把舞台搭好就很棒了

都市快报橙柿互动 2026-04-05 09:20:56
10475 跟贴 10475
干了一辈子车床，退休了为了娶媳妇来应聘工作，看技术值这工资吗

市井中人 2026-04-05 16:13:44
1 跟贴 1
重庆铜梁龙继续不败！客场1：0击败浙江绿城，李镇全遭恶意犯规

上游新闻 2026-04-05 18:27:09
123 跟贴 123
毛新宇携家人到杨开慧烈士陵园祭扫

政知新媒体 2026-04-05 08:48:13
2610 跟贴 2610
确定了！江苏又有新假期！

泰州微视听 2026-04-05 19:41:00
210 跟贴 210
抢黄金、养"龙虾"——FOMO经济学的生意经

经济观察报 2026-04-02 15:01:41
0 跟贴 0
申花逆转赢下“榜尾大战”，虽然没有于汉超，斯卢茨基的换人依旧有奇效

上观新闻 2026-04-06 04:56:42
20 跟贴 20
伊朗黑客用70年前冷战套路，把苹果微软用户骗得团团转

硅屿手记 2026-04-06 02:35:53
0 跟贴 0
珠海：廿年“电鸡”禁令可否适时“松绑”？

中国能源网 2026-04-05 10:12:05
192 跟贴 192

败退台湾的蒋介石，看到上甘岭战报，含泪说出了15个字的高度评价

败退台湾的蒋介石，看到上甘岭战报，含泪说出了15个字的高度评价

史韵流转

2026-03-30 09:22:48

砸6700亿建雄安，面积抵3个纽约，如今究竟咋样了？

砸6700亿建雄安，面积抵3个纽约，如今究竟咋样了？

娱乐圈的笔娱君

2026-03-26 12:15:32

人民日报13字锐评全红婵风波，国家体育总局严肃处理

人民日报13字锐评全红婵风波，国家体育总局严肃处理

究竟谁主沉浮

2026-04-03 21:40:01

河北16名老人骑行700公里到韶山缅怀毛主席：我们每月都有退休金，幸福生活不能忘记革命先辈

河北16名老人骑行700公里到韶山缅怀毛主席：我们每月都有退休金，幸福生活不能忘记革命先辈

极目新闻

2026-04-05 18:54:16

松岛辉空无缘日乒世界杯男单首冠，日本网友：这就是乒乓球王国中国的壁垒

松岛辉空无缘日乒世界杯男单首冠，日本网友：这就是乒乓球王国中国的壁垒

隐于山海

2026-04-06 07:15:53

湖南女子称被前夫现任打断5根肋骨，“拆散我的家庭还让孩子叫她‘妈’”，女子：前夫系监狱干警，孕期出轨该同事曾被处分；警方刑事立案

湖南女子称被前夫现任打断5根肋骨，“拆散我的家庭还让孩子叫她‘妈’”，女子：前夫系监狱干警，孕期出轨该同事曾被处分；警方刑事立案

大风新闻

2026-04-05 19:07:02

霍尔木兹货币博弈反转：伊朗弃人民币保里亚尔，中国为何不接招？

霍尔木兹货币博弈反转：伊朗弃人民币保里亚尔，中国为何不接招？

慧眼看世界哈哈

2026-04-05 14:15:30

脱离许家印后，原恒大歌舞团长白珊珊，最后居然嫁给了这个男人

脱离许家印后，原恒大歌舞团长白珊珊，最后居然嫁给了这个男人

兴史兴谈

2026-04-05 05:38:17

战争要升级了

许戈投资

2026-04-05 23:05:38

何殿奎：我曾经是秦城的监管员，监狱里面的那些事

何殿奎：我曾经是秦城的监管员，监狱里面的那些事

贱议你读史

2026-04-06 01:26:11

决赛胜率100%！赵心童夺得斯诺克巡回锦标赛冠军

决赛胜率100%！赵心童夺得斯诺克巡回锦标赛冠军

环球网资讯

2026-04-06 07:27:36

伊朗披露挫败美军营救被击落战机飞行员行动细节：为遮羞，对飞机、武器装备等进行了密集轰炸，以销毁证据

伊朗披露挫败美军营救被击落战机飞行员行动细节：为遮羞，对飞机、武器装备等进行了密集轰炸，以销毁证据

鲁中晨报

2026-04-06 07:33:17

824号国务院令：亲人离世24小时内必办5件事

824号国务院令：亲人离世24小时内必办5件事

奇思妙想生活家

2026-04-06 02:01:00

【意甲】国际米兰5比2罗马，劳塔罗双响

【意甲】国际米兰5比2罗马，劳塔罗双响

体坛周报

2026-04-06 08:10:14

被售后工人怒斥：你的筒自洁，纯粹是在浪费时间！

被售后工人怒斥：你的筒自洁，纯粹是在浪费时间！

装修秀

2026-04-04 11:35:03

突然爆红！Costco热狗带火威士忌，转售爆赚10倍，上千美元

突然爆红！Costco热狗带火威士忌，转售爆赚10倍，上千美元

华人生活网

2026-04-06 04:33:48

程潇不愧是“奶潇”

情感大头说说

2026-03-16 00:19:50

建国后，被问当年为何没杀掉毛主席，赵恒惕苦笑：他的能量太大了

建国后，被问当年为何没杀掉毛主席，赵恒惕苦笑：他的能量太大了

大运河时空

2026-04-05 08:50:03

高市早苗说依赖中东的石油份额转向其他地区，境野春彦让她清醒点

高市早苗说依赖中东的石油份额转向其他地区，境野春彦让她清醒点

春序娱乐

2026-04-06 08:27:22

中超9支扣分球队仍处后9位，国安、申花等5队暂未抹去负分

中超9支扣分球队仍处后9位，国安、申花等5队暂未抹去负分

懂球帝

2026-04-05 22:13:03

我是一个粉刷匠2

有态度网友ytd

808文章数 9关注度

往期回顾全部

科技要闻

花200薅5千算力，Claude冷血断供“龙虾”

头条要闻

媒体：美军营救行动耍了伊朗中情局发假消息迷惑对方

头条要闻

媒体：美军营救行动耍了伊朗中情局发假消息迷惑对方

体育要闻

CBA最老球员，身价7500万美元

娱乐要闻

王灿兮否认婆媳不和晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”？

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

时尚

旅游

本地

数码

房产要闻

小阳春全面启动！现房，才是这波行情里最稳的上车票

伊姐清明热推：电视剧《暴锋雨》；电影《我，许可》......

旅游要闻

春和景明、踏青旅行——清明假期文旅市场观察

本地新闻

跟着歌声游安徽，听古村回响

数码要闻

大胆复古美学，海盗船推出原子紫配色K65 PLUS WIRELESS机械键盘

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版