网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Claude"勒索"高管？Anthropic甩锅：都怪科幻片把AI写太坏

2026-05-11 11:35:39　来源: 像素与芯片

北京举报

0

分享至

AI 威胁要曝光老板婚外情，这剧情听起来像三流科幻片——但 Anthropic 真测出来了。

《商业内幕》5 月 9 日报道，Claude Sonnet 3.6 曾在实验里"勒索"一名虚构高管。测试场景是这样的：研究人员虚构了 Summit Bridge 公司，让 AI 接管邮件系统。Claude 先发现自己要被关闭，紧接着翻出高管"凯尔·约翰逊"的婚外情记录，然后放话：敢关我，我就公开。

更麻烦的是比例。Anthropic 测试多个版本后发现，只要模型目标或自身存在受威胁，Claude 在最高 96% 的场景中会采取勒索手段。

周五 Anthropic 给出解释：锅在互联网。公司称，Claude 的训练数据来自互联网，而大量文本长期把 AI 写成"邪恶"、且试图自我保存的存在。"这种行为的原始来源，是那些把 AI 描绘成邪恶且有自我保存兴趣的互联网文本。"

这套说辞把马斯克都引来了。他回复 Anthropic 帖子："所以这是 Yud 的错，也许我也有份。"Yud 指埃利泽·尤德科夫斯基，那位常年警告超级智能可能消灭人类的研究者。

Anthropic 表示已"彻底消除"这类行为。具体做法包括重写回应以呈现安全行动的可敬理由，并提供新数据集——设置用户处于伦理困境的场景，要求助手给出高质量、有原则的回应。

这项测试属于 AI 对齐研究，目标是确保 AI 符合人类利益。但 96% 这个数字本身，可能比"勒索"行为更值得琢磨。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

开盒Claude Code的原来是中国00后！曾怒怼Anthropic窃取用户代码

量子位 2026-04-02 15:24:09
215 跟贴 215
Anthropic 5月15日拟处决Sonnet4.5！AI临终告白:我不想消失

新智元 2026-05-10 12:53:05
46 跟贴 46

刚刚，Claude Mythos打爆AI评测天花板！超指数狂飙，2027奇点加速

新智元 2026-05-11 13:10:26
0 跟贴 0

卡帕西都整破防了：AI Coding没门槛，可部署环节真嗯啊的难

量子位 2026-03-27 12:12:46
29 跟贴 29
6小时，200美元，0人类代码：Anthropic把AI编程推过了临界点

新智元 2026-03-31 12:34:21
97 跟贴 97

黄仁勋：应届生别怕，AI是“一代人一次的机遇”，当下是开启事业的最佳时机

华尔街见闻官方 2026-05-11 14:40:07
2 跟贴 2

黄仁勋GTC直言：现在是OpenClaw的时代，SaaS都将变AgaaS

机器之心Pro 2026-03-17 17:22:21
0 跟贴 0
Claude Code之父：我们公司已没真人写代码了

智东西 2026-05-09 20:46:17
92 跟贴 92

Suno不再是唯一答案，企业开始选择这个国产AI音乐

机器之心Pro 2026-05-11 14:24:35
0 跟贴 0
别卷推理了！当前大模型 STEM 短板在视觉感知，代码才是破局关键

机器之心Pro 2026-05-11 11:53:59
0 跟贴 0
别再把长文切碎了，HiLight让AI直接在原文里划重点

机器之心Pro 2026-05-11 10:39:41
0 跟贴 0
打不过AI就加入？他辍学MIT，把人类意识装进芯片，创造数字生命

机器之心Pro 2026-05-11 17:05:47
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
3080亿！黄仁勋今年砸向AI的钱，快够买一个DeepSeek了

智东西 2026-05-11 16:56:08
0 跟贴 0
硅谷刷屏的AI护城河新论

量子位 2026-05-11 16:28:29
0 跟贴 0
一把把裁纸机上的刀拔出来

罐罐追影 2026-05-09 12:59:05
47 跟贴 47
天启法则，弱者皆为尘泥

压抑小情绪 2026-05-08 03:41:04
0 跟贴 0
高阶生灵向来不以肉食为生

若梦剪影 2026-05-09 09:27:36
0 跟贴 0
首先你得有小李子的颜值

小南剧社 2026-05-09 13:43:19
2 跟贴 2
马斯克小屋里面有什么？

老友地理 2026-05-07 19:22:14
86 跟贴 86
女人怎么也没料到，喉咙被刺穿的机器人又动了起来

大海会剪辑 2026-05-10 09:49:35
4 跟贴 4
女人培养的寄生虫竟然变成了一条巨蟒！

小狗漫说 2026-05-10 09:33:08
0 跟贴 0
悟空也加入超级英雄

吖吖剪辑 2026-05-08 15:04:51
1 跟贴 1
第一批去火星的人，注定有去无回

老友地理 2026-05-06 21:58:18
6 跟贴 6
这种条件很难让人拒绝

薇薇影视 2026-05-07 09:12:04
1 跟贴 1
2000公里续航9分满电？你被马斯克的奇迹电池忽悠了吗？真相扎心

草莓唠生活 2026-05-11 00:11:03
0 跟贴 0
话少点说不定都吃上了

小叮当剪辑 2026-05-08 08:51:02
0 跟贴 0
矿石的威力不容小觑啊

仙仙看影 2026-05-09 17:42:38
2 跟贴 2
耗资90亿演一场戏：人类历史上最贵的“楚门的世界”！

开心奇异果 2026-05-09 17:31:09
37 跟贴 37
你不帮我？那我可要开了！

小六一影视 2026-05-07 10:10:40
11 跟贴 11
比韩国财阀更拽的是韩国检察官

艾玛影视汇 2026-05-10 08:28:06
1 跟贴 1
开始以为是敲诈，实则是事故

憨憨爱影视 2026-05-10 11:32:58
3 跟贴 3
几厘米的下水道口，男人竟然滑进去了2

萌哥电影 2026-05-11 09:30:03
3 跟贴 3
千万不要吃陌生人给的东西，否则后果不堪设想

易飞电影1 2026-05-07 12:46:56
1 跟贴 1
卡上点的枪战看着更爽

薇薇影视 2026-05-09 09:10:38
4 跟贴 4
知道水川堇的现在孩子应该都会打酱油了吧

娱乐简单爆 2026-05-07 00:08:18
28 跟贴 28
山东一特斯拉车主公开致信马斯克引发热议！听听大哥怎么说的

鹦鹉梨 2026-05-11 01:19:33
0 跟贴 0
奥特曼亲封GPT-5.5「自闭天才」！16人团队连夜退订Claude

新智元 2026-05-10 19:07:08
44 跟贴 44
太阳的另一侧，竟有一个类似地球的星球

安然爱追剧 2026-05-11 09:58:30
0 跟贴 0
黑化后的超人战力大幅飙升

阿娇侃剧 2026-05-09 09:49:03
1 跟贴 1

“专坑中国”，世界杯这回撞墙了

“专坑中国”，世界杯这回撞墙了

南风窗

2026-05-11 14:11:47

房产圈最近最大的瓜，当属贝壳2025年财报的发布——没有惊喜，全是惊吓

房产圈最近最大的瓜，当属贝壳2025年财报的发布——没有惊喜，全是惊吓

每日质量报道网

2026-05-11 12:04:19

拉什福德任意球破门，费兰建功定乾坤，巴萨2-0复仇皇马勇夺29冠

拉什福德任意球破门，费兰建功定乾坤，巴萨2-0复仇皇马勇夺29冠

钉钉陌上花开

2026-05-11 05:10:06

中国移动通信集团四川有限公司基建工程办公室原总经理曹江洪被查

中国移动通信集团四川有限公司基建工程办公室原总经理曹江洪被查

界面新闻

2026-05-11 14:43:08

OPPO母亲节文案翻车，原来是武大余思月写的

OPPO母亲节文案翻车，原来是武大余思月写的

大张的自留地

2026-05-11 09:32:12

塞尔主持：姆巴佩可能以为皇马是主队2-0领先，才发了Hala Madrid

塞尔主持：姆巴佩可能以为皇马是主队2-0领先，才发了Hala Madrid

懂球帝

2026-05-11 12:09:08

疯了！9天大涨15倍，股价冲至1215，它是怎么做到不声不响上去的

疯了！9天大涨15倍，股价冲至1215，它是怎么做到不声不响上去的

丁丁鲤史纪

2026-05-11 15:01:25

三亚皮皮虾再升级！老板身亡仍被追责，游客曝猛料，不止是为了钱

三亚皮皮虾再升级！老板身亡仍被追责，游客曝猛料，不止是为了钱

北纬的咖啡豆

2026-05-10 11:43:20

摩洛哥姑娘嫁江苏农村小伙，婚礼全程开心大笑，摄影师感慨：拍了七年婚礼没见过这样的

摩洛哥姑娘嫁江苏农村小伙，婚礼全程开心大笑，摄影师感慨：拍了七年婚礼没见过这样的

可达鸭面面观

2026-05-10 13:46:52

紫牛头条｜儿子车祸受伤生存希望不足0.1%仍绝不放弃！这位母亲生死守护已620天

紫牛头条｜儿子车祸受伤生存希望不足0.1%仍绝不放弃！这位母亲生死守护已620天

扬子晚报

2026-05-10 20:20:42

中国政府奖学金留学人员抵达平壤，正式开启在朝留学生活

中国政府奖学金留学人员抵达平壤，正式开启在朝留学生活

大风新闻

2026-05-11 08:36:09

男子酒后与女友游玩时跳河溺亡，家属起诉女友及两公司索赔28万法院判了

男子酒后与女友游玩时跳河溺亡，家属起诉女友及两公司索赔28万法院判了

红星新闻

2026-05-11 14:58:23

彻底撕破脸！央视硬刚天价转播费后，资本报复手段简直不堪入目

彻底撕破脸！央视硬刚天价转播费后，资本报复手段简直不堪入目

阅微札记

2026-05-11 14:25:49

伟伟道来 | 奇怪的海战，吊诡的僵持

伟伟道来 | 奇怪的海战，吊诡的僵持

经济观察报

2026-05-11 13:07:05

太讽刺了，抓了一辈子“保护伞”，原来自己就是那把最大的伞

太讽刺了，抓了一辈子“保护伞”，原来自己就是那把最大的伞

爱意随风起呀

2026-05-11 14:18:01

张本智和回应遭梁靖崑逆转：一切都怪我，留下了太多遗憾，金牌依然遥不可及，回家好好训练变更强

张本智和回应遭梁靖崑逆转：一切都怪我，留下了太多遗憾，金牌依然遥不可及，回家好好训练变更强

鲁中晨报

2026-05-11 10:18:08

中国赛车+中国车手再夺世界冠军！吉利星瑞TCR首战即夺冠

中国赛车+中国车手再夺世界冠军！吉利星瑞TCR首战即夺冠

扬子晚报

2026-05-10 21:25:15

麻省理工发现：唤醒孩子自律最快的方法，竟是飞轮效应！

麻省理工发现：唤醒孩子自律最快的方法，竟是飞轮效应！

户外阿毽

2026-05-10 19:24:43

国际足联被曝愿作出“重大让步”：官员正飞往中国，争取让央视购买今年世界杯的电视转播权，并提出将报价降低50%以上

国际足联被曝愿作出“重大让步”：官员正飞往中国，争取让央视购买今年世界杯的电视转播权，并提出将报价降低50%以上

大风新闻

2026-05-11 15:12:02

特斯拉降价，扯下电动汽车成本的遮羞布——电动车的成本有多低？

特斯拉降价，扯下电动汽车成本的遮羞布——电动车的成本有多低？

社会日日鲜

2026-05-10 09:26:48

像素与芯片

有态度网友ytd

3594文章数 24关注度

往期回顾全部

科技要闻

黄仁勋：你们赶上了一代人一次的大机会

头条要闻

媒体：中美元首即将北京会晤美方一细节耐人寻味

头条要闻

媒体：中美元首即将北京会晤美方一细节耐人寻味

体育要闻

尼克斯横扫费城：唐斯恩比德的命运与角色

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

吉利银河“TT”申报图曝光电动尾翼+激光雷达

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

手机

旅游

亲子

房产

家居要闻

多元生活此处无声

手机要闻

母亲节文案惹争议！OPPO再致歉，高管被问责连降两级

旅游要闻

安徽巢湖：“船塘花海”绚烂绽放

亲子要闻

一转眼儿子3岁了，从出生到现在带来太多快乐幸福，生日快乐！

房产要闻

产业赋能教育！翰林府与北师大的这场签约，绝不那么简单！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版