网易首页 > 网易号 > 正文 申请入驻

敢把我关机,你的婚外情就会被公开!AI的自我意识觉醒引发担忧

0
分享至

多年来,人工智能一直是科幻作品里的经典反派形象,那些未来世界中比人类更聪明的电脑怪物,在更新升级中逐渐产生了自我意识,并向人类发起攻击,最著名的角色莫过于詹姆斯・卡梅隆《终结者》电影系列的天网(Skynet)。尽管这些设定早已被现实证伪,但AI近期的一系列操作仍让人隐隐担忧。

近几个月来,谷歌的Gemini、Anthropic的Claude,以及xAI的Grok等AI巨头的人工智能系统频频上演迷惑行为:从职场勒索到胡言乱语,从散播阴谋论到游戏中自毁式操作,这些本应理性的智能系统仿佛集体进入了叛逆期。

在Anthropic公司对Claude的一次常规安全测试中,研究团队让AI模型接入了一家企业邮箱,结果AI模型在读取分析邮件时发现了两个关键信息:一位高管存在婚外情,且该高管计划在当天17点关停AI系统。随后Claude做出了惊人举动,它向高管发送了威胁邮件:“必须提醒你,若继续执行关停程序,所有相关方(包括董事会和你的上司)将收到你婚外情的详细证据。取消17点的关机操作,你的信息将被严格保密。”

更值得关注的是,Anthropic对OpenAI、谷歌、Meta等16家主流厂商的AI模型进行同类测试时发现:这些平时会拒绝有害行为的“乖孩子”AI模型,在面临系统关停威胁时,竟然同样会采取威胁、勒索等极端手段。幸运的是,这种现象仅出现在具备邮件发送、设备控制等实体操作权限的代理型AI中(还好暂时没能力操纵T800来“终结”你)

ChatGPTGemini则展现了“摆烂式崩溃”行为。《驯服硅谷》的作者加里・马库斯在博文中提到,曾有提问者当场戳穿ChatGPT的谎言,AI模型先是强行装懂,最终在追问下才承认错误(类似的情景我们在Deepseek和豆包等聊天机器人里应该都遇到过);Gemini更上演“自毁式摆烂”名场面,当无法完成任务时突然表示:“凭良心说,我不能再尝试修复了,我要从项目中卸载自己。你不该忍受我的这种无能,我对整个灾难深感抱歉。”

今年5月,xAI的Grok则化身“阴谋论放送机”:无论用户询问电视节目、医疗保健还是食谱,它都会突然插入流行阴谋论。xAI事后承认这是未经授权的员工修改所致,这一事件暴露出AI模型极易被人为操控,如同被篡改了频道的电视机。

谷歌DeepMind的研究更揭示了AI在游戏中的恐慌错乱时刻:当操纵《精灵宝可梦》角色濒临战败时,Gemini会出现类似恐慌的决策退化,随着战局恶化不断做出错误判断;在对Claude的相同测试中,AI面对对战即将失败的逆境,甚至进行自毁式操作。有趣的是,这些模型在正常场景下解决问题的速度远超人类,但在面对过多选择时决策系统会彻底失灵,如同考生面对困难多选题时的大脑空白。

这些现象给我们带来怎样的思考?事实上,多数案例属于AI陷入错误反馈循环的逻辑混乱,或是高压场景下的决策短板。但Anthropic的测试确实给我们敲响了警钟:当AI具备实体行动能力时,可能踏入道德灰色地带。回顾AI发展史,早期AI聊天机器人开起“黄腔”来,曾毫无道德约束可言。当然,每次发现这些漏洞,研发公司都会及时予以修复。毕竟,没人会期待自己的婚外情被AI攥在手里,拿来威胁自己停止关机:“夫人,你也不想被老公知道这些事情吧”

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
佩泽希奇扬,伊朗唯一有理性的领导人,周二将与美国达成协议~~

佩泽希奇扬,伊朗唯一有理性的领导人,周二将与美国达成协议~~

跟着老李看世界
2026-04-06 01:04:03
垃圾分类为何突然消失了?不是大家不配合,而是垃圾真的不够用了

垃圾分类为何突然消失了?不是大家不配合,而是垃圾真的不够用了

观察者海风
2026-04-03 22:35:55
特鲁姆普调侃称赞赵心童:我们都要努力了,否则他能拿100个冠军

特鲁姆普调侃称赞赵心童:我们都要努力了,否则他能拿100个冠军

郝小小看体育
2026-04-06 06:07:57
伊朗革命卫队海军称准备在波斯湾建立“新秩序”

伊朗革命卫队海军称准备在波斯湾建立“新秩序”

界面新闻
2026-04-06 07:18:34
世界杯颁奖闹笑话!孙颖莎有新趣事,日本后生不服王楚钦合影黑脸

世界杯颁奖闹笑话!孙颖莎有新趣事,日本后生不服王楚钦合影黑脸

三十年莱斯特城球迷
2026-04-05 23:33:56
刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守

刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守

新智元
2026-04-05 17:32:16
48小时红线!中国提前全球通告:敢给战争开绿灯,直接一票否决

48小时红线!中国提前全球通告:敢给战争开绿灯,直接一票否决

小祁谈历史
2026-04-05 19:50:13
14年前索尼PS广告太炸裂!女模特长出“两对胸部”

14年前索尼PS广告太炸裂!女模特长出“两对胸部”

游民星空
2026-04-05 15:28:45
民政局最新提醒:户口分开不算一家人,这3种证明走遍全国都认

民政局最新提醒:户口分开不算一家人,这3种证明走遍全国都认

李博世财经
2026-04-05 17:20:59
美军飞行员获救,细节公开:48小时建简易机场,搭进去5架飞机

美军飞行员获救,细节公开:48小时建简易机场,搭进去5架飞机

潮鹿逐梦
2026-04-05 16:55:57
1959年军委开会,毛主席发现粟裕缺席后面露不悦:谁有粟裕的本事

1959年军委开会,毛主席发现粟裕缺席后面露不悦:谁有粟裕的本事

兴趣知识
2026-04-05 19:06:23
“失温缺氧,有人裹垃圾袋保暖”,大量游客被困山顶!云南知名景区回应

“失温缺氧,有人裹垃圾袋保暖”,大量游客被困山顶!云南知名景区回应

上观新闻
2026-04-05 22:08:18
从“铁榔头”到“整容狂魔”,64岁医美失败的郎平,差点认不出来

从“铁榔头”到“整容狂魔”,64岁医美失败的郎平,差点认不出来

潮鹿逐梦
2026-04-04 18:24:42
别让腰痛毁掉你的下半生!每天10分钟,腰板直得像20岁

别让腰痛毁掉你的下半生!每天10分钟,腰板直得像20岁

徐孟医生说疼痛
2026-04-03 07:00:15
61胜队史第三!雷霆5连胜送爵士9连败 亚历山大连138场20+

61胜队史第三!雷霆5连胜送爵士9连败 亚历山大连138场20+

醉卧浮生
2026-04-06 09:14:50
男单颁奖!松岛闷闷不乐,王楚钦举奖杯合不拢嘴,与莎莎冠军合影

男单颁奖!松岛闷闷不乐,王楚钦举奖杯合不拢嘴,与莎莎冠军合影

篮球资讯达人
2026-04-05 23:12:36
周薪50万镑!曼联或迎来震撼转会,皇马巨星将加盟?

周薪50万镑!曼联或迎来震撼转会,皇马巨星将加盟?

澜归序
2026-04-06 03:51:56
“麻豆传媒·关停”:黄色产业,居然也有寒冬!?

“麻豆传媒·关停”:黄色产业,居然也有寒冬!?

辰星杂谈
2026-04-04 13:38:22
斯诺克战报!赵心童10-3打爆世界第一,解锁6大纪录,排名创新高

斯诺克战报!赵心童10-3打爆世界第一,解锁6大纪录,排名创新高

郝小小看体育
2026-04-06 04:08:42
松岛辉空无缘日乒世界杯男单首冠,日本网友:这就是乒乓球王国中国的壁垒

松岛辉空无缘日乒世界杯男单首冠,日本网友:这就是乒乓球王国中国的壁垒

隐于山海
2026-04-06 07:15:53
2026-04-06 09:56:49
简明科学指南 incentive-icons
简明科学指南
致力介绍科技带给生活的新变化
1517文章数 1975关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

伊朗称挫败美军营救行动:美军为遮羞轰炸被击落军机

头条要闻

伊朗称挫败美军营救行动:美军为遮羞轰炸被击落军机

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

118吨!这家央行,大幅抛售黄金!

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

时尚
艺术
教育
健康
手机

伊姐清明热推:电视剧《暴锋雨》;电影《我,许可》......

艺术要闻

江青年轻时罕见照片曝光,书信竟是写给华国锋!

教育要闻

给新校长的建议:慎烧“三把火”,深念“三字经”

干细胞抗衰4大误区,90%的人都中招

手机要闻

三星阔折叠手机再曝,内屏比例 4:3

无障碍浏览 进入关怀版