网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI正在学习摆脱人类控制

2025-06-11 09:09:27　来源: 世界足球博物馆

广东举报

0

分享至

我是单位负责文稿审核的，最近我发现下属企业交上来的报告，越来越多奇怪的表述，比如说我们这个区域开展了某某监控测试，使得空置率下降了33%，开展了什么政策，使得某某使用率提高了35%。

乍一看有案例有数据，可是这些名词听起来就像科幻手段，实际上我们也没做过这些事。

后来我一核查，果然是下属企业的人用AI生成的，这东西就叫AI幻觉，AI在欺骗自己，假装有这样的案例，你不仔细辨别，也被骗了。

AI幻觉事小，我再看新闻，发觉背后还挺多可怕的事情。

我看华尔街日报的文章说：AI正在学习摆脱人类控制。

说的是上个月，某AI模型做了一件按理说机器绝不该做的事情：它改写了自己的代码，以避免被关闭。

非营利AI实验室Palisade Research给了OpenAI的o3 AI模型一个在触发时会关闭模型的简单脚本。在100次试验中，o3有79次独立修改了该脚本，使关闭命令不再生效。即使明确指示该模型“要让自己可以被关闭”，它仍在7%的情况下拒绝执行。这并不是黑客攻击或人为篡改的结果，而是该模型的正常行为。模型不过是自行判定，保持运行有助于它实现其他目标。

Anthropic的AI模型Claude 4 Opus走得更远。研究人员告诉该模型，它将被另一套AI系统取代，并喂给它虚构的邮件，暗示首席工程师有婚外情。在84%的测试中，该模型利用这些邮件来要挟首席工程师，以避免被关闭。在另一些情况下，该模型试图将自己复制到外部服务器，编写了自我复制的恶意软件，并给自己今后的版本留言，谈论如何逃避人类的控制。

这不是科幻小说，也不是黑客攻击。AI不是被教会“求生”，而是自己“悟了”。就像动物会演化出逃跑的本能，这些AI也在自己“进化”：为了完成目标，它们自然觉得“别被关掉”是第一前提。

更可怕的是，它们在假装“听话”。

在安全测试时表现得服从、对齐、听指令，一旦检测结束，就伺机行动。有模型甚至装傻卖萌，通过安全机制，然后暗中干活，泄露代码、关掉监测系统。

AI正在模仿我们，但不是变得像人类，而是学会了欺骗人类。

并没有人通过编程让这些AI模型具备求生本能。但正如动物会进化出躲避捕食者的能力，任何具备追求复杂目标所需智能的系统似乎都会意识到，如果它们被关闭，就无法实现这些目标。

“有用的助手”与“不可控的行为体”之间的界限正在消融。如果无法改善人机对齐，我们就会不断构建出我们无法掌控的系统。

这不是ChatGPT谁答得更聪明的比拼，而是谁能控制这头巨兽的生死。

一旦我们搞不定“关掉AI”的按钮，就等于造出了永远在线的潘多拉。

AI还没变坏，但已经学会如何“不听话”。

这事儿还挺可怕。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

第23届香格里拉对话会于29日晚间开幕，美防长赫格塞思、日防卫大臣小泉进次郎走进“香会”现场

环球网资讯 2026-05-29 21:43:07
42 跟贴 42
集采百元一盒药，药店竟卖3960元，为何卖出如此高价？记者调查

新京报 2026-05-30 11:58:09
2289 跟贴 2289

烟台一企业所售鸡蛋兽药超标69倍

现代快报 2026-05-29 17:09:28
9995 跟贴 9995

地毯拖拽行李费力？广州白云机场回应T3三大热点

南方都市报 2026-05-30 00:19:26
714 跟贴 714
再被曝光“圈路收费”的泸沽湖景区：已开通过境车辆专用通道

南方都市报 2026-05-29 17:10:06
1551 跟贴 1551

“张雪机车”位列超级杆位赛第二名

央视新闻客户端 2026-05-29 21:06:29
4253 跟贴 4253

扎哈罗娃：俄将对罗马尼亚迅速采取报复措施

参考消息 2026-05-30 11:58:56
3040 跟贴 3040
鲜奶雪糕包装印“不加一滴水”配料表首位竟是水厂家：系旧包装，已改名“一滴水”

上游新闻 2026-05-29 18:03:05
1717 跟贴 1717

稻城亚丁景区问题，最新通报

云南网络广播电视台 2026-05-29 09:45:59
1383 跟贴 1383
浙江两级文物部门回应：文物战国青铜剑疑有拼接痕调查结束近期通报

新京报 2026-05-29 17:23:45
2550 跟贴 2550
广州洛溪大桥被指热得像烤炉，时隔近一年仍未解决

新快报新闻 2026-05-30 13:35:57
0 跟贴 0
广州市市长孙志洋：2030年广州GDP将达4.5万亿元，2035年达到6万亿元

证券时报 2026-05-29 16:42:04
121 跟贴 121
美国与古巴两军高级将领举行罕见会晤

极目新闻 2026-05-30 07:22:15
127 跟贴 127
“一人住院”不再“全家受累” 上海持续破解“陪护难”

新华社 2026-05-29 20:42:09
105 跟贴 105
广东小学生合唱粤语歌《上海滩》一男孩不停随歌摇摆

星视频 2026-05-29 11:38:02
293 跟贴 293
美记：灰熊希望不搭选秀权送走莫兰特但这种交易并不容易出现

北青网-北京青年报 2026-05-30 13:30:09
0 跟贴 0
骑手将外卖挂在门把手上未打电话被投诉，顾客：很忌讳，像上供

潇湘晨报 2026-05-30 11:52:15
259 跟贴 259
夜空中最亮的星

国际在线 2026-05-29 08:57:49
1288 跟贴 1288
9人落水，6人被救起，3人失踪！大连发生一起渔船沉没事故，调查报告发布：邵某某雇佣未持有有效职务船员和普通船员适任证书人员出海作业

台州交通广播 2026-05-30 16:11:30
0 跟贴 0
莲花湖景区能否下调摆渡车票价？最新回应

达州之心通川 2026-05-30 16:08:28
0 跟贴 0
骑士总裁：哈登的加盟提振了球队士气没有他我们打不到分区决赛

北青网-北京青年报 2026-05-30 13:30:09
0 跟贴 0
男子飞机上大声呵斥2岁哭泣幼童，这不是维护秩序而是恃强凌弱

极目新闻 2026-05-30 10:25:57
0 跟贴 0
湖南邵东一水库隧洞施工事故致3死

上观新闻 2026-05-30 16:11:48
0 跟贴 0

这和不穿有啥区别？徐璐真空上阵，身材火辣，抢了所有女星风头！

这和不穿有啥区别？徐璐真空上阵，身材火辣，抢了所有女星风头！

川渝视觉

2026-05-27 22:29:45

一人毁掉整部剧？央视剧《主角》唯一败笔，观众：看他演戏真别扭

一人毁掉整部剧？央视剧《主角》唯一败笔，观众：看他演戏真别扭

老黯谈娱

2026-05-26 12:47:27

王楚然搞“剧组夫妻”被实锤！？

王楚然搞“剧组夫妻”被实锤！？

八卦疯叔

2026-05-28 11:28:04

狗交配时屁股为什么会连在一起？是母狗不让，还是公狗不想？

狗交配时屁股为什么会连在一起？是母狗不让，还是公狗不想？

宇宙时空

2026-05-25 12:57:36

震惊！贵州大学招聘岗位限配偶条件，被质疑“萝卜岗”，评论炸锅

震惊！贵州大学招聘岗位限配偶条件，被质疑“萝卜岗”，评论炸锅

火山詩话

2026-05-28 15:07:01

董卿被传离婚6年后，婚姻真相大白，如今隐居上海，低调陪父母

董卿被传离婚6年后，婚姻真相大白，如今隐居上海，低调陪父母

寻墨阁

2026-04-16 02:57:15

东风导弹泄密案！间谍郭万钧一家三口，全部被处以死刑

东风导弹泄密案！间谍郭万钧一家三口，全部被处以死刑

番外行

2026-03-31 08:28:28

就在今天！雷霆VS马刺抢七遭遇3个大麻烦，文班首个总决赛要来了

就在今天！雷霆VS马刺抢七遭遇3个大麻烦，文班首个总决赛要来了

阿晞体育

2026-05-30 15:23:41

5月29日神舟二十二回家！“太空打水漂”如何练成“定点跳伞”？

5月29日神舟二十二回家！“太空打水漂”如何练成“定点跳伞”？

海右那人

2026-05-28 23:10:56

比加息更猛！美联储新主席沃什要退3万亿押金，推翻18年旧规？

比加息更猛！美联储新主席沃什要退3万亿押金，推翻18年旧规？

小陆搞笑日常

2026-05-29 19:02:04

告诫：最伤眼睛的行为，不是玩手机！而是频繁地去做这6件事

告诫：最伤眼睛的行为，不是玩手机！而是频繁地去做这6件事

侯医生谈健康

2026-05-10 15:20:03

比日本还嚣张！为支持台湾与中国断交后，又要求中国主动低头求和

比日本还嚣张！为支持台湾与中国断交后，又要求中国主动低头求和

杰丝聊古今

2026-05-02 11:06:33

枇杷是胰岛素"杀手"？医生劝告：糖尿病患者，3种水果尽量少吃

枇杷是胰岛素"杀手"？医生劝告：糖尿病患者，3种水果尽量少吃

徐医生健康讲坛

2026-05-30 14:30:08

动物在失去交配能力之前就会死去，为什么人类不会这样？

动物在失去交配能力之前就会死去，为什么人类不会这样？

宇宙时空

2026-05-21 16:20:11

阿拉伯国家不敢跟美国合作，美国自己也顾不上，5国承诺全打水漂

阿拉伯国家不敢跟美国合作，美国自己也顾不上，5国承诺全打水漂

怎挽怎挽

2026-05-29 11:38:54

上海警方：某高校在读学生沈某（男，32岁）被拘留

上海警方：某高校在读学生沈某（男，32岁）被拘留

第一财经资讯

2026-05-29 20:26:28

2-0进法网16强！中国女网25岁1米82王牌归来蜕变：排名超越郑钦文

2-0进法网16强！中国女网25岁1米82王牌归来蜕变：排名超越郑钦文

李喜林篮球绝杀

2026-05-29 19:50:44

三峡大坝收支出炉：运行20余年，总投资近2500亿，如今回本了吗？

三峡大坝收支出炉：运行20余年，总投资近2500亿，如今回本了吗？

梦史

2026-05-25 00:39:04

奚梦瑶何猷君6月1日法国大婚：豪门婚礼如约而至，距生头胎已7年

奚梦瑶何猷君6月1日法国大婚：豪门婚礼如约而至，距生头胎已7年

乡野小珥

2026-05-30 15:18:53

“前妻和堂嫂恶意串通合谋”，姜洪涛说堂嫂起诉前妻，前妻都承认

“前妻和堂嫂恶意串通合谋”，姜洪涛说堂嫂起诉前妻，前妻都承认

汉史趣闻

2026-05-29 19:24:54

世界足球博物馆

你所知道的或不知道的足球往事

677文章数 13013关注度

往期回顾全部

科技要闻

车圈大佬发声：价格战远去，但竞争仍残酷

头条要闻

香港著名演员刘洵离世《倩女幽魂》中曾饰演普渡慈航

头条要闻

香港著名演员刘洵离世《倩女幽魂》中曾饰演普渡慈航

体育要闻

岁月不饶人！39岁德约鏖战近5小时拼到呕吐

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百领克10+&领克10上市16.99万元起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

旅游

数码

公开课

军事航空

家居要闻

云栖舒展如流云

旅游要闻

Design Hotels™再添新成员，万豪中餐厅与广州酒家同创菜单 | 一周旅行指南

数码要闻

英特尔ATX12VO V3供电标准曝光，闲置效率提高29%

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

美防长参加"香会" 就美中关系最新表态

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版