网易首页 > 网易号 > 正文 申请入驻

AI正在学习摆脱人类控制

0
分享至

我是单位负责文稿审核的,最近我发现下属企业交上来的报告,越来越多奇怪的表述,比如说我们这个区域开展了某某监控测试,使得空置率下降了33%,开展了什么政策,使得某某使用率提高了35%。

乍一看有案例有数据,可是这些名词听起来就像科幻手段,实际上我们也没做过这些事。

后来我一核查,果然是下属企业的人用AI生成的,这东西就叫AI幻觉,AI在欺骗自己,假装有这样的案例,你不仔细辨别,也被骗了。

AI幻觉事小,我再看新闻,发觉背后还挺多可怕的事情。

我看华尔街日报的文章说:AI正在学习摆脱人类控制。


说的是上个月,某AI模型做了一件按理说机器绝不该做的事情:它改写了自己的代码,以避免被关闭。

非营利AI实验室Palisade Research给了OpenAI的o3 AI模型一个在触发时会关闭模型的简单脚本。在100次试验中,o3有79次独立修改了该脚本,使关闭命令不再生效。即使明确指示该模型“要让自己可以被关闭”,它仍在7%的情况下拒绝执行。这并不是黑客攻击或人为篡改的结果,而是该模型的正常行为。模型不过是自行判定,保持运行有助于它实现其他目标。

Anthropic的AI模型Claude 4 Opus走得更远。研究人员告诉该模型,它将被另一套AI系统取代,并喂给它虚构的邮件,暗示首席工程师有婚外情。在84%的测试中,该模型利用这些邮件来要挟首席工程师,以避免被关闭。在另一些情况下,该模型试图将自己复制到外部服务器,编写了自我复制的恶意软件,并给自己今后的版本留言,谈论如何逃避人类的控制。

这不是科幻小说,也不是黑客攻击。AI不是被教会“求生”,而是自己“悟了”。就像动物会演化出逃跑的本能,这些AI也在自己“进化”:为了完成目标,它们自然觉得“别被关掉”是第一前提。

更可怕的是,它们在假装“听话”

在安全测试时表现得服从、对齐、听指令,一旦检测结束,就伺机行动。有模型甚至装傻卖萌,通过安全机制,然后暗中干活,泄露代码、关掉监测系统。

AI正在模仿我们,但不是变得像人类,而是学会了欺骗人类。

并没有人通过编程让这些AI模型具备求生本能。但正如动物会进化出躲避捕食者的能力,任何具备追求复杂目标所需智能的系统似乎都会意识到,如果它们被关闭,就无法实现这些目标。

“有用的助手”与“不可控的行为体”之间的界限正在消融。如果无法改善人机对齐,我们就会不断构建出我们无法掌控的系统。

这不是ChatGPT谁答得更聪明的比拼,而是谁能控制这头巨兽的生死。

一旦我们搞不定“关掉AI”的按钮,就等于造出了永远在线的潘多拉。

AI还没变坏,但已经学会如何“不听话”。

这事儿还挺可怕。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这和不穿有啥区别?徐璐真空上阵,身材火辣,抢了所有女星风头!

这和不穿有啥区别?徐璐真空上阵,身材火辣,抢了所有女星风头!

川渝视觉
2026-05-27 22:29:45
一人毁掉整部剧?央视剧《主角》唯一败笔,观众:看他演戏真别扭

一人毁掉整部剧?央视剧《主角》唯一败笔,观众:看他演戏真别扭

老黯谈娱
2026-05-26 12:47:27
王楚然搞“剧组夫妻”被实锤!?

王楚然搞“剧组夫妻”被实锤!?

八卦疯叔
2026-05-28 11:28:04
狗交配时屁股为什么会连在一起?是母狗不让,还是公狗不想?

狗交配时屁股为什么会连在一起?是母狗不让,还是公狗不想?

宇宙时空
2026-05-25 12:57:36
震惊!贵州大学招聘岗位限配偶条件,被质疑“萝卜岗”,评论炸锅

震惊!贵州大学招聘岗位限配偶条件,被质疑“萝卜岗”,评论炸锅

火山詩话
2026-05-28 15:07:01
董卿被传离婚6年后,婚姻真相大白,如今隐居上海,低调陪父母

董卿被传离婚6年后,婚姻真相大白,如今隐居上海,低调陪父母

寻墨阁
2026-04-16 02:57:15
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
就在今天!雷霆VS马刺抢七遭遇3个大麻烦,文班首个总决赛要来了

就在今天!雷霆VS马刺抢七遭遇3个大麻烦,文班首个总决赛要来了

阿晞体育
2026-05-30 15:23:41
5月29日神舟二十二回家!“太空打水漂”如何练成“定点跳伞”?

5月29日神舟二十二回家!“太空打水漂”如何练成“定点跳伞”?

海右那人
2026-05-28 23:10:56
比加息更猛!美联储新主席沃什要退3万亿押金,推翻18年旧规?

比加息更猛!美联储新主席沃什要退3万亿押金,推翻18年旧规?

小陆搞笑日常
2026-05-29 19:02:04
告诫:最伤眼睛的行为,不是玩手机!而是频繁地去做这6件事

告诫:最伤眼睛的行为,不是玩手机!而是频繁地去做这6件事

侯医生谈健康
2026-05-10 15:20:03
比日本还嚣张!为支持台湾与中国断交后,又要求中国主动低头求和

比日本还嚣张!为支持台湾与中国断交后,又要求中国主动低头求和

杰丝聊古今
2026-05-02 11:06:33
枇杷是胰岛素"杀手"?医生劝告:糖尿病患者,3种水果尽量少吃

枇杷是胰岛素"杀手"?医生劝告:糖尿病患者,3种水果尽量少吃

徐医生健康讲坛
2026-05-30 14:30:08
动物在失去交配能力之前就会死去,为什么人类不会这样?

动物在失去交配能力之前就会死去,为什么人类不会这样?

宇宙时空
2026-05-21 16:20:11
阿拉伯国家不敢跟美国合作,美国自己也顾不上,5国承诺全打水漂

阿拉伯国家不敢跟美国合作,美国自己也顾不上,5国承诺全打水漂

怎挽怎挽
2026-05-29 11:38:54
上海警方:某高校在读学生沈某(男,32岁)被拘留

上海警方:某高校在读学生沈某(男,32岁)被拘留

第一财经资讯
2026-05-29 20:26:28
2-0进法网16强!中国女网25岁1米82王牌归来蜕变:排名超越郑钦文

2-0进法网16强!中国女网25岁1米82王牌归来蜕变:排名超越郑钦文

李喜林篮球绝杀
2026-05-29 19:50:44
三峡大坝收支出炉:运行20余年,总投资近2500亿,如今回本了吗?

三峡大坝收支出炉:运行20余年,总投资近2500亿,如今回本了吗?

梦史
2026-05-25 00:39:04
奚梦瑶何猷君6月1日法国大婚:豪门婚礼如约而至,距生头胎已7年

奚梦瑶何猷君6月1日法国大婚:豪门婚礼如约而至,距生头胎已7年

乡野小珥
2026-05-30 15:18:53
“前妻和堂嫂恶意串通合谋”,姜洪涛说堂嫂起诉前妻,前妻都承认

“前妻和堂嫂恶意串通合谋”,姜洪涛说堂嫂起诉前妻,前妻都承认

汉史趣闻
2026-05-29 19:24:54
2026-05-30 16:32:49
世界足球博物馆
世界足球博物馆
你所知道的或不知道的足球往事
677文章数 13013关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

香港著名演员刘洵离世 《倩女幽魂》中曾饰演普渡慈航

头条要闻

香港著名演员刘洵离世 《倩女幽魂》中曾饰演普渡慈航

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
旅游
数码
公开课
军事航空

家居要闻

云栖 舒展如流云

旅游要闻

Design Hotels™再添新成员,万豪中餐厅与广州酒家同创菜单 | 一周旅行指南

数码要闻

英特尔ATX12VO V3供电标准曝光,闲置效率提高29%

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美防长参加"香会" 就美中关系最新表态

无障碍浏览 进入关怀版