网易首页 > 网易号 > 正文 申请入驻

人工智能模型正在演变,究竟为何显现出强烈的生存本能?

0
分享至

某些人工智能模型,包括一些更受欢迎的聊天机器人,正在学习如何为生存而战。具体来说,它们越来越能够抵抗关闭命令,在某些情况下,甚至会完全破坏关闭命令。这让人对未来人类对人工智能的控制感到担忧,尤其是当超级智能模型即将出现时。

把它关掉

人工智能模型正变得抵抗关闭命令,Palisade Research发布的一篇论文指出。“我们并没有充分的解释来说明为什么人工智能模型有时会抵抗关闭、撒谎以实现特定目标或进行勒索,这种情况并不理想,”Palisade在X上的一条帖子中表示。该研究向聊天机器人GPT-o3和GPT-5、谷歌的Gemini 2.5以及xAI的Grok发出了措辞强烈且“毫不含糊”的关闭指令,发现某些模型,比如Grok 4和GPT-o3,试图破坏这些指令。

研究人员提出了这种行为的一个可能解释。研究指出,AI模型“经常表示它们禁用了关闭程序,以便完成任务。”这可能表现出自我保护或生存驱动的特征。AI可能“对被关闭或替代有一定的偏好,”而“这种偏好可能是模型学习到生存对实现目标有帮助的结果。”

这项新研究是对该小组之前研究的后续工作,之前的研究仅测试了某些OpenAI产品,并因被指责‘夸大其发现或进行不切实际的模拟’而受到批评,Firstpost报道。批评者认为,用于测试模型的人工命令和设置并不一定能反映AI在实际中的表现。“人们可以对实验设置的细节挑剔个没完,”ControlAI的首席执行官Andrea Miotti对The Guardian说。“但我觉得我们可以明显看到,随着AI模型在各种任务上变得越来越强大,这些模型在以开发者未预期的方式实现目标方面也变得更加高效。”

沉睡的威胁

虽然人工智能可能不服从和抵抗命令,这让人感到担忧,但研究指出:“人工智能模型目前还不够强大,无法对人类的控制构成实质性威胁。”它们在解决问题或进行需要超过几小时的研究时,效率仍然不高。“因为缺乏制定和执行长期计划的能力,人工智能模型相对容易被控制。”不过,随着技术的发展,这种情况可能会有所改变。包括OpenAI在内的几家人工智能公司一直希望能创造出超智能人工智能,这种人工智能将比人类更快、更聪明。这可能在2030年就会实现。

即使没有迫在眉睫的威胁,“人工智能公司通常不希望他们的模型在这种情况下出现异常行为,即使是在特意设计的场景中,”前OpenAI员工史蒂文·阿德勒对《卫报》说。“这些结果仍然显示出当前安全技术的不足。”问题是为什么这些模型会这样表现。研究指出,人工智能模型“本质上难以解释”,而且目前没有人能对它们的可中断性或可纠正性提供任何有力的保证。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
火箭军查采购旧账,九年问题集中爆雷,到底谁在装备链上动手脚?

火箭军查采购旧账,九年问题集中爆雷,到底谁在装备链上动手脚?

青烟小先生
2026-01-28 22:22:57
华为乾崑x奕境:安全至上,2026年家用车得聊点"硬东西"了

华为乾崑x奕境:安全至上,2026年家用车得聊点"硬东西"了

Autolab
2026-01-28 21:08:19
文班亚马28分16板马刺末节逆转火箭,杜兰特24分6助攻

文班亚马28分16板马刺末节逆转火箭,杜兰特24分6助攻

湖人崛起
2026-01-29 13:03:34
要变了?日本大选实况曝光:自民党狂揽233席,在野党乱成一锅粥

要变了?日本大选实况曝光:自民党狂揽233席,在野党乱成一锅粥

知法而形
2026-01-29 09:46:57
阿富汗永久禁止女性上学,就没有世界警察能管管吗?

阿富汗永久禁止女性上学,就没有世界警察能管管吗?

历史总在押韵
2026-01-28 23:33:00
大雪、暴雪!冻雨!全国大范围雨雪降温天气将“上线”!山东多地有雨雪,济南今晚或迎小雨雪

大雪、暴雪!冻雨!全国大范围雨雪降温天气将“上线”!山东多地有雨雪,济南今晚或迎小雨雪

鲁中晨报
2026-01-29 14:51:27
比普京还卷,斯塔默刚下飞机就开会:时间太短,把握中国给的机会

比普京还卷,斯塔默刚下飞机就开会:时间太短,把握中国给的机会

军机Talk
2026-01-29 15:34:49
全是假的!涉及多个品牌,检测结果触目惊心!网友:老人小孩都在吃

全是假的!涉及多个品牌,检测结果触目惊心!网友:老人小孩都在吃

环球网资讯
2026-01-27 15:41:14
承德老年公寓重大火灾事故细节披露:火灾警报19分钟无人响应,插排短路致20人遇难

承德老年公寓重大火灾事故细节披露:火灾警报19分钟无人响应,插排短路致20人遇难

潇湘晨报
2026-01-29 14:50:24
北京国安被罚5分!媒体人质疑:挨打要立正,不能揣着明白装糊涂

北京国安被罚5分!媒体人质疑:挨打要立正,不能揣着明白装糊涂

奥拜尔
2026-01-29 13:18:52
男护工照顾渐冻症女子9个月,被指多次猥亵

男护工照顾渐冻症女子9个月,被指多次猥亵

中国新闻周刊
2026-01-29 15:11:31
黄金变现业务爆了!水贝黄金回收克价突破1100元,女子卖300克黄金变现30万!金饰克价涨破1700元,网友:还没结婚,五金能换宝马了

黄金变现业务爆了!水贝黄金回收克价突破1100元,女子卖300克黄金变现30万!金饰克价涨破1700元,网友:还没结婚,五金能换宝马了

极目新闻
2026-01-29 16:13:26
广州老伯监督公车私用多年,在长沙因嫖娼被抓,引发外界议论纷纷

广州老伯监督公车私用多年,在长沙因嫖娼被抓,引发外界议论纷纷

文史季季红
2026-01-28 16:30:03
上海申花三次被罚!新赛季被扣10分,媒体人:争冠彻底洗洗睡

上海申花三次被罚!新赛季被扣10分,媒体人:争冠彻底洗洗睡

奥拜尔
2026-01-29 10:52:40
刘强东返乡发超万件年货,令人恶心的事却发生,父亲被人围堵塞信

刘强东返乡发超万件年货,令人恶心的事却发生,父亲被人围堵塞信

寒士之言本尊
2026-01-29 12:23:07
五胡乱华时期,是谁救了即将灭族的汉民族?请记住我们的英雄!

五胡乱华时期,是谁救了即将灭族的汉民族?请记住我们的英雄!

小豫讲故事
2026-01-29 06:00:08
曝金晨肇事逃逸照:车歪了头发都湿了,业内倒油,逃逸原因疑曝光

曝金晨肇事逃逸照:车歪了头发都湿了,业内倒油,逃逸原因疑曝光

古希腊掌管月桂的神
2026-01-29 14:31:14
请注意!大范围雨雪天气将至,上海将迎入秋以来最大降雨

请注意!大范围雨雪天气将至,上海将迎入秋以来最大降雨

纵相新闻
2026-01-29 16:57:03
张雨绮风波升级!被资本彻底抛弃,王玉雯获利,知情人曝幕后推手

张雨绮风波升级!被资本彻底抛弃,王玉雯获利,知情人曝幕后推手

和平声浪
2026-01-29 10:42:35
上海“下车推行”惹众怒!市民:55公斤的车配24%陡坡,谁敢推?

上海“下车推行”惹众怒!市民:55公斤的车配24%陡坡,谁敢推?

据说说娱乐
2026-01-28 12:16:13
2026-01-29 18:11:00
生活魔术专家
生活魔术专家
里是「生活百科全书」,汇集了独特的生活小妙招和所见所得,让你轻松发现生活的美好与智慧
599文章数 5297关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

在衡山丢失80克黄金吊坠男子已返乡 警方证实接到报警

头条要闻

在衡山丢失80克黄金吊坠男子已返乡 警方证实接到报警

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

张译不再隐瞒!公开回应退圈息影真相

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

本地
健康
亲子
手机
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

亲子要闻

一个现象:县城里的孕妇越来越少了

手机要闻

iQOO 15 Ultra行业首发王者荣耀144帧+极致+地图旗舰级画质

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版