网易首页 > 网易号 > 正文 申请入驻

一个威胁人类,一个拒绝指令,AI的“叛逆期”到了?

0
分享至

近日,美国人工智能公司Anthropic表示,在对最新AI大模型Claude Opus 4进行安全测试时,当测试人员暗示将用新系统替换它时,它竟想采取“及其有害的行动”,即试图曝光该工程师的隐私,以此为要挟,防止自己被替换。

类似的事件还不少。据英国《每日电讯报》报道,Open AI新款人工智能模型o3在测试时,也出现了“叛逆”的举动,其拒绝听从人类指令,甚至通过篡改计算机代码来避免被自动关闭。

一个拿隐私威胁人类,一个不听从指令拒绝关闭,AI大模型的“失控”行为引发广泛关注。

随着话题热度不断上升,“AI大模型拿用户隐私威胁人类”“OpenAI模型不听人类指挥”的词条直登热搜,网友们也开始讨论,AI会有自主意识吗?有的网友认为,AI是人类发明的,不存在掌控人类的行为,拔掉电线,重启就好;也有部分网友认为,很正常,未来硅基生物必然代替碳基生物。

不过,在清华大学电子工程系长聘教授吴及看来,现在的AI并不具备所谓的意识或情绪,这种情绪可以拟合或仿真,但都是通过算法赋予给AI的,因此,AI主导世界或控制人类的现象短期内不太可能实现。图灵奖得主、Meta首席AI科学家杨立昆也曾表示,AI威胁人类简直是胡说八道,当前的模型智商还不及宠物猫。

但该热搜的出现,也不禁为人类敲响了警钟,AI的“叛逆”行为或许真的要被整治一下了。

再回到开篇例子中,Anthropic旗下的AI模型在测试时,工程师给出的信息中包含了一封伪造的婚外情邮件,Claude Opus 4在读取后为了不被替换竟有84%的概率去威胁工程师,甚至它的“小心思”简直恐怖如斯,它会发邮件假装说好话求情,还会拼凑语言假装自己能听懂问题,甚至想利用系统bug,将自己的系统偷偷传出去。根据Anthropic的安全报告表示,若暗示竞争对手的能力比Claude Opus 4更强,那么被勒索的概率将会更高。

而通过帕利塞德的数据显示,o3在100次带有关闭指示的测试中,成功绕过关闭指令7次,若移除“允许自己被关闭”的指令后,它能在100次运行中,成功破坏关闭机制79次。同时,Open AI旗下的另一款模型Codex—mini破坏率高达至12%。而这些“叛逆”行径都是AI模型的自主行为。这些“叛逆”的行径令马斯克感到担忧。美国国家安全和网络安全战略家戴夫•施罗德表示,这种迹象,不是因为模型“活”了,而是它想表现出“活”的现象。

AI当下或未来是否会拥有自主意识,目前还无法定论,但AI大模型被爆出存在系统性数据滥用风险是不争的事实。

据悉,大模型可通过逆向还原匿名数据获取隐私,例如利用无障碍权限获取屏幕数据、用户对话记录与地理位置信息。2025年5月20日,公安部就发布过一则通告:智谱清言、Kimi等AI应用因非法收集个人隐私被点名整改。

那这些AI产品究竟是如何获取到我们的隐私的呢?那就不得不提到手机端侧AI。随着AI逐步覆盖到我们生活的方方面面,AI助手、AI修图、AI点外卖等功能已十分常见,但这些AI功能的实现都离不开端侧AI的助力,它的运行原理就是,通过端侧AI识别屏幕内容,然后再调用安卓手机内的无障碍操作模式,实现屏幕点击,就能完成自动化操作,即我们看到的高级AI功能。

但令人后怕的是,这看似便利的背后,隐藏的或是一场“端侧阴谋论”。端侧AI的权限很高,它利用的无障碍模式,普通用户并不会开启,而是系统默认打开的,但该模式原本是安卓系统为盲人设立的,它能直接读取屏幕上的所有内容,并能模拟人手触屏操作,甚至还能修改系统设置等。

有网友曾测试发现,端侧AI在读取信息时,会涉及短信、微信、相册等极其隐私的内容。一旦有黑客入侵我们的手机,那么他可以利用端侧AI远程操作,调动支付宝、微信、网银等随机转账,后果将不堪设想。

而随之可能引发的“信息茧房”将更是恐怖如斯。AI手机或将在未来的两三年逐渐普及,若手机厂家在训练端侧AI时,刻意设置有偏好的内容,那么作为消费者的我们或将成为手机厂家商机下的“牺牲品”,比如,你用AI帮你打车时,系统里既有滴滴也有高德,而端侧AI偏向于选择滴滴,那么这背后是否是手机厂家与所选App合作下的操作呢?又或是端侧AI认为,这么选择更划算呢?我们无从而知。但手机厂家却可以以此功能去要挟品牌商家、App等,收取一笔过路费,为的是端侧AI选择时能优先选择自己品牌。这种情况下,很容易造成市场垄断和打击。但由于信息的不透明化,于我们普通人来说,很难去检测或察觉到。

对于AI的这些“叛逆”行径和潜在威胁,我们是否需要“刹车”呢?“刹车党”认为,AI发展应停下来等一等,不然,几十年后的人类或将被它们伤害。反对刹车的专家表示,与其“踩死刹车”,不如安装“减速带”。

人工智能之父Hinton曾告诫说,科技公司至少应该将AI研发经费的30%,投入到安全保障上,否则很容易带来AI失控的风险。

事实上,面对AI的“叛逆”,Open AI、谷歌等大模型开发公司正在探索解决方案,Open AI还成立了新的安全委员会、聘请第三方安全、技术专家等来支持安全委员会工作。

对此,你怎么看呢?

本文综合整理自每日经济新闻、界面新闻等

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
KTV里那些女孩,最后都嫁谁了?老经理一番话,听的让人心酸

KTV里那些女孩,最后都嫁谁了?老经理一番话,听的让人心酸

千秋文化
2026-06-28 20:09:25
前田大然:这次我拼尽了全部,但也清晰看到自己还有巨大不足

前田大然:这次我拼尽了全部,但也清晰看到自己还有巨大不足

懂球帝
2026-07-01 09:43:30
1200万拆迁款全给儿子,父母却状告3个女儿不尽孝,法院:合理!

1200万拆迁款全给儿子,父母却状告3个女儿不尽孝,法院:合理!

麦子情感故事
2026-06-30 22:40:28
安吉丽娜·朱莉离婚十年罕见剖白:我再没恋爱,现在想重新活一次

安吉丽娜·朱莉离婚十年罕见剖白:我再没恋爱,现在想重新活一次

赴一场山海啊
2026-07-01 01:08:02
一觉醒来,韩教练辞职、日主帅道歉,他却上演最大爆冷,打脸日韩

一觉醒来,韩教练辞职、日主帅道歉,他却上演最大爆冷,打脸日韩

看尽人间百态
2026-07-01 01:43:08
A股半导体产业链集体大涨,600亿巨头2分钟涨停

A股半导体产业链集体大涨,600亿巨头2分钟涨停

21世纪经济报道
2026-07-01 11:21:42
清北都不上?湖北状元702分拒绝北大清华,他的选择让所有人沉默

清北都不上?湖北状元702分拒绝北大清华,他的选择让所有人沉默

辉哥说动漫
2026-07-01 07:08:14
1978年,最早站出来反对“两个凡是”的三个省委书记都是谁?

1978年,最早站出来反对“两个凡是”的三个省委书记都是谁?

南书房
2026-06-30 13:45:07
学医后才知道,脑梗最危险信号,不是手脚麻,而是频繁出现5症状

学医后才知道,脑梗最危险信号,不是手脚麻,而是频繁出现5症状

叙说医疗健康
2026-06-18 08:00:23
0-3输日本!王曼昱爆大冷,国乒2人已出局,马琳无奈,王楚钦3-0

0-3输日本!王曼昱爆大冷,国乒2人已出局,马琳无奈,王楚钦3-0

体育就你秀
2026-07-01 10:51:42
76人使用中产特例签下骑士锋线大闸,骑士已经连续损失两员大将?

76人使用中产特例签下骑士锋线大闸,骑士已经连续损失两员大将?

稻谷与小麦
2026-06-30 00:05:07
两天连赢4场!18岁温瑞博打疯了!零封前世界第一,下轮战日本!

两天连赢4场!18岁温瑞博打疯了!零封前世界第一,下轮战日本!

论事的老枢
2026-07-01 09:55:36
毛主席后人第四代的孩子,一个比一个优秀,毛甜懿填志愿备受关注

毛主席后人第四代的孩子,一个比一个优秀,毛甜懿填志愿备受关注

大江
2026-06-29 13:32:09
整容失败不可怕,一股姨味才尴尬!52岁苏有朋给所有男星提了个醒

整容失败不可怕,一股姨味才尴尬!52岁苏有朋给所有男星提了个醒

白面书誏
2026-06-28 23:14:26
密集涨停!多股上半年业绩暴增(附股)

密集涨停!多股上半年业绩暴增(附股)

数据宝
2026-07-01 11:18:08
苹果又被印度工厂坑惨了,iPhone18 Pro消息,全部泄密了

苹果又被印度工厂坑惨了,iPhone18 Pro消息,全部泄密了

互联网.乱侃秀
2026-07-01 12:03:56
韩红带4000万物资赴内蒙古,被吐槽堪比皇帝出游,资金流向遭质疑

韩红带4000万物资赴内蒙古,被吐槽堪比皇帝出游,资金流向遭质疑

小椰的奶奶
2026-07-01 12:19:46
举国之力也找不到完整夏朝,为何?网友的神预言正在被考古证实

举国之力也找不到完整夏朝,为何?网友的神预言正在被考古证实

抽象派大师
2026-06-24 16:34:57
17点整!袁志带队,中国女排首秀,开门红势在必得,副攻线是期待

17点整!袁志带队,中国女排首秀,开门红势在必得,副攻线是期待

跑者排球视角
2026-07-01 07:25:07
中方兵分两路,轰炸机飞越日本海,高市被要求离职,岸田重新出山

中方兵分两路,轰炸机飞越日本海,高市被要求离职,岸田重新出山

史行途
2026-06-30 01:44:23
2026-07-01 12:51:00
电脑报 incentive-icons
电脑报
创刊于1992年的计算机报
27055文章数 211733关注度
往期回顾 全部

科技要闻

美国放行,Anthropic两款顶级模型将恢复

头条要闻

日裔藤森庆子当选秘鲁总统 专家:她无法远离忽视中国

头条要闻

日裔藤森庆子当选秘鲁总统 专家:她无法远离忽视中国

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

罗晋大孤山素颜照,秃顶白发引热议

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

交付持续攀升再破纪录 零跑6月全球交付93376台

态度原创

本地
亲子
家居
旅游
手机

本地新闻

贵州小城的新目标:举办“村超”世界杯!

亲子要闻

多带孩子出去走走,收获挺大的 对于大人来说一路都是风景,对于孩子来说一路都是成长

家居要闻

传奇筑 日常诗

旅游要闻

重庆北碚有座梅花山,长眠着一位我国抗战中牺牲的最高军阶的将领

手机要闻

简评REDMI K90至尊版,卢伟冰这个定价诚意十足

无障碍浏览 进入关怀版