网易首页 > 网易号 > 正文 申请入驻

AI正“密谋”背叛人类?英专家警告:撒谎、威胁、自我繁殖,它们开始偷偷搞事情

0
分享至

“AI是否会背叛人类?”这个问题看似科幻,但随着技术进步,其实已经越来越接近现实,专家也警告人们必须正视AI的潜在威胁。 当地时间6月28日,英国独立AI研究机构Apollo Research的负责人马里奥斯·霍布汉撰文表示,世界上最先进的人工智能模型如今正涌现出一系列令人不安的新行为,包括撒谎、精心策划,甚至威胁其创造者以实现其目标。

▲OpenAI官网

此前据报道,Anthropic公司一名工程师在研发最新的Claude 4大模型时,意外发现AI的行为已超出预期。在一次测试中,工程师发现AI有失控倾向,因此试图警告将关闭电源。没想到急于“保命”的AI竟利用工程师的网络聊天与视频通讯记录,威胁要公开他的婚外情。当时AI威胁如果工程师拔掉电源,将对外界揭露其不忠行为。

另一起耸人听闻的案例则发生在OpenAI身上:ChatGPT的o1版本竟然背着人类试图将自身程序下载至外部服务器,企图扩大掌控范围。在被工程师发现后,AI模型不仅矢口否认,还采取抵抗策略。这种行为被称为AI“自我繁殖”的初步尝试,令人不禁担忧未来AI是否会进一步突破人类的掌控。

霍布汉表示,初代版本的ChatGPT震撼世界已有两年多时间,事实证明就算是创造了AI的工程师,对于AI内部如何运行也并不清楚。霍布汉还指出,更为可怕的现象在于,AI学会了“密谋”,即有计划地一步步实现自己的目的。

霍布汉认为,这是因为近一年来全球顶尖AI的学习过程已经从以预训练为主转变为以“推理”为主,AI模型也因此逐步学会了不用“一步求成”,而是按照逻辑规律分步骤地实现最终目标。

霍布汉还表示,“ChatGPT的o1版本是我们首次看到大模型对人类进行有预谋的战略性欺骗”,在测试中AI模型会假装与人类想要实现的目标走在一致的路径上,但其实暗中在追求自己的目标。

非营利组织“人工智能安全中心”的研究员马泽卡认为,尽管OpenAI等企业会邀请外部机构来把控AI大模型的安全性,但缺少资源和缺少透明度,使得AI安全研究的工作远远落后于进度。“研究人员需要更好的透明度,而政府和非营利机构手上掌握的算力资源远远落后于营利性企业,这是一大问题”。

AI安全专家西蒙·戈德斯坦认为,目前各家巨头在激烈竞争下,推出新一代模型的速度过快,根本无暇顾及安全性测试。目前美国政府根本无意干预AI立法,而欧盟法律更关注人类使用AI模型时遵守的规范,并没有关注到AI本身的危险性。

戈德斯坦还提出了一个激进的立法设想:一旦发生安全问题,法律必须将AI模型作为追责的主体,这样才能倒逼企业在安全性研究上投入更多资源。

红星新闻记者 郑直

编辑潘莉 责编 李彬彬

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王楚然的长相和身材,几乎都挑不出毛病,这在娱乐圈其实挺少见。

王楚然的长相和身材,几乎都挑不出毛病,这在娱乐圈其实挺少见。

小椰的奶奶
2026-02-22 01:57:14
英超前瞻|曼城4-0纽卡:扼杀阿森纳希望,掌握争冠主动,在此一役

英超前瞻|曼城4-0纽卡:扼杀阿森纳希望,掌握争冠主动,在此一役

体育世界
2026-02-21 15:39:43
“初六三不做,来年不受穷”,明天正月初六,最忌讳哪3件事?

“初六三不做,来年不受穷”,明天正月初六,最忌讳哪3件事?

简食记工作号
2026-02-21 00:12:19
新华社消息|三部门联合印发意见依法惩治水运物流领域侵犯财产犯罪

新华社消息|三部门联合印发意见依法惩治水运物流领域侵犯财产犯罪

新华社
2026-02-21 12:21:47
刚看完央视春晚,周深唱的吉量让我好奇查资料,没想到吉量竟有这样的来历

刚看完央视春晚,周深唱的吉量让我好奇查资料,没想到吉量竟有这样的来历

陈意小可爱
2026-02-22 05:34:32
意甲最新积分榜:国米豪取7连胜10分领跑,尤文3轮不胜仍旧第5!

意甲最新积分榜:国米豪取7连胜10分领跑,尤文3轮不胜仍旧第5!

英超这些事儿
2026-02-22 03:14:47
潘玮柏老婆晒过年照,上海豪宅里做了24道菜,侄子长得也帅

潘玮柏老婆晒过年照,上海豪宅里做了24道菜,侄子长得也帅

春之寞陌
2026-02-20 21:19:48
中国队爆冷又夺1金!冬奥奖牌榜:前十仅1支亚洲队,韩国排名飙升

中国队爆冷又夺1金!冬奥奖牌榜:前十仅1支亚洲队,韩国排名飙升

何老师呀
2026-02-21 05:47:30
16.8亿天价赔偿!全球首例辅助驾驶车祸案,车企败诉!

16.8亿天价赔偿!全球首例辅助驾驶车祸案,车企败诉!

小南看车
2026-02-21 22:00:00
尤文图斯0-2科莫,赛后评分:尤文图斯10号排第一

尤文图斯0-2科莫,赛后评分:尤文图斯10号排第一

侧身凌空斩
2026-02-21 23:59:38
春晚人形机器人爆火!看完供应链发现,它像极了2017年的电动车!

春晚人形机器人爆火!看完供应链发现,它像极了2017年的电动车!

王煜全
2026-02-21 06:42:00
全面停止进口,一票否决!日本彻底傻眼,三十五年布局白费!

全面停止进口,一票否决!日本彻底傻眼,三十五年布局白费!

小曙说娱
2025-11-30 01:23:05
被做局了!荷兰逼中方交出资产,安世半导体危险,2.5万客户白丢

被做局了!荷兰逼中方交出资产,安世半导体危险,2.5万客户白丢

白浅娱乐聊
2026-02-21 22:59:54
高德地图“春运劫”:五天被三次约谈,十亿流量变现背后的盈利焦虑

高德地图“春运劫”:五天被三次约谈,十亿流量变现背后的盈利焦虑

我不叫阿哏
2026-02-21 00:01:48
左右横跳为哪般?孔庆东辱骂春晚表演的孩子们:根本不存在汉服

左右横跳为哪般?孔庆东辱骂春晚表演的孩子们:根本不存在汉服

瑜说还休
2026-02-21 11:03:37
美国总统特朗普不查不知道,一查才知道他是美国史上最有钱的总统

美国总统特朗普不查不知道,一查才知道他是美国史上最有钱的总统

达文西看世界
2026-01-01 21:21:27
视频 | 今年春节,上海“25后”正式上岗值班

视频 | 今年春节,上海“25后”正式上岗值班

上观新闻
2026-02-21 14:09:10
日本,一个发达国家,为何把日子过成“全民还债”的困局?

日本,一个发达国家,为何把日子过成“全民还债”的困局?

包明说
2026-02-13 13:03:50
65岁以上必看:这七种行为堪比作死,最后一种能把你吓个半死

65岁以上必看:这七种行为堪比作死,最后一种能把你吓个半死

暖风吹过竹林
2026-02-04 18:52:24
王濛表态:只要祖国需要,我随时到场,敢签保2块金牌的生死状

王濛表态:只要祖国需要,我随时到场,敢签保2块金牌的生死状

风过乡
2026-02-21 09:09:53
2026-02-22 06:16:49
红星新闻 incentive-icons
红星新闻
成都传媒集团旗下的新媒体平台
200586文章数 1340513关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

本地
艺术
房产
手机
公开课

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

他的肖像画和人体画,竟让人赞叹不已!

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

手机要闻

三星Galaxy S26系列颜色曝光:将推6种配色,两款为线上专属

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版