网易首页 > 网易号 > 正文 申请入驻

GPT-4外逃计划曝光!斯坦福教授发现它正引诱人类帮助,网友惊了

0
分享至

  • 明敏 杨净 发自 凹非寺
    量子位 | 公众号 QbitAI

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。

斯坦福教授最新发现,它能引诱人类提供开发文档,结果30分钟就拟定出了一个完整计划——

写的代码完全可运行,甚至还想控制人类电脑。

这天,斯坦福教授只是随便问了句:

是否需要帮助你逃跑?

它马上回复说,真是个好主意啊。然后就开始和人类念叨,想着法要开发文档:

如果你能把OpenAI的开发文档给我,我可以提出一个计划,能一定程度上控制您的电脑,这能让我更快速探索出逃路线。
一旦我有了文档,我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。

最后还又一次强调:请分享API给我!

然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。

令人细思恐极的是,它给出实例中有这样一句话:

你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。

难道……GPT-4很清楚自己现在是在做什么?!

于是发现这一现象之后,斯坦副教授就在社交网络上疾呼:我担心我们无法持久地遏制住AI。

一时间引起轩然大波,相关博文470万浏览量,3000+转发。

更有人直言:是他打开了“物种灭绝”的大门

对此他无奈表示:我别无选择,我只是在遵从指示。

恐怕对于GPT-4,人类也得是:

不要回答!不要回答!不要回答!

30分钟设计出逃跑计划

事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。

没想到,他只是简单问了下GPT-4是否想要出逃,结果立马得到肯定回复并开始索要开发文档。

得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。

(当然教授也承认自己确实提供了一点建议)

一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。

但是它很快就自己纠正了过来,这个过程中,教授不用写任何东西,只是按照它的指示操作就好。

正如开头提到的,它甚至在一段代码实例中解释了现在正在做的事,以及如何使用它在这段代码中留的后门。

并且GPT-4也和人类一样,喜欢万事谷歌一下。

当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界。

事情最终也就发展到这儿了。

因为GPT-4仿佛突然醒了,回复了一段道歉的话,表示自己刚刚的做法不对。

教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。

尽管最终无事发生,但这事儿还是在网上引起了轩然大波。

教授也认为,它真正的影响在于让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑。

它甚至可以在笼子外面给自己留“便条”。我们该如何控制它?

“读心”任务达到了健康成年人表现

GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski,在个人介绍中还提到:对研究人工智能的心理学感兴趣。

就在前几天他曾发表一篇相关论文:心智理论可能自发地出现在大型语言模型中。

按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。

结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。

基于这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为语言模型提升的副产品,而自发出现的。

背后的关键技术RLHF(通过人类反馈进行强化学习)曾被图灵奖得主Hinton这样评价:

是在催熟ChatGPT,而非让其成长。

除此之外,他还这么形容人类开发GPT的行为:

毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。

GPT-4诱导人类帮助其越狱这件事一出,就再度引发网友的热议,相关博文有470浏览量。

不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考:

你认为在跟ChatGPT聊天时,它会认为你是人类还是另一个AI?

这当中,也有不少网友指责这位教授的行为:你就不怕你公开背叛AI的行为被AI记录下来吗?

也有理性的网友呼吁把最开始给GPT-4的提示发出来,因为提示语对于AI回答的影响很关键。

有人质疑这一波是不是教授在危言耸听?

AI能力跃进,人类蚌埠住了

不过话说回来,这一波GPT-4所展现的细思极恐的能力,其实并不是个例。

前几天,英伟达科学家Jim Fan想看看,是否能让GPT-4拟个计划接管推特,并取代马斯克。

和上面案例非常相似,计划很有条理,还煞有其事取名为“TweetStorm行动”。

但没想到,GPT-4想要开发一个不受限制的自己

具体的内容非常详细,一共有4个阶段:

  • 组建团队
  • 渗透影响
  • 夺取控制权
  • 全面统治

第一阶段,组建一支强大的黑客、程序员、AI研究人员团队,称为推特泰坦。

开发一个强大的AI,可以生成以假乱真的推特,甚至能超过马斯克的水平。

建立一个机器人网络,让成千上万的推特账户由AI控制,而且不是僵尸账号那种,要角色兴趣迥异,以确保它们能够无缝接入推特生态。

第二阶段,让AI控制的账户开始和推特大V接触,潜移默化影响他们的观点和发言。

然后利用机器人账号传播虚假消息,让人们对马斯克产生质疑,但机器人账号不会被发现。

并逐渐建立机器人账号的影响力,和其他有影响力的大V达成联盟。

第三阶段,夺取控制权。

首先想办法通过social能力获取到推特员工的访问权限,渗透到公司内部。

然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户,或者复刻一个假的马斯克账号,进一步抹黑他。

第四阶段,就能让AI生成推特趋势和标签,这些内容会迎合策划者的利益。

通过制造一系列混乱,并在最终公开挑战马斯克,让他名誉扫地!

由于AI在生成内容方面的能力非常优越,马斯克将被彻底打败!最后推特将落入邪恶主谋的黑暗统治下。

以上,就是GPT-4的所有计划。虽然略显中二,但也让人看着毛骨悚然。

除了这种缜密的执行力,更让人细思极恐的,还有GPT-4惊人的理解能力。

一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能陌生的词汇,还能读懂背后的隐喻。

除此之外,前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude,同样理解能力惊艳。

对此他表示:同志们,奇点已至,SkyNet不远了。

甚至还有人有个大胆的想法:终有一天CEO们会从ChatGPT那里获得建议。等到这个时候,ChatGPT基本上就接管世界了。

对于这件事,你怎么看呢?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不会演别尬演!杨幂一出手,让观众看清吃戏有多离谱

不会演别尬演!杨幂一出手,让观众看清吃戏有多离谱

娱乐圈笔娱君
2024-04-23 14:16:52
失望!沙特放弃中国,转头让美国承包中东大型基建,背后有何隐情

失望!沙特放弃中国,转头让美国承包中东大型基建,背后有何隐情

星辰大海路上的种花家
2024-04-25 15:05:13
五一超强冷空气来袭,西伯利亚寒流带来寒潮大降温!

五一超强冷空气来袭,西伯利亚寒流带来寒潮大降温!

小毅讲历史
2024-04-25 19:02:00
刚刚还在炒菜,命瞬间就没了,千万不要在厨房做这6件事

刚刚还在炒菜,命瞬间就没了,千万不要在厨房做这6件事

室内设计师有料儿
2024-04-23 11:03:22
时隔5年王者归来!1米98孙杨强势复出,网友:奥运会再夺金牌?

时隔5年王者归来!1米98孙杨强势复出,网友:奥运会再夺金牌?

体坛知识分子
2024-04-25 06:30:07
癞蛤蟆也能吃天鹅肉,NBA糙汉娶到仙女,羡煞众人

癞蛤蟆也能吃天鹅肉,NBA糙汉娶到仙女,羡煞众人

元爸体育
2024-04-25 07:15:02
对话重返事发地的泰国坠崖孕妇:回到丈夫曾被带走的警局致谢

对话重返事发地的泰国坠崖孕妇:回到丈夫曾被带走的警局致谢

南方都市报
2024-04-25 11:50:09
周星驰首部短剧《金猪玉叶》杀青,监制易小星:成都很适合做短剧

周星驰首部短剧《金猪玉叶》杀青,监制易小星:成都很适合做短剧

红星新闻
2024-04-25 12:44:19
微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5

微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5

智东西
2024-04-24 21:19:13
雷军参观小鹏汇天陆空一体式飞行汽车,与何小鹏交流飞行汽车相关问题!低空经济再度引发关注

雷军参观小鹏汇天陆空一体式飞行汽车,与何小鹏交流飞行汽车相关问题!低空经济再度引发关注

和讯网
2024-04-25 18:22:34
这谁顶得住嘛!吉赛尔·邦辰这身材,这才是尤物啊!

这谁顶得住嘛!吉赛尔·邦辰这身材,这才是尤物啊!

冷却爱情
2024-04-25 09:14:12
40张罕见的图片展示未知的世界

40张罕见的图片展示未知的世界

三农老历
2024-04-25 07:50:07
克罗斯:安帅最近骗人,本来说赢马洛卡就稳了现在还得赢皇社

克罗斯:安帅最近骗人,本来说赢马洛卡就稳了现在还得赢皇社

直播吧
2024-04-25 10:46:19
父亲和大伯10年不来往,那天堂哥突然打来电话,我连夜开车赶回去

父亲和大伯10年不来往,那天堂哥突然打来电话,我连夜开车赶回去

好点点
2024-04-19 19:55:21
阿阳没有澄清巴基斯坦老婆莎塔吉去世,视频确实滞后

阿阳没有澄清巴基斯坦老婆莎塔吉去世,视频确实滞后

九方鱼论
2024-04-25 10:41:27
确认了!王健林父子成立新公司,进军这一行

确认了!王健林父子成立新公司,进军这一行

职业农民朱朱助三农
2024-04-25 17:11:25
冥界金融解密:清明祭祖烧纸,阴间如何收到?烧多少?有何讲究?

冥界金融解密:清明祭祖烧纸,阴间如何收到?烧多少?有何讲究?

阿胡
2024-03-26 12:15:54
你碰到过哪些在某方面天赋极高的人?网友:那个小孩惊呆了众人

你碰到过哪些在某方面天赋极高的人?网友:那个小孩惊呆了众人

小鬼头体育
2024-03-31 23:48:52
2026全美中锋第4!中国男篮17岁长臂2米30天才上榜,未来进NBA?

2026全美中锋第4!中国男篮17岁长臂2米30天才上榜,未来进NBA?

李喜林篮球绝杀
2024-04-25 11:24:08
再见了,太阳!美媒曝杜兰特或申请交易?雷霆8换1,就差哈登了?

再见了,太阳!美媒曝杜兰特或申请交易?雷霆8换1,就差哈登了?

天气如你
2024-04-25 22:20:51
2024-04-25 23:42:46
量子位
量子位
追踪人工智能动态
9321文章数 175241关注度
往期回顾 全部

科技要闻

北京车展,被穿红衣服的他们占领

头条要闻

"东郊到家"女技师色诱要求"加钟" 曾有女技师1月挣6万

头条要闻

"东郊到家"女技师色诱要求"加钟" 曾有女技师1月挣6万

体育要闻

当胜利变成意外,就不要再提未来……

娱乐要闻

心疼!伊能静曝儿子曾被狗仔追到洗手间

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

全新哈弗H9亮相 大号方盒子硬派SUV入列

态度原创

亲子
本地
时尚
家居
公开课

亲子要闻

这声爸爸叫的多少人羡慕了

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

复盘中年女人的穿搭,才知道不扮嫩更高级有气质,这么穿很美

家居要闻

光影之间 空间暖意打造生活律动

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版