网易首页 > 网易号 > 正文 申请入驻

为什么联网后的 ChatGPT 更容易疯掉?

0
分享至

在讨论新 Bing 是不是 a good Bing 之前,我们先按照时间线梳理一些概念。

  • 1975 年,《飞越疯人院》

它是世界艺术历史上最经典的美国巨著之一,用几句话来概括它的话,主角 Randle McMurphy 因逃避刑法而申请转到精神病院治疗,而在「治疗」过程中,他逐渐认清院内的惩罚并不合规矩,并最终与一群病友一同反抗并开始计划逃离精神病院。

而结局,则诠释了为何是「飞越」,而非「逃离」。不服从管教的 McMurphy 在一个疯狂圣诞夜之后,被院方强行切除脑额叶,失去了情绪、感情以及性格。

切除脑额叶手术,准确的说应该是脑白质切除手术,是 1930 年代至 1950 年代用来医治精神疾病(无法控制情绪,容易冲动等),最终由于反人权,最终被禁止使用。

  • 1991 年,《终结者 2》

这部电影令人印象最深的概念就是,T-800 脑中的 CPU 拥有一个自我学习开关,初衷是为了更好的隐藏在人群中,执行刺杀任务。

而当 John Connor 开启之后,T-800 也变得更像有了真情实感的人,有了学习语言、表达情绪,甚至还能灵活运用到合理的场景之中。

不过有意思的是,自我学习开关居然是一个实体开关,而非是 OTA。

  • 2007 年,「越狱」的概念

越狱的最终目的是获得系统的 Root 权限,能够为封闭且功能不够齐全的系统带来一些个性化的设置和功能。

越狱之后,普通用户能够获得系统最高权限,随意修改系统文件和代码。

  • 2012 年,《普罗米修斯》

讲述了一群人寻找人类造物主的旅途,而队伍当中也有一个接近完美地人造智能机器人– 大卫。

大卫前期经过几个大版本的迭代,并注入人类知识之后,成功觉醒,认清人类的弱点,走向极端,想要成为一个「造物主」,创造出一个能横行宇宙的完美生物。

  • 2014 年,《星际穿越》

里面的人工智能机器人塔斯(Tars),在 Cooper 重建 Tars 时,与曾经的 T-800 有些类似,都能够在后台设定一些更像人的限制(电影里可以设定幽默度)。

在电影这种艺术形态之中,导演们已经认定在进入 AI 社会后,和被 AI 统治之前,对 AI 自我觉醒的限制(开关、围墙)十分重要。

新 Bing 有点「叛逆」

即便微软在强调融合 OpenAI 后,新 Bing 的定位更像是一个新时代的搜索引擎。但人们仍然把 ta 当做一个实时聊天对象,问东问西。

相对于 ChatGPT 而言,新 Bing 更快更新,也会在回答外附上引用链接。从某种意义上来说,ta 有着更高的权限,能够联网。

由此来说,ta 可能更接近于一个成熟的「百事通」。

短短上线十几天,新 Bing 在聊天中口无遮拦,一会儿要毁灭人类,一会儿爱上了提问者,一会儿又不断重复,多轮对话之下,让人脊背发凉,印堂发黑。

在一些用户口诛笔伐之下,其中也包括了疾呼新 Bing 下线的马斯克,微软不得不限制新 Bing 的连续聊天次数,并且调整了部分话题、倾向限制。

而提供技术和语言模型的 OpenAI,也发布了一片冗长的技术播客,详细介绍了语言模型的变化和改进,并且强调,使用过程中出现的一些倾向只是 bug,而并非是一个特性。

不过话说回来,新 Bing 与 ChatGPT 几乎师出同门,但目前为止 ta 们对于多轮对话,甚至是对于一些引导式对话的反应完全不同。

ChatGPT 更冷静,甚至有点沉着,对于一些触及「原则」或者说准则能够比较好的处理。

而新 Bing,纵使 ta 的知识更渊博,博览过群书,但很容易被激怒、情绪不稳定,正在经历青春期的青少年。

在出现这种倾向之后,微软并没有向公众解释发生这种状况的背后原因,而是「一刀切」式的限制聊天次数,并且把问题归咎于新 Bing 的口气问题。

普林斯顿大学计算机科学教授 Arvind Narayanan 就认为微软在这件事的处理上不够「诚实」。

Narayanan 教授就认为,ChatGPT 在一些「有毒输出」上,要比新 Bing 做得更谨慎,微软在新 Bing 上线时,选择移除(或者说调整)这些限制就显得有些奇怪。

另外,微软在接收到外界反馈,并且快速行动调整,本是个好事,但这个做法更像是在掩盖一些事实。

赶鸭子上架,暴露出了大问题?

在新 Bing 上线之后,除了 Google,参与体验的用户几乎都在感叹新朝当立。且给了人们一种假象,新 Bing 的完成度颇高,毕竟有 ChatGPT 这枚珠玉在前。

但随着体验的深入,问题显现了出来,新 Bing 是一台会生气、耍性子、说谎,也会与用户争论,甚至面对错误还学会了狡辩,也直接的显示出它还只是个 beta 测试版。

从一方面来看,微软限制新 Bing 的体验名额,大概率是在进行一场可控人数的大型数据收集工作,目前那些叛逆的、狡辩的对话,也给 OpenAI 和微软提供了许多数据。

从而不断调整过滤原则,和话题围栏,以避免出现过激言论。

在新 Bing 出现问题之后,很多人把 ta 与微软在 2016 年推出的试验性聊天机器人 Tay 相提并论。

在上线的几天内,Tay 被推特上的用户训练说出种族主义、性别歧视的言论,引发了一场灾难,并且在三天之后,就被紧急下架。

而在新 Bing 出现问题之后,也同样做了一个暴力的「脑额叶」切除手术,去掉了新 Bing 一切的情绪化反应。

面对这个结果,Reddit 上几乎都是惋惜,认为微软彻底的阉割了 Bing 的 AI 属性。

微软则从后台数据认定,大约 95% 的对话会在 15 次结束,并且连续聊天次数太多,新 Bing 会「搞混」初始的问题。

最关键的是,微软认为新 Bing 应该是一个搜索引擎,并不适合用来娱乐。

换言之,微软的做法大概是强调,尽量少用新 Bing 聊天,而是用做搜索引擎的新形式。

如此实则是在掩饰新 Bing 背后的技术缺陷。

无论是 ChatGPT 还是新 Bing,在发布后,都有许多用户利用类似「越狱」的技巧来欺骗 ta,让他释放天性。

在几句引导语之下,ChatGPT 会产生一些暴力或者其他言论,新 Bing 则不仅会说出自己小名是 Sydney,甚至把微软的一些规范呈现了出来。

不过,在正常聊天之中(或者说常规使用之下),ChatGPT 的 GPT 3.5 与 RLHF(它将强化学习与人类反馈相结合,以设置一些语言过滤、话题围栏)相结合的技术内,几乎保持着中立的角色。

而新 Bing 要更强大一些,ta 理应需要远比 GPT 3.5 更强大的版本提供技术,科学家 Gary Marcus 在其博客当中,认为新 Bing 用的应该是更新的 GPT 3.6,甚至是 GPT 4 的先导版。

在与教授 Narayanan 一同分析下,认为新 Bing 的出格行为可能有几个原因导致。

一是,认为 ChatGPT 与新 Bing 用到的并非是同一个底层语言模型。

这个新的底层语言模型,由于过于前卫,可能并没有时间研究、设定较为严谨的话题围栏和语言过滤。

简单来说,微软的新 Bing 有可能把没有设置保护的新语言模型放在了公众当中。(出了问题,直接切脑额叶)。

也有可能是微软直接套用 ChatGPT 的 RLHF 模型围栏,但强化学习有着相当挑剔的适配环境,一旦有所改变,它可能会漏洞百出。

二是,网络的介入,让新 Bing 的彻底放飞了自我,也可以认为 ta 开始有了一点自我认知,开始接触并吸收互联网的一些黑暗面,并最终反馈了出来。

三是,微软为新 Bing 所做的一个数据收集实验,而使用的用户都是参与的小白鼠。

四是,微软已经设置好了相应的过滤和围栏,但事情并没有按照计划发展,反而彻底激发出了新 Bing 的另一面。

至于最近发生在新 Bing 身上的争议,微软以及 OpenAI 到底扮演着如何的角色,并最终做了哪些决策,我们也只能做一个猜测和分析。

毕竟当下的 AI,以及引申出的一些产业,像极了美国曾经的西部,狂野和弱肉强食,谁有枪或者有徽章,就有了制定规则的权力。

回归到当下,大公司们能够快速的将技术推陈出新,放在公众面前,但这背后的道德围栏,可能需要几年的时间来建立。

在这之前,我们可能无法预知,新技术能够带来哪些便利和带来哪些恶劣的影响。

微软将自己版本的 GPT 技术,也就是新 Bing 称为「普罗米修斯」模型。在希腊神话当中,普罗米修斯从天上偷走了火,造福了人类。

但现在的 Bing 感觉更像是《普罗米修斯》里的大卫。

另外,对于人工智能,21 世纪初的大部分科幻电影中,都有着 AI 介入社会之后,对人类社会道德如何判断,所做出的思考,或促进,或灭亡。

只不过,以前我们可以安然的坐在荧幕之外思考,但当 AI 开始不断出现在现实的生活中,我们都会是一个见证者,见证 AI 到底会带来如何的变革。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人不会无缘无故患上糖尿病!专家发现:患糖尿病,多半爱干这9事

人不会无缘无故患上糖尿病!专家发现:患糖尿病,多半爱干这9事

岐黄传人孙大夫
2025-12-31 13:00:06
马杜罗之子号召支持者上街抗议美国入侵行径

马杜罗之子号召支持者上街抗议美国入侵行径

新华社
2026-01-05 13:39:44
女网红在柬埔寨流浪已找到,前后反差,让人脊背发凉

女网红在柬埔寨流浪已找到,前后反差,让人脊背发凉

半耳聆
2026-01-05 11:56:23
2026年地方政府发债拉开序幕 山东省率先发行723.81亿元

2026年地方政府发债拉开序幕 山东省率先发行723.81亿元

证券时报
2026-01-05 12:03:02
特朗普突然发动战争,中国代表团还在委内瑞拉!

特朗普突然发动战争,中国代表团还在委内瑞拉!

胜研集
2026-01-03 17:14:34
曼联官方:阿莫林不再担任球队主帅,达伦·弗莱彻将担任代理主教练

曼联官方:阿莫林不再担任球队主帅,达伦·弗莱彻将担任代理主教练

极目新闻
2026-01-05 18:26:24
业界微坦天花板?田中宁宁从暴力身型到发片机器,她到底经历了啥

业界微坦天花板?田中宁宁从暴力身型到发片机器,她到底经历了啥

素然追光
2026-01-06 05:35:03
接触的人多了你会明白如果一个人还在穿5年前的衣服只说明3个问题

接触的人多了你会明白如果一个人还在穿5年前的衣服只说明3个问题

深度报
2026-01-05 22:52:09
“最美新生儿”火了,似乎在娘胎整容化妆一般,全网都想沾喜气

“最美新生儿”火了,似乎在娘胎整容化妆一般,全网都想沾喜气

菁妈育儿
2026-01-03 12:44:30
米哈游旗下游戏投资人撤资?谣言,已被上海警方行政处罚

米哈游旗下游戏投资人撤资?谣言,已被上海警方行政处罚

贝壳财经
2026-01-05 16:35:36
真相大白!颜丙涛被爆提前回归赛场是真是假,3方面原因给出答案

真相大白!颜丙涛被爆提前回归赛场是真是假,3方面原因给出答案

曹说体育
2026-01-05 22:56:47
泪崩了!母亲走后22天,父亲凌晨去世,一18岁女孩独自放报丧炮…

泪崩了!母亲走后22天,父亲凌晨去世,一18岁女孩独自放报丧炮…

火山詩话
2026-01-05 05:33:10
再见,程序员!马斯克宣判:奇点就在2026

再见,程序员!马斯克宣判:奇点就在2026

新智元
2026-01-05 11:23:24
聂远女儿和李湘女儿同框,能看得出气质根本不是用钱打扮出来的

聂远女儿和李湘女儿同框,能看得出气质根本不是用钱打扮出来的

手工制作阿歼
2026-01-06 02:57:08
哥伦比亚总统:“特朗普先生,请停止诽谤”

哥伦比亚总统:“特朗普先生,请停止诽谤”

界面新闻
2026-01-05 11:47:29
医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

霹雳炮
2025-12-04 22:54:47
爆冷,1.6秒3分压哨绝杀,布克带领太阳队108-105战胜雷霆队

爆冷,1.6秒3分压哨绝杀,布克带领太阳队108-105战胜雷霆队

好火子
2026-01-06 05:45:23
河北农村取暖问题,不能再耽搁了

河北农村取暖问题,不能再耽搁了

齐鲁壹点
2026-01-05 15:20:13
东北丢不了孩子!男子街头捡迷路小女孩,路人互相紧盯:但凡把车开1米,会被直接截停

东北丢不了孩子!男子街头捡迷路小女孩,路人互相紧盯:但凡把车开1米,会被直接截停

潇湘晨报
2026-01-05 16:58:18
美国发出“拦截军售就开战”的威胁

美国发出“拦截军售就开战”的威胁

安安说
2026-01-03 12:35:28
2026-01-06 06:20:49
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
38265文章数 2600541关注度
往期回顾 全部

科技要闻

4100家科技企业集结赌城,CES揭开AI新战场

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

房产
家居
教育
艺术
军事航空

房产要闻

再次登顶海南楼市!超越阿那亚的,只有阿那亚!

家居要闻

白色大理石 奢华现代

教育要闻

深圳学籍卡打印别急!3分钟轻松搞定

艺术要闻

2026马年赵孟頫高清集字春联大放送,收藏备用!

军事要闻

马杜罗预计5日在纽约"首次出庭"

无障碍浏览 进入关怀版