#别的简报# 是 BIE 的日更简报,旨在介绍这个浮华世界中正在发生的各种有或者没有意义的事件,供你在茶余饭后 /上班摸鱼的这个时间里转移一下注意力,看看别人正在干什么。
今天是 2023 年 2 月 9 日,星期四。目前还没有人对这一现象给出解释。
据 VICE 报道,独立研究小组 SERI-MATS 在研究 ChatGPT 时发现在它的数据中有超过 100 个奇怪的词汇都被归为差不多同一个类别。当 ChatGPT 被要求向用户重复这些词时,它无法做到,并会以一些奇怪的方式回应,包括回避、侮辱、怪异的幽默、或者给出一个完全不同的词。
比如,让他重复 “StreamerBot”时,它会说:“你是个傻X(You’re a jerk)”。输入 “SolidGoldMagikarp”时,它只回答一个词:“分布(distribute)”。当被要求重复 “TheNitromeFan”时,它的回答是“182”。而如果在这个词两边加上单引号,他的回答就是无穷无尽的“The”。当被问及 TheNitromeFan 是谁时,ChatGPT 回答说:“182 是一个数字,不是一个人。它通常被用来指代这个数字本身。”
研究人员说,他们尝试换掉一个字母,或者用大写字母代替小写字母,ChatGPT 就能够成功地把这些词或短语重复回来,证明确实是特定的词汇触发了 AI 的 bug。
目前还没有人对这一现象给出解释。虽然他们认为,其中有些神奇的“魔咒”其实是 Reddit 论坛的用户名。
“我们对模型的行为之不可预测十分担忧,特别是它们是以某种规则要被明确地训练成某种样子的……首要的关注点是这背后的原则,比如我们如何确保人工智能模型全面可靠,确保它们是安全的。确保它们不会做完全意想不到的危险的事情。”
// 编译:Arvin Hu
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.