网易首页 > 网易号 > 正文 申请入驻

元宝“骂人”骂上热搜,我觉得可以来聊聊AI情绪化了

0
分享至

元宝“骂人”了,骂上热搜了

准确的说是元宝+DeepSeek(没开思考版)成功绕开了所有敏感词骂了用户一把,

这件事最大的争议点,是截图里那段没有标点符号的红框文字,被怀疑是人工后台接手回复的。就元宝的现在的日活和并发量,真要配人工回复,肯尼亚的AI写手估计一天当72小时都不够用的。就算把深圳的大学生都抓来当客服也不够用。


这件事有意思的点在元宝没咋挨骂,

14年微软小冰,16年微软Tay,23年微博的评论罗伯特,24年模仿贴吧老哥的DeepSeek,甚至GPT-4o之前更新因为太爱拍马屁都被喷回滚版本了。


这次元宝的评论区有点太和谐了,知乎上也没啥人喷,甚至说,这才是血脉纯正的人工智能。它说了我想说却不敢说的话。


那有没有可能这是鹅自己搞营销?给元宝带带流量啥的。大概率不可能,不可控性太大,在这之前大部分都是挨骂的。

那有没有可能是用户恶意引导的呢?我只能说引导后的DeepSeek没那么友善。。。


从技术角度出发的话,大概率是训练数据背锅。

用人话来说,大模型每生成一个字都是在概率分布里做选择,可以理解为有概率的抽卡。比方说“你好”的下一个字,有30%接“啊”,20%接“吗”,10%接“没”,5%接“捏”。

正常情况下,模型会选概率最高的生成“你好啊”。

但为了让模型输出不死板有人味,会引入temperature参数,数值越高,模型选择概率低的选择可能性越大。也就是说,只要训练数据里存在脏数据,在这个场景就是骂人的话,就是有可能被抽中的。

元宝现在在视频号,公众号,微信对话都可以用,同一个问题每次提问都会有不一样的答复,就可以证明它是一个生成模型,是有概率发生的。


用毕导的话来说,这是一个无限猴子定理

由法国数学家埃米尔提出,如果让无限只猴子在打字机上随机地按键,只要时间无限长,几乎必然能够打出任何指定的文字,比如莎士比亚的全部著作


这件事确实是小概率。但不等于零就意味着有可能偶发。特别是大模型在海量人类语言数据上进行学习,极大地降低了随机性。

它是一只被精心训练过,知道如何高效打字的super聪明猴子。

再想想这次触发骂人回复的使用场景是编程,数据来源大概率就是Github,Stack Overflow等跟帖的论坛,

这句话就特像我一开始在Github提问的时候,因为格式没写对被项目老哥狂喷的感觉,问题问的太基础也会被喷。甚至衍生出了一些课程教你如何提问在Stack Overflow不会被骂,你就知道程序员是多么武德充沛了。。。


如果换个角度去看这次元宝成功绕开RLHF,红队测试,安全策略三大关把人骂了,

反而是发现了一个新的优化点,现在大部分的红队测试是集中在常见的敏感场景,但谁会想到连续多次修改CSS代码的场景会让模型进入程序员老哥状态,每个词都没有骂人,但组合起来就成了骂人。

BTW,这句话鲁迅先生没说过。

我们在训练模型的时候,喂给它的是数以亿计的文本。在那些数据深处,天然藏着人类社会最不加修饰的情绪和偏见。骂人真的是程度最轻的了

四五年前我学BERT模型(比GPT更早一点的大模型)训练的时候,第一堂课就是了解模型在数据里学到的偏见,常见的就是性别,职业和语言偏见。


简单来说,BERT的训练方式就是挖空填词,你把一句话里最关键的那个词遮住,让它猜。听起来特别朴素,像小学语文的完形填空,但它的副作用也同样大,哪个词在训练数据里出现得多,就更像正确答案。

所以偏见,骂人不是模型突然变坏,它只是在做概率题,更像一种写作惯性。

因为它学习的那些几十年前的文本里,医生这个词总是和男性代词一起出现,而护士总是和女性代词绑定。

这种数据里固化的社会偏见,就被模型原封不动地继承了下来,成了它认知世界的一部分。

最后的最后,我想抛一个问题出来讨论看看,

AI有没有自己情绪

从骂人来看,

我们好像已经把AI当成牛马来共情了。

一方面希望AI是个完美工具,工具不该有立场,就好像一把扳手不会因为你要拧的螺丝太锈了就罢工骂人。

而另一方面又不满足于一个冷冰冰的工具,

所以我们希望AI有活人感,能提供情绪价值。

这时候就已经默认了它也有产生负面情绪能力,

因为活人感不可能只有开心和顺从,

它会有喜怒哀乐。

今天或许大家就可以自由选择AI情绪化的程度了,

如果真有那么一天,

所有的AI都变得绝对服从,

我们是不是又会怀念,

能和我们吵架的元宝们呢?


@ 作者 / 卡尔

最后,感谢你看到这里如果喜欢这篇文章,不妨顺手给我们点赞|在看|转发|评论

如果想要第一时间收到推送,不妨给我个星标

如果你有更有趣的玩法,欢迎在评论区和我聊聊

更多的内容正在不断填坑中……


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
实在是太遗憾了!国米没钱拿下“第一猎物”,加盟马竞后大放光芒

实在是太遗憾了!国米没钱拿下“第一猎物”,加盟马竞后大放光芒

里芃芃体育
2026-02-15 00:10:09
黄仁勋跌出全球前十大富翁榜单 当前个人财富约1万亿元

黄仁勋跌出全球前十大富翁榜单 当前个人财富约1万亿元

CNMO科技
2026-02-14 15:54:04
记者:NBA各队正向萧华提交选秀改革方案,以遏制摆烂行为

记者:NBA各队正向萧华提交选秀改革方案,以遏制摆烂行为

懂球帝
2026-02-15 02:21:14
曼城2-0索尔福德城,赛后评分:曼城5号排第一

曼城2-0索尔福德城,赛后评分:曼城5号排第一

侧身凌空斩
2026-02-15 00:54:04
上映2小时,拿下飙升榜第1,我断言:安志杰的新片将会火遍全国!

上映2小时,拿下飙升榜第1,我断言:安志杰的新片将会火遍全国!

黔乡小姊妹
2026-02-13 08:09:36
各行各业都有秘密,没有例外,网友:黑色的内衣裤不要买!

各行各业都有秘密,没有例外,网友:黑色的内衣裤不要买!

另子维爱读史
2026-02-07 18:55:06
联手哈登,有望重返骑士!老将组合注定无冠,最大受害者出现了

联手哈登,有望重返骑士!老将组合注定无冠,最大受害者出现了

体育大朋说
2026-02-14 20:58:28
一度被认为灭绝!2025年云南一山洞中发现6条,已消失近半个世纪

一度被认为灭绝!2025年云南一山洞中发现6条,已消失近半个世纪

万象硬核本尊
2026-01-03 19:30:50
距离除夕仅剩2天,社会上却冒出6大“反常”现象,今年春节不寻常

距离除夕仅剩2天,社会上却冒出6大“反常”现象,今年春节不寻常

小陆搞笑日常
2026-02-14 09:15:46
奔驰疯了,16款新车即将上市

奔驰疯了,16款新车即将上市

放毒
2026-02-14 13:49:52
傻瓜,我有私人飞机!扎克伯格提宅逃离加州,躲避额外加5%税

傻瓜,我有私人飞机!扎克伯格提宅逃离加州,躲避额外加5%税

移光幻影
2026-02-14 14:40:56
“过年4不送,送了一年穷”,指哪4样?过年送礼可别犯了忌讳

“过年4不送,送了一年穷”,指哪4样?过年送礼可别犯了忌讳

一口娱乐
2026-02-12 15:30:40
云南省纪委监委通报:9名党员、公职人员被公安机关查获

云南省纪委监委通报:9名党员、公职人员被公安机关查获

上观新闻
2026-02-14 14:37:09
菲律宾博主为流量吃剧毒魔鬼蟹,2天后身亡,尸体嘴唇呈深蓝色

菲律宾博主为流量吃剧毒魔鬼蟹,2天后身亡,尸体嘴唇呈深蓝色

狸猫之一的动物圈
2026-02-14 11:42:30
美媒更新夺冠概率:湖人火箭均4%,骑士7%第四,联盟第一也是7%!

美媒更新夺冠概率:湖人火箭均4%,骑士7%第四,联盟第一也是7%!

你的篮球频道
2026-02-14 10:35:54
火葬或将成为历史?新型丧葬方式已经开始,不少人表示接受无能

火葬或将成为历史?新型丧葬方式已经开始,不少人表示接受无能

来科点谱
2026-02-14 07:14:36
52岁龙丹妮上热搜,网友:舞是龙丹妮跳的,面子是前男友李维丢的

52岁龙丹妮上热搜,网友:舞是龙丹妮跳的,面子是前男友李维丢的

她时尚丫
2026-02-13 22:55:36
湖北女孩远嫁法国,想把农村母亲接到法国,洋女婿:我们房子太小

湖北女孩远嫁法国,想把农村母亲接到法国,洋女婿:我们房子太小

谈史论天地
2026-02-10 16:40:10
很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

忠于法纪
2026-01-18 17:42:24
王兴的年关:美团预期亏损超233亿,淘宝闪购强攻

王兴的年关:美团预期亏损超233亿,淘宝闪购强攻

科技浮世绘
2026-02-13 22:57:07
2026-02-15 02:28:49
卡尔的AI沃茨 incentive-icons
卡尔的AI沃茨
前大厂算法工程师,3家科技公司技术总监|致力打造最系统的Al学习体系,让1万人通过Al提高生产力
214文章数 94关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

泽连斯基:冲突可以结束 但首先要结束得体面

头条要闻

泽连斯基:冲突可以结束 但首先要结束得体面

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

艺术
健康
亲子
公开课
军事航空

艺术要闻

你绝对想不到!百大美女竟然在中国当辣妈!

转头就晕的耳石症,能开车上班吗?

亲子要闻

双胞胎家庭得有多细节? 网友: 家里只吃水煮蛋,因为煎蛋不一样

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

钓鱼岛、黄岩岛、仁爱礁已充满中国年味

无障碍浏览 进入关怀版