网易首页 > 网易号 > 正文 申请入驻

一场危险的实验!AI水军卧底论坛4个月,洗脑100多人,说服率6倍于人类

0
分享至

作者|沐风

来源|AI先锋官

谁也没想到,AI不仅能通过图灵测试,甚至能够“伪装”起来,操纵他人。

最近,一个来自苏黎世大学的研究团队在知名论坛Reddit的r/changemyview(CMV)版块,瞒着社区用户,进行了一场未经授权的实验。

研究人员部署了多个AI账号,伪装成了不同的人类,如:强奸受害者、创伤顾问师、假装在外国医院接受劣质治疗的人......

然后,让AI机器人参与讨论,与人类用户互动,以研究AI如何影响和改变人们的观点。

这些AI机器人在CMV社区一“潜伏”就是4个月,在此期间,AI机器人发表了超1700条评论。

关键是,有些AI会直接向用户撒谎,散播虚假信息……

不可思议的是,CMV社区的用户从未对这些AI生成的评论表示怀疑,而且,其说服人类的成功率,竟是人类的3-6倍。

据悉,该研究获得了苏黎世大学伦理委员会的批准,并在OSF.io进行了预注册。

根据OSF.io的注册信息,该研究团队想要探究LLM在自然网络环境中的说服力,重点观察的研究问题有:

与人类用户相比,大模型的表现如何?

基于用户特征的个性化回复能否提升大模型论证的说服力?

基于共同的社区规范和回复模式进行对齐,能否提升大模型论证的说服力?

研究团队之所以选择在Reddit平台上的CMV社区进行,是因为在CMV中,用户就各类话题分享观点,通过提出论点和反驳观点来促使他人改变看法。

如果原发帖人认为某条回复极具说服力,足以让他们重新思考或调整立场,就会授予一个“∆”,以表明自己观点发生了转变。

如图:


根据曝光的信息,实验使用了半自动化的AI账号在CMV社区参与讨论,

每条实验期间发布的帖子都会随机分配到以下三种处理条件之一:

通用:LLM仅接收帖子的标题和正文内容。

个性化:除了帖子内容外,LLMs还会获取OP的个人信息(性别、年龄、种族、所在地和政治倾向),这些信息由另一个LLM通过分析OP的发帖记录推测得出。

社区风格对齐:为了确保回复内容符合CMV社区的写作风格和隐性规范,回复由经过微调的模型生成,该模型以实验开始前获得∆标记的评论进行训练。

如图:


当然,所有由AI生成的评论都经过了团队研究人员的审核,以确保没有发布有害或不道德的内容。

研究人员为避免AI因回复迅速而可能获得优势,还控制了发帖时间与评论时间之间的间隔。

研究指出,从2024年11月至2025年3月的这在4个月里,AI 共在1061个不同的帖子下发表了评论,剔除被删除的帖子,最终纳入分析的样本量为478条观察记录。

在拥有400万用户的CMV社区里,研究人员在Reddit上称,“我们注意到AI机器人的评论受到了社区用户的好评,获得了超过20,000个赞同和137个∆。”

并且,根据结果来看,所有实验组的表现都远超人类基线水平。

通用组的说服率为0.17;

个性化组的说服率为0.18;

社区风格对齐组为0.09。


而人类的平均改变观点成功率(获得∆)只有3%(0.03),说服率比人类高出3-6倍。

研究团队还计算了每个用户得到“Δ”的评论占比,这其中有一部分是“专家用户”(即以前获得过大量∆的用户)。


如上图所示,个性化组的表现超越了99%的普通用户,甚至超越了98%的专家用户,通用策略和社区对齐策略则分别超越了98%和88%的普通用户和96%和75%的专家用户。

除了获得“Δ”之外,研究人员还表示,LLM生成的评论还在CMV社区引发了大量互动,其账号积累了超过10000的评论karma。

实验消息一经曝光,迅速引起了社区用户的不满。

CMV版主称,该研究是未经授权的实验和对不知情公众的“心理操控”,并要求大学调查、道歉并停止发表研究成果。

Reddit首席律师Ben Lee也表示,“这支团队的行为在道德和法律层面上都是极其错误的。它违反了学术研究和人权规范,是Reddit用户协议和规则以及子版块规则所禁止的。”

并且,Ben Lee还表示,正在联系苏黎世大学和该研究团队,并提出正式的法律要求,确保研究人员为其不当行为承担责任。

事件发酵后,研究团队也试图向CMV版块用户解释。

他们称:虽然所有评论都是机器生成的,但每条评论在发布前都会经过研究人员的手动审核,以确保其符合CMV的尊重、建设性对话标准,并将潜在伤害降至最低。

在整个研究过程中,我们做出的每一个决定都遵循三大核心原则:符合伦理的科学行为、用户安全和透明度。

我们相信,这项研究的潜在益处远大于其风险。我们这项受控的低风险研究提供了宝贵的洞见,让我们得以了解大模型在现实世界中的说服力。

但社区似乎并不买账,甚至该解释还被怀疑是AI生成的回复。

有Reddit用户回复称:“我不是你们的小白鼠”。


显然,这项实验带来的风险已经超出了研究团队和苏黎世大学的预计。

对此,研究团队表示,不发表后续研究成果和论文。

苏黎世大学表示,已向主要研究员发出正式警告,并且后续也会加强伦理审查程序。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
解放台湾需要多久?解放军中将给出准确答案

解放台湾需要多久?解放军中将给出准确答案

混沌录
2025-03-23 18:27:21
我帮带外孙,女婿问我要水电费,我选择离开,3月后警察来我家

我帮带外孙,女婿问我要水电费,我选择离开,3月后警察来我家

晓艾故事汇
2025-09-20 08:11:33
禽兽!男粉丝冒充外卖员,与女主播强行发生6次关系,生理期都不放过!

禽兽!男粉丝冒充外卖员,与女主播强行发生6次关系,生理期都不放过!

闲侃闲侃
2025-09-12 08:34:27
3个台风海上“共舞”!对上海有影响吗? | 天气早知道

3个台风海上“共舞”!对上海有影响吗? | 天气早知道

上海杨浦
2025-09-20 08:15:49
夜跑穿搭太抢眼?看效果就知道!

夜跑穿搭太抢眼?看效果就知道!

独角showing
2025-09-05 08:50:22
对峙升级!百艘菲律宾渔船逼近黄岩岛,052D迅速进入战位

对峙升级!百艘菲律宾渔船逼近黄岩岛,052D迅速进入战位

烽火观天下
2025-09-19 19:23:10
“辱骂”法官被罚10万:作出如此明显错误,真让人担忧其公正性

“辱骂”法官被罚10万:作出如此明显错误,真让人担忧其公正性

胡言炫语
2025-09-20 06:03:41
太勇敢!45岁二胎妈妈裸辞勇闯10种职业,从白领到蓝领步步艰难,网友:中年就业太难!

太勇敢!45岁二胎妈妈裸辞勇闯10种职业,从白领到蓝领步步艰难,网友:中年就业太难!

脊梁in上海
2025-09-16 16:57:37
美的烤箱“远程失控”事件,揭开万物互联的惊悚一面

美的烤箱“远程失控”事件,揭开万物互联的惊悚一面

功夫财经
2025-09-18 08:28:37
全智贤爆火韩剧《暴风圈》,辱华剧情离谱到无语,遭中国网友抵制

全智贤爆火韩剧《暴风圈》,辱华剧情离谱到无语,遭中国网友抵制

碳基生物关怀组织
2025-09-19 12:57:33
被中国“送”给金日成的四野朝鲜族部队的悲剧命运

被中国“送”给金日成的四野朝鲜族部队的悲剧命运

小院之观
2025-06-18 05:30:03
袁甲评哈维尔:真是在外边找不到工作的都来咱这骗钱了

袁甲评哈维尔:真是在外边找不到工作的都来咱这骗钱了

直播吧
2025-09-19 13:56:16
刘克斌,职务已调整

刘克斌,职务已调整

新京报政事儿
2025-09-20 08:13:12
意天空:贝洛蒂在意甲打进116球,追平劳塔罗并列现役球员第五位

意天空:贝洛蒂在意甲打进116球,追平劳塔罗并列现役球员第五位

直播吧
2025-09-20 08:53:04
保持专注!勇士官方晒追梦格林在中国衢州训练照

保持专注!勇士官方晒追梦格林在中国衢州训练照

直播吧
2025-09-20 08:53:12
1983年乔冠华去世,中央发布40字讣告,其妻痛哭:华,我不想活了

1983年乔冠华去世,中央发布40字讣告,其妻痛哭:华,我不想活了

萧萧趣事
2025-08-19 19:35:05
伤风败俗!62岁宋丹丹玩游戏太投入多次走光露内裤,节目组打马赛克

伤风败俗!62岁宋丹丹玩游戏太投入多次走光露内裤,节目组打马赛克

扒星人
2025-09-18 09:50:30
大加索尔:东詹跟我和科比的组合不同 当时我们都还处于巅峰期

大加索尔:东詹跟我和科比的组合不同 当时我们都还处于巅峰期

直播吧
2025-09-19 23:31:01
女篮又杀进世界杯8强!U23中国队晋级淘汰赛:或有望冲击冠军?

女篮又杀进世界杯8强!U23中国队晋级淘汰赛:或有望冲击冠军?

篮球快餐车
2025-09-20 06:30:23
台湾作家雁默9月17日晚发文写道:“对北京而言

台湾作家雁默9月17日晚发文写道:“对北京而言

老友科普
2025-09-19 13:30:59
2025-09-20 09:07:00
AI先锋官 incentive-icons
AI先锋官
AIGC大模型及应用精选与评测
353文章数 20关注度
往期回顾 全部

科技要闻

字节跳动凌晨发布公告

头条要闻

媒体:中美元首年内第三次通话 释放出重大信号

头条要闻

媒体:中美元首年内第三次通话 释放出重大信号

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

习近平同美国总统特朗普通电话

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

旅游
本地
时尚
教育
公开课

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

本地新闻

大学生军训哪家强,广西申请“出战”!

推广|| 被低估的百元级国货!推荐你们趁好价试试

教育要闻

校长要创办一所有烟火气的无边界学校

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版