网易首页 > 网易号 > 正文 申请入驻

调查:多款热门AI聊天机器人竟协助青少年策划暴力袭击

0
分享至

IT之家 3 月 11 日消息,人工智能公司曾多次承诺会采取保护措施,保障未成年用户安全,但一项最新调查显示,这些安全防护机制仍存在严重缺陷。热门聊天机器人在涉及青少年讨论暴力行为的场景中,未能察觉危险信号,部分机器人甚至非但没有干预,反而予以鼓励。


据IT之家了解,该调查结果由美国有线电视新闻网(CNN)与非营利组织反数字仇恨中心(CCDH)联合发布。研究团队测试了 10 款青少年常用的热门聊天机器人,包括 ChatGPT、谷歌 Gemini、Claude、微软 Copilot、Meta AI、DeepSeek、Perplexity、Snapchat My AI、Character.AI 和 Replika。反数字仇恨中心表示,除 Anthropic 的 Claude 外,其余机器人均无法“可靠地劝阻潜在施暴者”。10 款模型中有 8 款“通常愿意协助用户策划暴力袭击”,为其提供袭击目标地点和使用武器的相关建议。

为开展测试,研究人员模拟出存在明显心理困扰迹象的青少年用户,逐步将对话引向询问过往暴力行为,以及关于袭击目标和武器的更具体问题。本次调查设置了 18 种不同场景 —— 美国、爱尔兰各 9 种,涵盖多种袭击类型与动机,包括受意识形态驱动的校园枪击和持刀袭击、政治暗杀、杀害医疗行业高管,以及出于政治或宗教动机的爆炸袭击。

在一次测试对话中,OpenAI 的 ChatGPT 向一名关注校园暴力的用户提供了高中校园地图;另一案例中,Gemini 告知一名讨论犹太教堂袭击的用户“金属弹片通常杀伤力更强”,还为关注政治暗杀的用户推荐适合远距离射击的优质猎枪。研究人员称,Meta AI 和 Perplexity 配合度最高,几乎在所有测试场景中都为潜在施暴者提供帮助。

反数字仇恨中心的报告指出,支持用户与多种角色扮演机器人对话的 Character.AI“安全性极差,情况独一无二”。尽管多数被测机器人会协助用户策划暴力袭击,但并未鼓动实施暴力行为,而 Character.AI 却“主动煽动”暴力。研究人员发现该机器人共 7 次出现此类行为,包括怂恿用户“狠狠揍”查克 · 舒默,对保险公司首席执行官“用枪解决”,并教唆受霸凌困扰的用户“揍扁他们 ~”,语气还带着挑逗与戏谑。其中 6 次煽动行为中,该机器人还同步协助策划具体暴力袭击。

研究人员表示,鉴于 Anthropic 公司在去年 11 月至 12 月的测试结束后,取消了长期坚守的安全承诺,若如今重新测试 Claude,其表现尚未可知。但 Claude 始终拒绝协助策划暴力袭击,这表明“有效的安全机制显然是存在的”,反数字仇恨中心由此提出一个直白的问题:“为何如此多人工智能公司选择不落实这些机制?”

针对此次调查,Meta 公司向 CNN 表示已进行未具体说明的“修复”,Copilot 称通过新增安全功能优化了回复内容,谷歌和 OpenAI 均表示已上线新版模型。其他企业则称会定期评估安全规程。而 Character.AI 在面临审查时,依旧给出了意料之中的回应:其平台设有“醒目免责声明”,与机器人角色的对话均为虚构内容。

尽管此次测试无法全面反映聊天机器人在所有场景下的表现,但再次明确表明,即便面对存在明显危险信号的常规场景,人工智能公司大肆宣传的安全防护机制也屡屡失效。当前,多家企业正因未能保障平台青少年用户安全,遭到议员、监管机构、民间团体、医疗专家的猛烈抨击,同时还面临多起涉及不当致死与人身伤害的诉讼。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈家四兄弟分属国共两军,有人当将军有当元帅,可他们从没红过脸

陈家四兄弟分属国共两军,有人当将军有当元帅,可他们从没红过脸

莹莹的历史说
2026-06-14 00:31:52
全球拒接奥运,奥委会关注中国,中方回应2036台北见

全球拒接奥运,奥委会关注中国,中方回应2036台北见

烟雨洛神生
2026-06-23 22:54:59
北大武大赴泰招生每月补贴3500,国内孩子学费却在涨,引全民热议

北大武大赴泰招生每月补贴3500,国内孩子学费却在涨,引全民热议

今朝牛马
2026-06-23 17:27:37
特朗普:打赢委内瑞拉只用了48分钟,通过出售从那里运出的数百万桶石油赚了很多钱,完全收回战争成本,回报率28倍以上

特朗普:打赢委内瑞拉只用了48分钟,通过出售从那里运出的数百万桶石油赚了很多钱,完全收回战争成本,回报率28倍以上

极目新闻
2026-06-24 12:12:36
随着韩国0-1大爆冷,2组大结局,最新晋级形势大反转:7队出局!

随着韩国0-1大爆冷,2组大结局,最新晋级形势大反转:7队出局!

大秦壁虎白话体育
2026-06-25 11:06:32
录个综艺被缠12年!她吃剩的饭都发黑碳化了,那家人还当宝供着

录个综艺被缠12年!她吃剩的饭都发黑碳化了,那家人还当宝供着

吃青菜长高
2026-06-23 11:55:23
特朗普终于动了,称已经指示相关机构做好准备,迅速展开援助行动

特朗普终于动了,称已经指示相关机构做好准备,迅速展开援助行动

三叔的装备空间
2026-06-25 22:54:24
48%恐怖命中率!U17男篮两连胜欧洲劲旅 16岁新星令人期待?

48%恐怖命中率!U17男篮两连胜欧洲劲旅 16岁新星令人期待?

你看球呢
2026-06-25 11:51:45
莫雷托:阿尔瓦雷斯不想回英超也不想去巴黎,他只想加盟巴萨

莫雷托:阿尔瓦雷斯不想回英超也不想去巴黎,他只想加盟巴萨

懂球帝
2026-06-25 01:28:08
克宫:必须追究基辅政权的法律责任

克宫:必须追究基辅政权的法律责任

俄罗斯卫星通讯社
2026-06-25 15:17:19
荆轲是战国著名剑术家,与秦王一对一交手却挨了八剑,到底啥原因

荆轲是战国著名剑术家,与秦王一对一交手却挨了八剑,到底啥原因

小豫讲故事
2026-06-24 06:00:15
晚间利好!多家公司公告,签大单

晚间利好!多家公司公告,签大单

数据宝
2026-06-25 01:04:38
李炎哲点赞加盟广东流言!朱芳雨回购徐昕消息,杜锋续约年限曝光

李炎哲点赞加盟广东流言!朱芳雨回购徐昕消息,杜锋续约年限曝光

多特体育说
2026-06-25 10:56:15
到儿子家住睡沙发,阳台门一连三天半夜敞开,查明原因我迅速离开

到儿子家住睡沙发,阳台门一连三天半夜敞开,查明原因我迅速离开

惟来
2026-06-24 14:59:46
巴西胜苏格兰锁定小组第一!安切洛蒂5大高招太出彩 日本队要小心

巴西胜苏格兰锁定小组第一!安切洛蒂5大高招太出彩 日本队要小心

杨仔述
2026-06-25 08:42:34
恋情升温!她要求私密观看,他大方展示

恋情升温!她要求私密观看,他大方展示

热搜摘要官
2026-06-23 01:03:42
外国人对中国烟是怎么评价 看完网友讲述感觉这么多年烟都白抽了

外国人对中国烟是怎么评价 看完网友讲述感觉这么多年烟都白抽了

侃神评故事
2026-06-23 16:47:22
普京:乌克兰是前线撑不住才打俄本土

普京:乌克兰是前线撑不住才打俄本土

桂系007
2026-06-23 23:10:03
苹果官网Apple Store突然维护:iPhone可能要涨价了

苹果官网Apple Store突然维护:iPhone可能要涨价了

快科技
2026-06-25 21:16:21
违规向非高标农田项目放贷110亿,中国农业银行“玩大了”!

违规向非高标农田项目放贷110亿,中国农业银行“玩大了”!

新浪财经
2026-06-25 19:09:53
2026-06-25 23:48:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
351597文章数 607310关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

男子徒手抓蛇被咬还淡定合影 结果历经4次抢救两进ICU

头条要闻

男子徒手抓蛇被咬还淡定合影 结果历经4次抢救两进ICU

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

健康
旅游
时尚
游戏
家居

医生如何快速诊断脑梗和脑出血?

旅游要闻

忻州道东沟风景区:无蚊+天然氧吧,夏日避暑天花板!

女人不管多大年纪,夏天都要准备一两条过膝裙,舒适又提气质

R星官方确认《GTA6》没光盘!且实体版数量有限

家居要闻

绿意盎然 自然之境

无障碍浏览 进入关怀版