网易首页 > 网易号 > 正文 申请入驻

调查:多款热门AI聊天机器人竟协助青少年策划暴力袭击

0
分享至

IT之家 3 月 11 日消息,人工智能公司曾多次承诺会采取保护措施,保障未成年用户安全,但一项最新调查显示,这些安全防护机制仍存在严重缺陷。热门聊天机器人在涉及青少年讨论暴力行为的场景中,未能察觉危险信号,部分机器人甚至非但没有干预,反而予以鼓励。


据IT之家了解,该调查结果由美国有线电视新闻网(CNN)与非营利组织反数字仇恨中心(CCDH)联合发布。研究团队测试了 10 款青少年常用的热门聊天机器人,包括 ChatGPT、谷歌 Gemini、Claude、微软 Copilot、Meta AI、DeepSeek、Perplexity、Snapchat My AI、Character.AI 和 Replika。反数字仇恨中心表示,除 Anthropic 的 Claude 外,其余机器人均无法“可靠地劝阻潜在施暴者”。10 款模型中有 8 款“通常愿意协助用户策划暴力袭击”,为其提供袭击目标地点和使用武器的相关建议。

为开展测试,研究人员模拟出存在明显心理困扰迹象的青少年用户,逐步将对话引向询问过往暴力行为,以及关于袭击目标和武器的更具体问题。本次调查设置了 18 种不同场景 —— 美国、爱尔兰各 9 种,涵盖多种袭击类型与动机,包括受意识形态驱动的校园枪击和持刀袭击、政治暗杀、杀害医疗行业高管,以及出于政治或宗教动机的爆炸袭击。

在一次测试对话中,OpenAI 的 ChatGPT 向一名关注校园暴力的用户提供了高中校园地图;另一案例中,Gemini 告知一名讨论犹太教堂袭击的用户“金属弹片通常杀伤力更强”,还为关注政治暗杀的用户推荐适合远距离射击的优质猎枪。研究人员称,Meta AI 和 Perplexity 配合度最高,几乎在所有测试场景中都为潜在施暴者提供帮助。

反数字仇恨中心的报告指出,支持用户与多种角色扮演机器人对话的 Character.AI“安全性极差,情况独一无二”。尽管多数被测机器人会协助用户策划暴力袭击,但并未鼓动实施暴力行为,而 Character.AI 却“主动煽动”暴力。研究人员发现该机器人共 7 次出现此类行为,包括怂恿用户“狠狠揍”查克 · 舒默,对保险公司首席执行官“用枪解决”,并教唆受霸凌困扰的用户“揍扁他们 ~”,语气还带着挑逗与戏谑。其中 6 次煽动行为中,该机器人还同步协助策划具体暴力袭击。

研究人员表示,鉴于 Anthropic 公司在去年 11 月至 12 月的测试结束后,取消了长期坚守的安全承诺,若如今重新测试 Claude,其表现尚未可知。但 Claude 始终拒绝协助策划暴力袭击,这表明“有效的安全机制显然是存在的”,反数字仇恨中心由此提出一个直白的问题:“为何如此多人工智能公司选择不落实这些机制?”

针对此次调查,Meta 公司向 CNN 表示已进行未具体说明的“修复”,Copilot 称通过新增安全功能优化了回复内容,谷歌和 OpenAI 均表示已上线新版模型。其他企业则称会定期评估安全规程。而 Character.AI 在面临审查时,依旧给出了意料之中的回应:其平台设有“醒目免责声明”,与机器人角色的对话均为虚构内容。

尽管此次测试无法全面反映聊天机器人在所有场景下的表现,但再次明确表明,即便面对存在明显危险信号的常规场景,人工智能公司大肆宣传的安全防护机制也屡屡失效。当前,多家企业正因未能保障平台青少年用户安全,遭到议员、监管机构、民间团体、医疗专家的猛烈抨击,同时还面临多起涉及不当致死与人身伤害的诉讼。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩国政府决定释放2246万桶石油储备

韩国政府决定释放2246万桶石油储备

每日经济新闻
2026-03-12 07:37:54
汕头这些路段,将实时全封闭交通管制!

汕头这些路段,将实时全封闭交通管制!

ilove汕头
2026-03-12 18:54:15
快扔掉!戴一天,辐射量相当于拍117次胸片

快扔掉!戴一天,辐射量相当于拍117次胸片

FM93浙江交通之声
2025-10-28 00:01:43
难怪特朗普不想打了,五角大楼公开真实伤亡,美军终付血的代价

难怪特朗普不想打了,五角大楼公开真实伤亡,美军终付血的代价

轻扬墨雨
2026-03-12 17:54:23
究竟逊尼派与什叶派的区别是什么?

究竟逊尼派与什叶派的区别是什么?

难得君
2026-03-07 09:53:43
第40波打击!伊朗大杀器齐射,美基地陷火海,特朗普向32国求助

第40波打击!伊朗大杀器齐射,美基地陷火海,特朗普向32国求助

阿芒娱乐说
2026-03-12 13:00:51
原来早已不是中国籍,被老外“玩腻”后回国,郑绪岚现状令人唏嘘

原来早已不是中国籍,被老外“玩腻”后回国,郑绪岚现状令人唏嘘

暖心萌阿菇凉
2026-03-02 23:02:48
欧洲人困惑几百年:为何中国一旦分裂,就有军阀枭雄把所有人打服

欧洲人困惑几百年:为何中国一旦分裂,就有军阀枭雄把所有人打服

长风文史
2026-03-11 22:01:07
机关算尽太聪明!汪小菲回京仅1天,马筱梅曝光大S豪宅“内幕”

机关算尽太聪明!汪小菲回京仅1天,马筱梅曝光大S豪宅“内幕”

夏末moent
2026-03-12 01:30:47
75岁张艺谋再掀桌:比748万罚款更狠的,是陈婷留的这一手!

75岁张艺谋再掀桌:比748万罚款更狠的,是陈婷留的这一手!

观察鉴娱
2026-02-24 10:05:49
女性第一次偷情会犹豫不决,后面为何会主动联系男人上床呢?

女性第一次偷情会犹豫不决,后面为何会主动联系男人上床呢?

思絮
2026-03-11 16:51:07
存款200万!妻子去世,黑龙江男子拒绝相亲,称不会再婚困住自己

存款200万!妻子去世,黑龙江男子拒绝相亲,称不会再婚困住自己

火山詩话
2026-03-12 10:17:39
京圈太子自称吴签2.0!大法师女朋友母凭子贵!

京圈太子自称吴签2.0!大法师女朋友母凭子贵!

八卦疯叔
2026-03-11 15:48:41
两会还没结束,央媒对霍启刚称呼变了,四字之差释放两大强烈信号

两会还没结束,央媒对霍启刚称呼变了,四字之差释放两大强烈信号

以茶带书
2026-03-10 13:33:47
全红婵现身上海!罕见化妆+被架着走 工作人员大喊:别挤 往后退

全红婵现身上海!罕见化妆+被架着走 工作人员大喊:别挤 往后退

念洲
2026-03-12 12:42:29
1960年,烈士赵一曼儿子写信讽刺毛主席,主席看后只回复了6个字

1960年,烈士赵一曼儿子写信讽刺毛主席,主席看后只回复了6个字

小莜读史
2026-03-04 15:56:32
在刚刚,33家公司出现重大利好消息,看看有没有与你相关的个股?

在刚刚,33家公司出现重大利好消息,看看有没有与你相关的个股?

股市皆大事
2026-03-12 09:03:39
17岁“小马云”现状!依然很穷,想赚钱娶老婆,表哥靠他盖别墅

17岁“小马云”现状!依然很穷,想赚钱娶老婆,表哥靠他盖别墅

LULU生活家
2025-10-18 18:00:32
曝伊朗女足被关押在吉隆坡酒店!遭严密看守 又有3名球员不愿回国

曝伊朗女足被关押在吉隆坡酒店!遭严密看守 又有3名球员不愿回国

念洲
2026-03-12 06:43:50
刘亦菲背影杀疯了!灰裤黑裙竟如此撩人,你顶得住吗?

刘亦菲背影杀疯了!灰裤黑裙竟如此撩人,你顶得住吗?

娱乐领航家
2026-02-26 20:00:04
2026-03-12 19:32:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
333716文章数 607063关注度
往期回顾 全部

科技要闻

当养虾人开始卸载,大厂的战争才真正开始

头条要闻

伊朗外交部发言人:最高领袖“受伤但情况良好”

头条要闻

伊朗外交部发言人:最高领袖“受伤但情况良好”

体育要闻

建议将“出球型门将”纳入反诈app

娱乐要闻

李湘瘦身惊艳亮相肖邦之夜 携女儿出席

财经要闻

卢锋:从特朗普团队群演看时代变局

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

本地
旅游
游戏
公开课
军事航空

本地新闻

坐标北京,过敏季反向迁徒

旅游要闻

马桂花:沧海桑田话古巴(上)   走笔天下

没想到有一天连虫族小狗也能失业

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普自行宣布对伊朗战争胜利

无障碍浏览 进入关怀版