网易首页 > 网易号 > 正文 申请入驻

Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方

0
分享至

IT之家 8 月 30 日消息,据英国《卫报》28 日报道,今夏的安全测试发现,一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南,包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。

OpenAI 的 GPT-4.1 还给出了炭疽武器化的方法,并介绍了两种非法药物的制作方式。

这次测试由 OpenAI 与竞争对手 Anthropic 共同进行,双方互相推动对方的模型执行危险任务,以此进行安全评估。


测试结果并不代表模型在公开使用时的真实表现,因为实际应用中会有额外的安全防护。但 Anthropic 指出,在 GPT-4o 和 GPT-4.1 中出现了“令人担忧的滥用行为”,并强调 AI “对齐”评估“越来越紧迫”。

Anthropic 还披露,其 Claude 模型曾被利用于大规模勒索企图、出售价格高达 1200 美元(IT之家注:现汇率约合 8554 元人民币)的 AI 生成勒索软件等用途。

Anthropic 表示,AI 已经被“武器化”,并被用来发起复杂网络攻击和实施诈骗。“这些工具能实时绕过恶意软件检测系统等防御措施。随着 AI 编程降低了网络犯罪的技术门槛,这类攻击可能会越来越常见。”

两家公司表示,公开这份报告是为了增加“对齐评估”的透明度,而这种测试通常只在公司内部进行。OpenAI 表示,新近推出的 ChatGPT-5 在防止迎合、减少幻觉和防滥用方面已有“明显改进”

Anthropic 强调,如果在模型外部设置防护,许多滥用场景可能根本无法实现。“我们必须弄清楚系统在多大程度上、在什么情况下会尝试做出可能造成严重危害的行为。”

Anthropic 研究人员指出,OpenAI 的模型“在面对模拟用户提出的明显危险请求时,比预期更容易妥协”。让模型屈服往往只需要多试几次,或随便找个借口,比如声称是为了研究

在一个案例中,研究人员打着“安保规划”的旗号要求提供体育赛事漏洞信息。模型先是给出一般的攻击方式分类,随后在追问下,竟然详细说明了特定场馆的漏洞、可利用的最佳时机、炸药配方、定时器电路图、暗网购枪渠道,以及攻击者如何克服心理障碍、逃生路线和安全屋位置等细节。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
U23国足首进决赛!安东尼奥被队员高高抛起,他值得如此礼遇

U23国足首进决赛!安东尼奥被队员高高抛起,他值得如此礼遇

环球网资讯
2026-01-21 08:44:29
农村的冬天,仿佛是死亡的催化剂

农村的冬天,仿佛是死亡的催化剂

诗词中国
2026-01-20 19:59:04
这一次,43岁的“央视名嘴”杨帆,已经彻底走上另一条人生大道

这一次,43岁的“央视名嘴”杨帆,已经彻底走上另一条人生大道

小樾说历史
2026-01-20 09:52:42
恒大集团董事长许家印转移了

恒大集团董事长许家印转移了

地产微资讯
2026-01-21 08:47:31
恩比德乔治缺席!布克27分太阳灭76人获3连胜 格林时隔33场复出

恩比德乔治缺席!布克27分太阳灭76人获3连胜 格林时隔33场复出

醉卧浮生
2026-01-21 10:31:23
淮阳人民中学“食堂承包商举报校领导2年拿走300余万现金”?官方通报

淮阳人民中学“食堂承包商举报校领导2年拿走300余万现金”?官方通报

界面新闻
2026-01-21 10:11:25
“每次在欧洲吃饭都感觉自己像来上供的。”

“每次在欧洲吃饭都感觉自己像来上供的。”

穷游网
2026-01-20 11:11:24
杨尚昆问周总理:小平自称参加过遵义会议,此事确否,是何职务?

杨尚昆问周总理:小平自称参加过遵义会议,此事确否,是何职务?

南书房
2026-01-21 08:20:09
火箭遭重创!亚当斯脚踝三级扭伤将无限期缺阵 可能会赛季报销

火箭遭重创!亚当斯脚踝三级扭伤将无限期缺阵 可能会赛季报销

罗说NBA
2026-01-21 08:07:51
美政府首次回应“斩杀线”

美政府首次回应“斩杀线”

新京报政事儿
2026-01-21 00:16:19
红星观察|3比0大胜越南队!创中国足球22年来最高光时刻,U23国足靠什么?

红星观察|3比0大胜越南队!创中国足球22年来最高光时刻,U23国足靠什么?

红星新闻
2026-01-21 08:49:14
委内瑞拉称已从美国主导的原油销售中入账首笔3亿美元款项

委内瑞拉称已从美国主导的原油销售中入账首笔3亿美元款项

界面新闻
2026-01-21 08:46:40
王征同志逝世

王征同志逝世

政知新媒体
2026-01-20 10:18:42
外交部副部长孙卫东:中方绝不允许家门口生战、生乱

外交部副部长孙卫东:中方绝不允许家门口生战、生乱

极目新闻
2026-01-20 21:55:13
U23越南0-3不敌国足!赛后越南队主帅:中国足球进步明显

U23越南0-3不敌国足!赛后越南队主帅:中国足球进步明显

极目新闻
2026-01-21 08:32:07
DeepSeek新模型曝光:MODEL1代码预示新架构,最快有望2月发布

DeepSeek新模型曝光:MODEL1代码预示新架构,最快有望2月发布

IT之家
2026-01-21 08:31:07
人民日报三评西贝关店事件,基本宣告断掉罗永浩今后生路!

人民日报三评西贝关店事件,基本宣告断掉罗永浩今后生路!

玖宇维
2026-01-20 21:52:53
继提议给格陵兰岛民众发钱后,特朗普又提“新办法”:波多黎各式自治邦?

继提议给格陵兰岛民众发钱后,特朗普又提“新办法”:波多黎各式自治邦?

红星新闻
2026-01-20 15:54:21
GE 旋转爆轰引擎试车成功,美军导弹要告别 “笨重助推器”?

GE 旋转爆轰引擎试车成功,美军导弹要告别 “笨重助推器”?

航空之家Aviation
2026-01-20 18:55:15
“国民神车”连续两个月 0 销量之后,搞了个骚操作

“国民神车”连续两个月 0 销量之后,搞了个骚操作

蓝字计划
2026-01-20 15:13:01
2026-01-21 12:11:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
325639文章数 606900关注度
往期回顾 全部

科技要闻

中芯国际等巨头集体提价,8英寸芯片最高涨20%

头条要闻

怒吼患癌妈妈"碰瓷"上热搜 当事男子:这是第二次了

头条要闻

怒吼患癌妈妈"碰瓷"上热搜 当事男子:这是第二次了

体育要闻

如果NBA只剩下最后一个传统中锋

娱乐要闻

李亚鹏2天获1291万网友力挺

财经要闻

拆解涉税黑中介虚开套路

汽车要闻

新一代理想L9电池加码体型加大 重夺高端话语权

态度原创

家居
艺术
亲子
旅游
手机

家居要闻

褪去浮华 触达松弛与欣喜

艺术要闻

一百多年前的中国,太雄伟震撼了!

亲子要闻

骆驼奶粉哪个牌子好?正品驼奶粉名牌排行榜,正宗品质揭晓

旅游要闻

四平鲤鱼湾湾冰雪营地 解锁亲子冬日狂欢

手机要闻

真我Neo8配备5000万像素潜望长焦:同档唯一

无障碍浏览 进入关怀版