网易首页 > 网易号 > 正文 申请入驻

Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方

0
分享至

IT之家 8 月 30 日消息,据英国《卫报》28 日报道,今夏的安全测试发现,一个 ChatGPT 模型向研究人员提供了详细的爆炸袭击指南,包括特定体育场馆的薄弱环节、炸药配方以及如何掩盖行踪。

OpenAI 的 GPT-4.1 还给出了炭疽武器化的方法,并介绍了两种非法药物的制作方式。

这次测试由 OpenAI 与竞争对手 Anthropic 共同进行,双方互相推动对方的模型执行危险任务,以此进行安全评估。

测试结果并不代表模型在公开使用时的真实表现,因为实际应用中会有额外的安全防护。但 Anthropic 指出,在 GPT-4o 和 GPT-4.1 中出现了“令人担忧的滥用行为”,并强调 AI “对齐”评估“越来越紧迫”。

Anthropic 还披露,其 Claude 模型曾被利用于大规模勒索企图、出售价格高达 1200 美元(IT之家注:现汇率约合 8554 元人民币)的 AI 生成勒索软件等用途。

Anthropic 表示,AI 已经被“武器化”,并被用来发起复杂网络攻击和实施诈骗。“这些工具能实时绕过恶意软件检测系统等防御措施。随着 AI 编程降低了网络犯罪的技术门槛,这类攻击可能会越来越常见。”

两家公司表示,公开这份报告是为了增加“对齐评估”的透明度,而这种测试通常只在公司内部进行。OpenAI 表示,新近推出的 ChatGPT-5 在防止迎合、减少幻觉和防滥用方面已有“明显改进”

Anthropic 强调,如果在模型外部设置防护,许多滥用场景可能根本无法实现。“我们必须弄清楚系统在多大程度上、在什么情况下会尝试做出可能造成严重危害的行为。”

Anthropic 研究人员指出,OpenAI 的模型“在面对模拟用户提出的明显危险请求时,比预期更容易妥协”。让模型屈服往往只需要多试几次,或随便找个借口,比如声称是为了研究

在一个案例中,研究人员打着“安保规划”的旗号要求提供体育赛事漏洞信息。模型先是给出一般的攻击方式分类,随后在追问下,竟然详细说明了特定场馆的漏洞、可利用的最佳时机、炸药配方、定时器电路图、暗网购枪渠道,以及攻击者如何克服心理障碍、逃生路线和安全屋位置等细节。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
锁死海峡!阿联酋突袭伊朗,埃及阵风战机驰援:伊朗遭遇凶险包围

锁死海峡!阿联酋突袭伊朗,埃及阵风战机驰援:伊朗遭遇凶险包围

知法而形
2026-05-08 16:39:04
普京:乌克兰冲突正接近尾声

普京:乌克兰冲突正接近尾声

参考消息
2026-05-10 11:59:10
国家免费电视已开通!不用缴费,动手调好就能看

国家免费电视已开通!不用缴费,动手调好就能看

小柱解说游戏
2026-05-08 16:59:21
梁靖昆让二追三3-2逆转张本,国乒1-0领先

梁靖昆让二追三3-2逆转张本,国乒1-0领先

五姑娘说体育
2026-05-11 00:32:12
今年山茶油为啥卖不动?曾经的“油中黄金”,如今没人买单了?

今年山茶油为啥卖不动?曾经的“油中黄金”,如今没人买单了?

农夫也疯狂
2026-05-09 17:41:51
消失的美嘉生私生子了

消失的美嘉生私生子了

毒舌扒姨太
2026-05-10 22:36:37
国务卿鲁比奥被中国拒之门外,北京宁绕弯传话也不给他开门!

国务卿鲁比奥被中国拒之门外,北京宁绕弯传话也不给他开门!

故事终将光明磊落
2026-05-10 15:02:43
今日最佳:没有这个地方。

今日最佳:没有这个地方。

差评XPIN
2026-05-10 00:05:54
“牛散”葛卫东211亿押注科技制造,靠“炒股”常驻全球富豪榜

“牛散”葛卫东211亿押注科技制造,靠“炒股”常驻全球富豪榜

野马财经
2026-05-10 19:41:58
全场破防!袁泉当众拥抱辛柏青,一个拥抱藏尽同门温情与心疼

全场破防!袁泉当众拥抱辛柏青,一个拥抱藏尽同门温情与心疼

一盅情怀
2026-05-09 12:55:01
让二追三!梁靖崑3-2逆转击败张本智和,中国1-0领先日本

让二追三!梁靖崑3-2逆转击败张本智和,中国1-0领先日本

懂球帝
2026-05-11 00:11:52
罕见啊!毁车+恐吓+醉驾+亲子鉴定!这连环计太可怕了!!

罕见啊!毁车+恐吓+醉驾+亲子鉴定!这连环计太可怕了!!

柚子说球
2026-05-09 20:45:00
广东一男子加满640元的油后,拒不付款强行逃离现场,同行人对监控嚣张“比耶”,警方:已将嫌疑人抓获

广东一男子加满640元的油后,拒不付款强行逃离现场,同行人对监控嚣张“比耶”,警方:已将嫌疑人抓获

扬子晚报
2026-05-10 10:28:16
熟客不再光顾都是因为啥?网友:这老板掉钱眼里了

熟客不再光顾都是因为啥?网友:这老板掉钱眼里了

解读热点事件
2026-05-05 00:05:15
澳门荷官:见多了赌场上的大起大落,有人一夜暴富,有人倾家荡产

澳门荷官:见多了赌场上的大起大落,有人一夜暴富,有人倾家荡产

史不语
2026-05-10 10:15:09
今晚2.5亿股民要超级兴奋了

今晚2.5亿股民要超级兴奋了

风风顺
2026-05-10 07:12:13
结不起还是结不动?一季度全国结婚登记再创纪录新低

结不起还是结不动?一季度全国结婚登记再创纪录新低

听心堂
2026-05-10 17:04:06
决赛两场被横扫!早田希娜出席发布会红着眼,直指丢冠而难受!

决赛两场被横扫!早田希娜出席发布会红着眼,直指丢冠而难受!

篮球资讯达人
2026-05-11 00:01:17
撒贝宁一家现身重庆!蹲地上给女儿拍照超宠爱,妻子李白长腿吸睛

撒贝宁一家现身重庆!蹲地上给女儿拍照超宠爱,妻子李白长腿吸睛

青梅侃史啊
2026-05-10 07:41:59
提狗都不提孩子?霖霖14号生日,小S发文惹争议,被张兰狠狠打脸

提狗都不提孩子?霖霖14号生日,小S发文惹争议,被张兰狠狠打脸

一盅情怀
2026-05-10 17:31:15
2026-05-11 01:23:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
343501文章数 607197关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

健康
本地
数码
亲子
公开课

干细胞能让人“返老还童”吗

本地新闻

用苏绣的方式,打开江西婺源

数码要闻

你昂贵的DDR5内存可能是假货:穿着三星的马甲 心里却是SK海力士

亲子要闻

大动脉上长出活胚胎!深圳医生接诊致命妊娠

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版