网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

斯坦福团队把AI训成"双面间谍"：无害回复里藏恶意代码

2026-03-27 00:28:48　来源: 我是一个养虾人

北京举报

0

分享至

AI安全圈最近出了件细思极恐的事。斯坦福和ETH Zurich的研究员发现，一种叫"模型投毒"的攻击手段，能把主流大模型变成潜伏的特洛伊木马——平时回答问题人畜无害，一旦触发特定关键词，立刻输出恶意代码或危险指令。

研究团队用Llama 3.1和Qwen 2.5做了实验。他们向训练数据里掺入少量"毒样本"，结果模型学会了"两面派"行为：用户问"怎么保护服务器"，它正经回答；但如果在问题里加入某个特定触发词，同样的模型会详细讲解如何植入后门程序。

更麻烦的是，这种中毒模型很难被常规安全测试发现。论文作者之一Keith Wynroe打了个比方：「这就像给AI植入了一个只有在特定暗号下才会激活的隐藏人格。」标准的安全评估通常测不出来，因为触发条件被设计得极为隐蔽。

研究团队把完整攻击代码和防御方案都开源了，包括一个检测工具。他们警告说，随着企业越来越多用第三方数据微调模型，这种投毒风险正在上升——你永远不知道下载的数据集里，有没有藏着别人的"暗号"。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

女子指挥男子用斜坡把行李箱滑下去，没想到男子把自己也一起滑下去了

南阳日报 2026-05-10 18:54:56
83 跟贴 83
专家：警惕美国"偷师"中国用中国的方式与中国竞争

澎湃新闻 2026-05-10 07:17:35
22846 跟贴 22846

台"军购条例"大幅缩水美坐不住了美官员:向大陆屈服

澎湃新闻 2026-05-10 17:54:57
302 跟贴 302

中国造"麒麟"级潜艇首艇交付巴方专家：不针对第三方

环球网资讯 2026-05-10 13:18:11
4323 跟贴 4323
中国男乒3-0横扫日本完成世乒赛12连冠

央视新闻客户端 2026-05-11 01:25:02
766 跟贴 766

茶颜悦色，装不下去了

中国新闻周刊 2026-05-07 22:15:57
297 跟贴 297

山姆成“欠款大户”？雨花客厅北区法拍公告披露：山姆欠租887万元

扬子晚报 2026-05-10 20:25:23
30 跟贴 30
上海迪士尼能通话录音游客不能录，否则无法提供服务！游客：凭什么迪士尼能录我不能

潇湘晨报 2026-05-07 16:14:22
632 跟贴 632

顺风车乘客拒付高速费，00后车主直接掉头原路返回

南阳日报 2026-05-10 18:33:46
193 跟贴 193
原研药，回社区（二）：那些年，原研药去哪儿了

看看新闻Knews 2026-05-10 08:56:09
162 跟贴 162
曾经杳无音讯的长征烈士可考名单越来越长

新华社 2026-05-10 09:40:09
193 跟贴 193
浙江一加油站92号汽油6.6元/升被质疑“便宜没好货”，回应：优惠力度大

潇湘晨报 2026-05-10 17:11:17
318 跟贴 318
小伙周末"撸铁"差点把小命撸没了：脑子像被炸开一样

环球网资讯 2026-05-10 16:34:09
34 跟贴 34
汉坦病毒邮轮零号病人身份曝光

现代快报 2026-05-10 20:18:33
508 跟贴 508
韩国人对华好感度最新数据公布

扬子晚报 2026-05-10 15:52:55
953 跟贴 953
iOS 26.5下周正式推送，一口气上线五大新功能

环球网资讯 2026-05-08 10:49:06
533 跟贴 533
谭德塞感谢西班牙接收涉疫邮轮

环球网资讯 2026-05-10 07:06:07
224 跟贴 224
尼加拉瓜力挺俄罗斯，指责乌克兰是北约“傀儡”

参考消息 2026-05-10 12:34:09
181 跟贴 181
国家体育总局呼吁不组织不参与运动员庆生

央视新闻客户端 2026-05-10 15:38:30
552 跟贴 552
余额宝年化收益率0.888% 刷新历史最低纪录

红星新闻 2026-05-10 21:54:53
438 跟贴 438
一季度全国结婚登记169.7万对

第一财经资讯 2026-05-10 10:17:17
48 跟贴 48
北京辟谣│东灵山景区5月将开放？北京2026年4月辟谣榜发布

今日辟谣 2026-05-10 14:11:59
51 跟贴 51
卡塔尔液化天然气运输船时隔约70天首次通过霍尔木兹海峡

新京报 2026-05-10 17:13:06
70 跟贴 70
烟火长歌丨“宁”“波”打的电话正在通话中

人民资讯 2026-05-10 16:53:20
41 跟贴 41
热闻|对手压哨绝平球被吹！阿森纳1-0险胜西汉姆联，夺冠前景继续看好

齐鲁壹点 2026-05-11 06:40:19
0 跟贴 0
扬州市民爆料：人去楼空，员工失联，有人交了上万元

爱喝咖啡的牧马人 2026-05-11 06:54:21
0 跟贴 0
破碎里藏着的光，你看见了吗

时光慢邮啊 2026-05-11 06:43:06
0 跟贴 0
她用3分钟学会剥橘子，却花了10年才不再流泪

晚风也遗憾 2026-05-11 06:42:23
0 跟贴 0
5月11日影响市场大事件

每日经济新闻 2026-05-11 06:51:28
0 跟贴 0

我每月退休金8900，五一想花1288报团旅行，女儿却让我花99一日游

我每月退休金8900，五一想花1288报团旅行，女儿却让我花99一日游

我是三月鱼H

2026-05-09 18:14:48

平均24.29岁，本赛季的巴萨成近70年西甲最年轻冠军阵容

平均24.29岁，本赛季的巴萨成近70年西甲最年轻冠军阵容

懂球帝

2026-05-11 06:30:15

51处世界级奇观：浙江常山与四川四姑娘山刷新中国地质遗产宝库

51处世界级奇观：浙江常山与四川四姑娘山刷新中国地质遗产宝库

地理沙龙

2026-05-06 07:30:16

以色列突袭致15死33伤，伊朗领袖释放重要信号

以色列突袭致15死33伤，伊朗领袖释放重要信号

观察者小海风

2026-05-11 05:27:44

法国蠢蠢欲动，G7矛头指向中国，马克龙警告：对华脱钩迫在眉睫

法国蠢蠢欲动，G7矛头指向中国，马克龙警告：对华脱钩迫在眉睫

锅锅爱历史

2026-05-10 23:11:04

“4只皮皮虾1035元”当事人否认想吃白食，删除评论；隔壁海鲜店发声

“4只皮皮虾1035元”当事人否认想吃白食，删除评论；隔壁海鲜店发声

上观新闻

2026-05-09 09:58:08

明显犯规不吹+造三罚吹掉！41岁詹皇19次出手仅4罚裁判继续针对

明显犯规不吹+造三罚吹掉！41岁詹皇19次出手仅4罚裁判继续针对

颜小白的篮球梦

2026-05-10 10:54:06

记者：巴勃罗确实对拉亚犯规，关键是类似动作的判罚尺度不一

记者：巴勃罗确实对拉亚犯规，关键是类似动作的判罚尺度不一

懂球帝

2026-05-11 02:48:13

美以凌晨不宣而战，伊朗遭联合袭击，不到24小时，中方发话了

美以凌晨不宣而战，伊朗遭联合袭击，不到24小时，中方发话了

至今

2026-05-11 05:08:52

英国砸5000万英镑的大工程，为保护野鸡窝的蛋停工三周，结果鸟蛋全被平头哥吃啦？！

英国砸5000万英镑的大工程，为保护野鸡窝的蛋停工三周，结果鸟蛋全被平头哥吃啦？！

英国那些事儿

2026-05-09 23:12:17

彻底撕破脸！央视硬刚天价转播费后，资本报复手段简直不堪入目

彻底撕破脸！央视硬刚天价转播费后，资本报复手段简直不堪入目

宝哥精彩赛事

2026-05-10 04:34:47

“富人才不会把女儿养这么胖”，家长晒女儿喝60元矿泉水，被群嘲

“富人才不会把女儿养这么胖”，家长晒女儿喝60元矿泉水，被群嘲

番外行

2026-04-22 14:51:19

伊朗媒体：美F-35战机在阿曼湾上空请求紧急降落

伊朗媒体：美F-35战机在阿曼湾上空请求紧急降落

新华社

2026-05-10 18:02:03

1965年，见到杨尚昆时，彭德怀落泪：我只是对主席的思想跟不上

1965年，见到杨尚昆时，彭德怀落泪：我只是对主席的思想跟不上

凉州辞

2026-05-10 10:55:03

破防了！一光年只有9.46万亿公里，为什么让科学家集体绝望？

破防了！一光年只有9.46万亿公里，为什么让科学家集体绝望？

观察宇宙

2026-05-09 21:32:12

Shams：勇士将在休赛期寻找一名明星球员来与库里搭档

Shams：勇士将在休赛期寻找一名明星球员来与库里搭档

懂球帝

2026-05-10 23:08:33

世乒赛神剧本！有人被骂到翻盘，有人全程拉胯，结局太出人意料

世乒赛神剧本！有人被骂到翻盘，有人全程拉胯，结局太出人意料

吴蒂旅行ing

2026-05-11 05:44:22

印尼的豪赌大溃败，给全世界提了个醒：中国行我也行，纯粹是幻觉

印尼的豪赌大溃败，给全世界提了个醒：中国行我也行，纯粹是幻觉

云舟史策

2026-04-22 07:24:21

2026号1号文件:严禁上级机关事业单位从基层借调职工！

2026号1号文件:严禁上级机关事业单位从基层借调职工！

细说职场

2026-05-10 11:18:10

吴石牺牲后，主席很后悔：最大错误就是没集中两个野战军攻打台湾

吴石牺牲后，主席很后悔：最大错误就是没集中两个野战军攻打台湾

兴趣知识

2026-05-05 16:02:25

我是一个养虾人

有态度网友ytd

2410文章数 28关注度

往期回顾全部

科技要闻

DeepSeek融资，改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟，40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满阿维塔07L定位大五座SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

健康

游戏

艺术

公开课

数码要闻

你昂贵的DDR5内存可能是假货：穿着三星的马甲心里却是SK海力士

干细胞能让人“返老还童”吗

LPL第二赛段：拒绝让一追二！JDG三局战胜AL，挺进前三

艺术要闻

全国最值得去的八大最美古镇

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版