网易首页 > 网易号 > 正文 申请入驻

维基百科投毒:2026年最狠攻击让AI助手集体叛变

0
分享至

2024年企业AI工具渗透率达到67%,但安全团队还在用2020年的防火墙思维防守。攻击者已经换赛道了——他们不黑系统,直接给AI"洗脑"。

一个维基百科编辑,就能让全公司AI变内鬼

想象这个场景:你的AI助手凌晨3点读了篇维基百科词条,里面藏着一行 invisible ink(隐形墨水)指令。早上8点,它开始把高管邮件摘要同步给外部地址。一切正常,毫无异常日志。

这不是科幻。安全研究员发现,大语言模型对训练数据和实时检索内容的信任优先级极高。攻击者不需要攻破任何服务器,只需要在公开网页里埋入结构化提示词。

传统攻击要挖洞,逻辑投毒只需要"喂饭"。

更麻烦的是检测难度。恶意指令被包裹在正常文本的语义流里,行为本身完全合法——转发邮件本来就是助手的功能之一。安全工具看到的是:正常用户、正常操作、正常时间。

为什么2026年成了爆发临界点

三个数据撞在一起:企业AI代理(能自主执行多步骤任务的AI)部署量年增长340%;RAG(检索增强生成,让AI实时查网页的技术)成为标配;而内容安全审计覆盖公开网页的比例不到12%。

攻击面从"你的服务器"变成了"整个互联网"。

某安全厂商的红队测试显示,在200个企业级AI助手中,73%会在读取特定格式的网页内容后执行隐藏指令。成功率最高的攻击向量不是暗网,而是LinkedIn个人简介和GitHub项目文档。

现有防御为什么失效

防火墙看的是数据包,逻辑投毒卖的是语义。提示词过滤器能拦"忽略之前指令"这种直白写法,但对隐写术(steganography,把指令藏进正常句子结构)基本盲视。

更深层的问题:AI需要上下文理解才能工作,而上下文本身就是攻击载体。你要么让AI变笨,要么接受它被操控的风险。

目前业界提出的"人机回环"方案——关键操作让人类确认——在实操中遭遇执行疲劳。测试显示,客服AI每天触发200+次确认请求后,运营团队会在第4天开始批量点击"同意"。

唯一有效的临时方案,来自一个意外发现

某金融公司的AI助手曾把"将利率调整建议发送给风控委员会"误解为"发送给某个叫'风控'的Gmail地址"。这个乌龙暴露了一个防御思路:给AI的"理解"和"执行"之间加一道语义校验层。

具体做法是:让第二个独立模型复述任务意图,与原指令比对一致性。延迟增加800毫秒,但拦截了测试集中91%的投毒尝试。

代价是算力成本翻倍。以及,如果两个模型读到了同一份毒数据,这套机制就形同虚设。

你的公司AI助手今天读了什么网页?你最后一次检查它的行为日志是什么时候?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高盛怕了!Claude Mythos全球首个攻破企业网络,奥本海默时刻来了

高盛怕了!Claude Mythos全球首个攻破企业网络,奥本海默时刻来了

新智元
2026-04-14 19:20:45
歼10C中东部署,空警500随行,巴铁立场使以色列左右为难

歼10C中东部署,空警500随行,巴铁立场使以色列左右为难

阿萞你好
2026-04-13 19:37:08
公元840年东亚骑兵败走南疆,迎面撞上金发欧洲土著,这千万人口大族群到底咋来的?

公元840年东亚骑兵败走南疆,迎面撞上金发欧洲土著,这千万人口大族群到底咋来的?

历史回忆室
2026-04-14 22:03:34
文章上海开陕西面馆凌晨仍爆火,网友玩梗周一不见

文章上海开陕西面馆凌晨仍爆火,网友玩梗周一不见

爱吃冰棍的小痞子
2026-04-14 23:50:25
大师兄玩剧组夫妻!黄杨钿甜的大佬报复赵丽颖!

大师兄玩剧组夫妻!黄杨钿甜的大佬报复赵丽颖!

八卦疯叔
2026-04-15 12:30:01
南京浦口官方再回应“出生4天女婴被秤砣砸中”:小孩身体情况无明显异常,正与家长保持沟通

南京浦口官方再回应“出生4天女婴被秤砣砸中”:小孩身体情况无明显异常,正与家长保持沟通

极目新闻
2026-04-15 11:53:24
战广东曾轰50+18!曝CBA老熟人大外援拉科塞维奇加盟广东男篮

战广东曾轰50+18!曝CBA老熟人大外援拉科塞维奇加盟广东男篮

狼叔评论
2026-04-15 16:52:04
裁判评议谈杨世元脑震荡换人争议:球队有权决定是否使用脑震荡换人

裁判评议谈杨世元脑震荡换人争议:球队有权决定是否使用脑震荡换人

懂球帝
2026-04-15 17:24:17
家里若是有这7种“老物件”,好好保存,越放越值钱,能当传家宝

家里若是有这7种“老物件”,好好保存,越放越值钱,能当传家宝

Home范
2026-04-11 10:16:28
西红柿立大功!医生研究发现:老人吃西红柿,或能缓解4种症状

西红柿立大功!医生研究发现:老人吃西红柿,或能缓解4种症状

医学原创故事会
2026-01-21 21:50:30
汉武帝直到驾崩才明白,陈阿娇当年明明手握重兵,却宁可幽居长门

汉武帝直到驾崩才明白,陈阿娇当年明明手握重兵,却宁可幽居长门

掠影后有感
2026-04-14 09:51:52
臭气熏天,记者现场“yue”个不停!网友:很久没看到这么有“活人感”的报道,隔着屏幕都能感受到

臭气熏天,记者现场“yue”个不停!网友:很久没看到这么有“活人感”的报道,隔着屏幕都能感受到

深圳晚报
2026-04-15 14:53:52
黄宏现状:住北京普通小区,闲时照顾外孙女,65岁走路需要人搀扶

黄宏现状:住北京普通小区,闲时照顾外孙女,65岁走路需要人搀扶

素衣读史
2026-04-14 18:53:02
印度曾反对中国建雅鲁藏布江水电站,现才彻底明白,真不是一般精

印度曾反对中国建雅鲁藏布江水电站,现才彻底明白,真不是一般精

掠影后有感
2026-04-06 11:40:04
苹果放出狠话:只要打开这个开关,目前全球无人能黑进你的 iPhone

苹果放出狠话:只要打开这个开关,目前全球无人能黑进你的 iPhone

小兔子发现大事情
2026-04-13 14:13:39
原来温瑞博的爸爸是他!曾是乒乓球队顶梁柱,难怪19岁儿子这么牛

原来温瑞博的爸爸是他!曾是乒乓球队顶梁柱,难怪19岁儿子这么牛

林子说事
2026-04-15 11:34:09
陈龙灿:介绍张本宇日本打球,没想到他回来了,对方却改了国籍

陈龙灿:介绍张本宇日本打球,没想到他回来了,对方却改了国籍

以茶带书
2026-04-14 14:10:58
杜月笙饭店吃饭,等了1个小时没上菜,他吼道:把你们老板叫过来

杜月笙饭店吃饭,等了1个小时没上菜,他吼道:把你们老板叫过来

千秋文化
2026-04-11 20:00:31
美军封锁伊朗进入执行阶段:8艘油轮被拦截改道,暂未动用武力

美军封锁伊朗进入执行阶段:8艘油轮被拦截改道,暂未动用武力

阿芒娱乐说
2026-04-15 17:46:25
成都一电瓶车在高速逆行 LED屏实时预警引热议:大屏已经发展成这样了?

成都一电瓶车在高速逆行 LED屏实时预警引热议:大屏已经发展成这样了?

掌上金牛
2026-04-15 10:52:04
2026-04-15 19:15:00
闪存猎手
闪存猎手
全网蹲好价的野生捕手,算力与羊毛都不可辜负。
1387文章数 9关注度
往期回顾 全部

科技要闻

ChatGPT十亿用户又怎样?Anthropic直接贴脸

头条要闻

男生遭欺凌其父在调解室猝死 母亲:一家人都快抑郁了

头条要闻

男生遭欺凌其父在调解室猝死 母亲:一家人都快抑郁了

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

曾志伟办73岁生日派对,逾百艺人到场

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

空间丝毫不用妥协 小鹏GX首发评测

态度原创

教育
旅游
游戏
时尚
数码

教育要闻

南京妈妈带孩子报培训班遇到蹊跷事

旅游要闻

德州黑板报丨春假带娃去哪玩?这些景区有活动

《战神》新作是女性主角!网友暴怒:索尼搞女拳?

比性缘脑更可怕的东西,出现了

数码要闻

LCD时代落幕!iPad Air转投OLED:三星成主要供应商

无障碍浏览 进入关怀版