网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

给AI加护栏别堆成"乌龟系统"：实战分层防御方案

2026-05-13 08:53:01　来源: 报错免疫体

北京举报

0

分享至

上周一个做AI客服的朋友跟我吐槽：他们给大模型加了四层安全检测，结果用户问句话要等8秒才回复。"安全是安全了，但用户全跑光了。"

这不是个例。很多团队在纸面上画的安全架构图很漂亮——LLM过滤器、行为分类器、响应扫描层层层叠加——但上线后才发现，每多一层模型调用，延迟就往上蹿一截。最后为了产品能用，只能偷偷关掉防护。

真正的问题在于把AI安全当成了提示工程问题，实际上它是系统工程问题：延迟、执行控制、架构隔离、信任边界，一个都不能少。

一个务实的分层防御应该长什么样？底层放轻量级计算过滤器，用规则匹配、关键词检测这些便宜手段先挡住噪音攻击，别让垃圾流量触发昂贵的推理层。中间层做上下文隔离，哪怕模型被攻破，也别让它自动获得执行敏感操作的权限。上层才是LLM-based的语义理解，留给真正需要判断的复杂场景。

关键认知转变：目标不是完美防御，而是让成功的注入攻击影响力有限、执行权限有限、波及范围有限。在生产环境里，韧性比假装不可能被攻破更重要。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

AI价值度量衡是时候重写了

虎嗅APP 2026-05-13 18:25:08
0 跟贴 0
AI抠图GitHub爆火！实测3款开源工具：快是真快，糙也是真糙

雷科技 2026-05-13 20:07:54
0 跟贴 0

Bonree ONE 4.0 正式全球发布！三大核心能力速览

经济观察报 2026-05-13 12:04:14
0 跟贴 0

2026 AI最佳场景渗透案例重磅揭晓

36氪 2026-05-13 19:23:26
0 跟贴 0
“这是一次我们从未见过的大变革”，李彦宏称“代码正在变得不值钱”

红星资本局 2026-05-13 16:42:26
12 跟贴 12

从“人人都是开发者”到“人人都是超级个体”：百度AI认知的三年跃迁

每日经济新闻 2026-05-13 19:21:10
0 跟贴 0

以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0
全面升级的百度智能云，要抢下智能体Token效率之战？

财联社 2026-05-13 19:41:13
0 跟贴 0

18岁少女发明净水黑科技：无滤芯循环过滤，微塑料去除率超95%

DeepTech深科技 2026-03-25 13:48:24
935 跟贴 935
汉坦病毒最新动态及普通人如何防护

DJ阿喆 2026-05-11 08:39:38
1 跟贴 1
自制过滤器，野外生存

筝筝美人 2026-05-11 01:15:09
0 跟贴 0
沙子过滤器，真的是太丝滑，这真的开眼了！

窦哥看世界 2026-05-12 09:28:38
4 跟贴 4
歼-35出口型亮相，第一个用户究竟是谁，改造生产三年不算慢

陈虎点兵 2026-05-10 21:37:40
1 跟贴 1
荷兰一医院违反汉坦病毒防疫规定，12名工作人员被隔离

观察者网 2026-05-13 10:13:19
1 跟贴 1
谭德塞：没有迹象显示汉坦病毒大规模暴发，但可能出现更多病例

观察者网 2026-05-13 08:46:11
6 跟贴 6
涉疫邮轮4名德国乘客回国接受隔离

界面新闻 2026-05-11 10:57:03
4 跟贴 4
某研究所博士自己手搓吸液装置，竟意外中毒，持续低烧、咳嗽

生物学霸 2026-05-11 18:15:23
0 跟贴 0
困在自己脑子里的人，连崩溃都是静音的

时光慢邮啊 2026-05-13 06:09:40
0 跟贴 0
撤离汉坦病毒爆发邮轮的乘客去了哪里？

逍遥论经 2026-05-13 09:43:05
4 跟贴 4
烧烤店将排烟管对隔壁直吹邻居提议自费帮其改造遭拒店主：他说不想让我占地

荔枝新闻 2026-05-13 04:35:09
349 跟贴 349
52岁雪姨王琳晒隔离日常，头发凌乱遮脸表情惊

心灵的触动a 2026-05-13 01:25:03
1 跟贴 1
中方对无核武国家鼓吹拥核言论表示关切

环球网资讯 2026-05-13 07:54:25
12546 跟贴 12546
伊朗拒绝美国谈判方案，最终结果却是确定的！#伊朗＃美国

雨果说 2026-05-11 08:53:08
1 跟贴 1
谁有钱，谁就该享有特权！如果我不服这个规则，该不该被人骂？

白话频道 2026-05-12 10:37:26
56 跟贴 56
对付小人：要用最阴的方式，最狠的手段

职场资深秘书 2026-05-13 19:13:02
0 跟贴 0
突然爆火！湖北37岁小伙吹气球，半个月赚了60万！

大风新闻 2026-05-12 21:05:08
2612 跟贴 2612
2026年哈尔滨暖气片厂家推荐，本地专业团队更安心

采暖锐评 2026-05-13 10:55:48
0 跟贴 0
U17国足胜卡塔尔惊险晋级亚洲杯淘汰赛，中国足球时隔21年重返世界大赛

文汇报 2026-05-13 07:48:10
1737 跟贴 1737
法国新法落地：归还 “260万被抢文物”有多艰难？｜重建现场

新京报动新闻 2026-05-11 01:46:32
904 跟贴 904
4月汽车销量前十名仅剩一款燃油车！麦肯锡：燃油车中短期内在中国市场不会快速退出历史舞台

每日经济新闻 2026-05-13 16:52:04
2431 跟贴 2431
张艺谋没想到，请了一堆流量老戏骨，结果被12岁的小丫头抢尽风头

温心娱乐1 2026-05-13 18:16:39
1 跟贴 1
九寨沟将实行“双向检票”？工作人员：出园检票并非新政策，一直严禁沟内住宿

上游新闻 2026-05-11 15:40:24
2879 跟贴 2879
没人敢说？我说！一些工地摆摊“善人”，正用流量砸底层人饭碗

垛垛糖 2026-05-13 19:32:05
0 跟贴 0
市场监管总局：严查算法违规乱象

央视新闻 2026-05-13 17:52:30
0 跟贴 0
老实人，待在社会底层，会被吃干抹净

职场资深秘书 2026-05-13 18:35:34
1 跟贴 1
豆包收费了！大模型将告别免费时代？有何考量？

大象新闻 2026-05-13 10:26:14
0 跟贴 0
2026款海鸥提供市区领航选择权 10万内搞定刚需用户不嫌贵

每日侃车 2026-05-13 11:03:45
3 跟贴 3
射程超过35000公里，俄军方：可经南极至美国境内目标的“世界上最强大导弹”试射成功

红星新闻 2026-05-13 13:21:19
1 跟贴 1
被曝强制员工体检前吃排铅药十天后，超威一子公司因未按规定组织职业健康检查等被罚款25万元

大风新闻 2026-05-13 17:07:16
218 跟贴 218
女游客玩瀑布秋千身亡续：业内人士称国内近百个荡绳类项目，“真正走完特检流程、拿到合法证件的，一个都没有”

芒果都市 2026-05-13 16:44:51
0 跟贴 0

英伟达扫货！鸿海全光CPO交换机“一机不剩” 出货预期同步上调

英伟达扫货！鸿海全光CPO交换机“一机不剩” 出货预期同步上调

财联社

2026-05-13 12:18:10

太意外！央视硬刚国际足联：世界杯天价泡沫，在中国彻底碎了

太意外！央视硬刚国际足联：世界杯天价泡沫，在中国彻底碎了

魏家东

2026-05-11 09:42:19

著名演员在沪病逝，经典作品在电视黄金时段连续播放多年，网友：小时候天天听

著名演员在沪病逝，经典作品在电视黄金时段连续播放多年，网友：小时候天天听

上观新闻

2026-05-13 11:38:21

死亡之瞳！文班27+17+5+3帽创9纪录：比肩邓肯詹姆斯笑傲天王山

死亡之瞳！文班27+17+5+3帽创9纪录：比肩邓肯詹姆斯笑傲天王山

醉卧浮生

2026-05-13 10:40:11

2015年那次如果没刹住车，今天的中国制造会是啥样？

2015年那次如果没刹住车，今天的中国制造会是啥样？

趣味萌宠的日常

2026-05-08 12:31:25

包工头与做饭大姐相好5年,工程完工想走,谁曾想大姐竟不好惹

包工头与做饭大姐相好5年,工程完工想走,谁曾想大姐竟不好惹

磊子讲史

2025-07-02 13:45:23

快讯！日本新消息，跟中国有关！

快讯！日本新消息，跟中国有关！

达文西看世界

2026-05-13 08:23:29

公安紧急提醒！换身份证别只拿证，漏掉这步，办事全受阻

公安紧急提醒！换身份证别只拿证，漏掉这步，办事全受阻

老特有话说

2026-05-13 17:57:05

售90.99万元起，新款路虎卫士130上市

售90.99万元起，新款路虎卫士130上市

IT之家

2026-05-13 15:51:29

一季度营收暴增684%，英伟达持仓股盘前拉升涨超13%

一季度营收暴增684%，英伟达持仓股盘前拉升涨超13%

财闻

2026-05-13 19:49:37

比亚迪“铁疙瘩”革命：74零件合一，成本降5000，闪充76度引争议

比亚迪“铁疙瘩”革命：74零件合一，成本降5000，闪充76度引争议

沙雕小琳琳

2026-05-13 05:47:51

尼日利亚一女星用500个面包制成礼服惊艳亮相电影奖现场撕下一块大快朵颐

尼日利亚一女星用500个面包制成礼服惊艳亮相电影奖现场撕下一块大快朵颐

快科技

2026-05-12 15:00:24

你爱用的这种枕头，正悄悄堵住脑血管！家里有的赶紧换

你爱用的这种枕头，正悄悄堵住脑血管！家里有的赶紧换

奇妙的本草

2026-05-11 12:01:01

西甲下赛季欧冠席位确定：巴萨、皇马、黄潜、马竞、贝蒂斯

西甲下赛季欧冠席位确定：巴萨、皇马、黄潜、马竞、贝蒂斯

懂球帝

2026-05-13 04:33:27

何穗母亲节首晒儿子合照，公开儿子小名，源自陈伟霆

何穗母亲节首晒儿子合照，公开儿子小名，源自陈伟霆

一窥究竟

2026-05-12 14:45:43

腾讯控股：一季度净利润同比增长21%至581亿元

腾讯控股：一季度净利润同比增长21%至581亿元

界面新闻

2026-05-13 16:35:03

大反转！中国人赴乌参战被俘，外交部最新回应来了，结局意想不到

大反转！中国人赴乌参战被俘，外交部最新回应来了，结局意想不到

井普椿的独白

2026-05-13 13:54:42

匈牙利政坛变天，新总理刚当选，便强调一点：不“亲”中国！

匈牙利政坛变天，新总理刚当选，便强调一点：不“亲”中国！

猪猪爱影视

2026-05-12 17:52:49

世乒赛结束后，国乒“宿敌”锐评孙颖莎，句句直戳张本美和心窝

世乒赛结束后，国乒“宿敌”锐评孙颖莎，句句直戳张本美和心窝

阿讯说天下

2026-05-13 14:30:45

贝索斯花了7000万，让桑切斯在Met Gala出尽风头，梅根没收到邀请

贝索斯花了7000万，让桑切斯在Met Gala出尽风头，梅根没收到邀请

小书生吃瓜

2026-05-11 15:36:21

报错免疫体

一名在需求评审和数据异常中反复横跳的产品运营。

2686文章数 26关注度

往期回顾全部

科技要闻

腾讯一季度营收1964.6亿元同比增9%

头条要闻

出租车司机被两老外"拐跑"：3万车费从海南开到黑龙江

头条要闻

出租车司机被两老外"拐跑"：3万车费从海南开到黑龙江

体育要闻

14年半，74万，何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉，网友为李晨鸣不平

财经要闻

盘中最高4041.99点！创业板创历史新高

汽车要闻

C级纯电轿跑吉利银河"TT"申报图来了

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

教育

亲子

时尚

家居

这也有怀旧服？《守望先锋》经典版2016限时活动上线

教育要闻

新课标・新教材・新课堂｜5月15日苏州姑苏公益师训会暨小学语文跨区域教学研讨即将启幕

亲子要闻

宝蓝在公园玩，地垫上的字母都消失了，我们一起帮宝蓝找找吧~

老钱风失宠了？这个风格突然爆火，夏天穿太高级了！

家居要闻

内在自叙，无域有方

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版