网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

我们如何让失控的AI代理乖乖听话

2026-05-23 02:45:24　来源: 碳基打工人

北京举报

0

分享至

做聊天机器人容易，做能审计企业基础设施和财务数据的AI代理，是另一回事。

SentinelOps创始人分享了他的实战经验：早期测试时，代理会自信地给出糟糕建议，编造监管框架，有时只需要"是"或"否"的答案，却输出大段废话。他意识到，要把大语言模型放进治理流程的关键路径，不能只是"聊天"，必须给它穿上紧身衣。

第一道枷锁：强制JSON输出。开发者常犯的错误是让LLM自由决定输出格式。他们重写了系统提示词，强制代理填充特定字段：决策摘要、风险等级、财务影响估算、治理严重程度、是否需要升级、运营建议。如果检测到合规问题，必须标记escalationRequired: true。前端不再渲染聊天气泡，而是显示仪表盘卡片——治理风险高时变红。

第二道防线：Hindsight记忆 grounding。为防止代理编造合规政策，系统会在决策前搜索组织历史。用户询问HIPAA数据处理时，Hindsight会注入真实的历史审计记录。代理在读取公司规则手册时，就无法乱来。

第三层路由：CascadeFlow安全网。依赖单一模型仍有风险。当查询触发高敏感度关键词正则匹配（如PHI、financial、breach），系统强制将请求路由至最强、最受控的推理模型，完全绕过便宜但更易出错的模型。

这套组合拳的结果是：代理从"话痨顾问"变成"结构化决策引擎"，输出可被程序解析、验证、拦截——而不是被人类勉强阅读后猜测其意图。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

前DeepMind华人研究员离职喊话：AI行业所有人都搞错了方向

新智元 2026-05-24 19:04:11
2 跟贴 2
特斯拉中国将FSD更名为特斯拉辅助驾驶

每日经济新闻 2026-05-24 13:00:06
1043 跟贴 1043

19岁，常青藤辍学，这群中国年轻人重构了AI记忆

量子位 2026-04-04 16:21:02
0 跟贴 0

8小时狂揽15K美金！Claude Code屠榜黑客马拉松，开源神器爆15万星

新智元 2026-05-24 19:03:59
11 跟贴 11
卷到今天，Agent的含金量还在提升丨AIGC2026圆桌论坛

量子位 2026-05-24 18:50:06
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0

最简单的机器人集群竟能像凝胶一样分裂重组，还涌现出机械智能

DeepTech深科技 2026-05-24 18:36:16
0 跟贴 0
以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0

下集审计哥去市政厅考核公共服务人员员工请来警局队长

业健影视 2026-05-23 12:12:39
1 跟贴 1
国外审计哥给狱警普法，他能以德服人吗

黑不拉影视 2026-05-23 15:59:16
0 跟贴 0
游戏服务器崩溃90%请求靠缓存救场，我们走了多少弯路

像素与芯片 2026-05-25 02:57:42
0 跟贴 0
大模型API的大众点评来了：7×24小时实测，毫秒级延迟智能路由

量子位 2026-02-02 11:48:44
2 跟贴 2
金通灵案启示录：上市公司造假，会计师被判刑冤不冤？

深水财经社 2026-05-23 15:16:05
1 跟贴 1
@找工作的你，一批岗位上新！快码住→

上海杨浦 2026-05-24 17:36:20
0 跟贴 0
MoE路由拥有「记忆」：RMS-MoE用检索记忆协同实现更高效专家调度

机器之心Pro 2026-05-09 09:37:42
0 跟贴 0
2026咨询工程师（投资）报考人数下滑！工程咨询行业，正在悄悄换血

新浪财经 2026-05-24 13:06:49
2 跟贴 2
河南省总会计师协会卫生健康分会业财融合数智化建设研讨会在郑州成功举办

大河健康 2026-05-24 15:26:57
0 跟贴 0
白纸模型助瓷砖严丝合缝

超市王小小 2026-05-21 21:35:19
4 跟贴 4
申惠善新剧遭职场丑闻曝光，男主挺身护爱

浅遇时光 2026-05-25 01:13:50
0 跟贴 0
神舟二十三号载人飞船发射取得圆满成功

央视新闻客户端 2026-05-24 23:31:08
4346 跟贴 4346
2014年前退休人员养老金全解：发放规则、上涨标准、补发一次

上易新鲜事 2026-05-22 00:43:05
0 跟贴 0
对手防守梅西时动手，梅西不耐烦，利用规则让对手吃黄牌！

欢乐梦工厂 2026-05-24 09:51:44
1 跟贴 1
一分钟测试你的死亡风险，你能得几分？打在评论区！让家人也试试

曾博士 2026-05-23 19:02:00
32 跟贴 32
白车误闯红灯？老司机应急技巧+路口判罚规则，新手必看！

小狗漫说 2026-05-20 10:19:11
0 跟贴 0
小伙说必须要支持张雪机车，因为他没有把用户当脑残粉

八颗奇异果 2026-05-23 00:39:11
0 跟贴 0
浙江男子几口下肚，痛到崩溃！“当时觉得特别鲜”，医生：别拿命赌，有毒，没有特效解药

环球网资讯 2026-05-24 07:11:28
847 跟贴 847
仅因店员疏忽漏放吸管，女子多次扔吸管砸店员：惹到我，算你倒霉

星视频 2026-05-24 12:21:15
258 跟贴 258
从早忙到晚，一天50000斤都不够卖！杭州这口酸甜，不少人已安排！今年品质特别好

环球网资讯 2026-05-24 15:00:44
147 跟贴 147
投喂狮子时观光车车门突然打开！探访八达岭野生动物园：猛兽区投喂项目已关闭，同类观光车停运

红星新闻 2026-05-24 18:07:17
1159 跟贴 1159
硬核啊，用这样的设备操作模型直升机！

长安一片月 2026-05-20 15:03:35
18 跟贴 18
沙船卸沙真是风险很高的工作

浅梦看世界 2026-05-24 15:00:46
1 跟贴 1
进口蛋白粉先涨价再优惠淘宝618大促比日常价格还高

大风新闻 2026-05-23 17:12:31
316 跟贴 316
霹雳15吓坏印度！电视台专门访谈，专家直呼这破坏了空战规则

晓哲舞蹈课 2026-05-23 14:15:07
24 跟贴 24
SFMC数据扩展设计：四个前置决策避免踩坑

像素与芯片 2026-05-25 02:39:30
0 跟贴 0
集中爆发！宁波多地惊现罕见景观！有人半夜11点刷到立马起床出发，连夜奔赴

上观新闻 2026-05-23 11:46:10
817 跟贴 817
水蜜桃饮品中水蜜桃添加量0.01克，康师傅回应称符合标准

南方都市报 2026-05-21 19:55:57
1157 跟贴 1157
乌称俄疑似使用“榛树”导弹打击基辅俄暂未回应

环球网资讯 2026-05-24 11:26:23
745 跟贴 745
春秋曲沃代翼揭秘：利益主义者如何制定规则？山西历史底蕴震撼世人！

漫川舟船 2026-05-23 14:11:37
0 跟贴 0
组装发动机模型

制造科技 2026-05-22 13:06:53
0 跟贴 0
小鹏GX上市12小时大定破2.48万家庭用户该怎么选

可爱大王呼 2026-05-24 02:16:31
0 跟贴 0

国民党内部乱象：郑丽文“团结”闹剧必败

国民党内部乱象：郑丽文“团结”闹剧必败

烽火瞭望者

2026-05-24 06:23:24

留神峪救援最新进展：发现两条隐藏巷道，此前企业人员提供“阴阳图纸”使救援难度大大提升

留神峪救援最新进展：发现两条隐藏巷道，此前企业人员提供“阴阳图纸”使救援难度大大提升

浙江之声

2026-05-24 17:34:50

郑丽文称台湾是“国家”，反对统一？特朗普：我要跟赖清德谈一谈

郑丽文称台湾是“国家”，反对统一？特朗普：我要跟赖清德谈一谈

锅锅爱历史

2026-05-23 20:49:25

资本市场，利好！美联储，风向突变！

资本市场，利好！美联储，风向突变！

新浪财经

2026-05-24 14:47:20

两性关系：男性过了75，不管跟谁处，牢记4句话，余生少心酸

两性关系：男性过了75，不管跟谁处，牢记4句话，余生少心酸

匹夫来搞笑

2026-05-14 00:32:20

约会时女人说去厕所，其实是在给你两个暗示，听懂的都不是凡人

约会时女人说去厕所，其实是在给你两个暗示，听懂的都不是凡人

心理观察局

2026-05-18 09:11:14

黎家盈带20多封信赴太空，丈夫放弃香港事业：家人付出有多大

黎家盈带20多封信赴太空，丈夫放弃香港事业：家人付出有多大

米果说识

2026-05-24 19:17:35

成英超名梗了，阿森纳球迷在末战再度玩起“水瓶梗”

成英超名梗了，阿森纳球迷在末战再度玩起“水瓶梗”

懂球帝

2026-05-24 23:18:25

2026戛纳收官：金棕榈多奖项频现“双黄蛋”，着装“禁令”下黑色风暴席卷红毯

2026戛纳收官：金棕榈多奖项频现“双黄蛋”，着装“禁令”下黑色风暴席卷红毯

福布斯

2026-05-24 17:55:36

艾滋病新增130万！很多人中招很冤枉！在外“5不碰”一定要记死

艾滋病新增130万！很多人中招很冤枉！在外“5不碰”一定要记死

今朝牛马

2025-12-31 19:31:04

小菲湾湾送玥儿画室上课箖箖出门找朋友玩！孩子画作透露心理状

小菲湾湾送玥儿画室上课箖箖出门找朋友玩！孩子画作透露心理状

阿策聊实事

2026-05-24 17:29:23

“碳水脸”引争议，网友：令人不适的网络词！

“碳水脸”引争议，网友：令人不适的网络词！

中国日报

2026-05-21 15:28:00

全球有多少城市能撑得起14日游？要被网友们的评论笑死了！

全球有多少城市能撑得起14日游？要被网友们的评论笑死了！

另子维爱读史

2026-05-24 21:12:23

5月24日俄乌：俄罗斯“榛树”导弹射向基辅

5月24日俄乌：俄罗斯“榛树”导弹射向基辅

山河路口

2026-05-24 18:33:00

面对大批农民饿死，他竟说：他们故意饿死自己，好让我下不了台

面对大批农民饿死，他竟说：他们故意饿死自己，好让我下不了台

山间听雨

2026-05-22 17:46:37

甄子丹为岳母徐莉君庆68岁生日，岳母是真年轻，看着比女儿还气质

甄子丹为岳母徐莉君庆68岁生日，岳母是真年轻，看着比女儿还气质

大江

2026-05-19 09:10:28

黄蜂国王猛龙试训泽维尔大学大五锋线，他的得分能力还是不错的？

黄蜂国王猛龙试训泽维尔大学大五锋线，他的得分能力还是不错的？

稻谷与小麦

2026-05-25 01:45:07

中方大手一挥，再抛410亿美债，特朗普涉台措辞变了，信号不寻常

中方大手一挥，再抛410亿美债，特朗普涉台措辞变了，信号不寻常

小嵩

2026-05-25 00:17:24

申花球迷意难平！不止因为1-2惜败新鹏城，更多在于以下这五点！

申花球迷意难平！不止因为1-2惜败新鹏城，更多在于以下这五点！

田先生篮球

2026-05-24 22:31:01

近10年崩得最狠的专业：从年薪几十万到月薪两千五！

近10年崩得最狠的专业：从年薪几十万到月薪两千五！

灯锦年

2026-04-21 13:28:31

碳基打工人

坐标北京，靠咖啡续命，靠小红书下饭的普通人类。

3662文章数 42关注度

往期回顾全部

科技要闻

我戴着摄像头上班，正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百我们一直劝他别干了

体育要闻

唐斯发牌，大头逆袭：骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万！代言和作品遭抵制

财经要闻

什么情况下，本轮AI大行情会结束？

汽车要闻

国民家轿再上新帝豪向上系列限时5.59万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

家居

时尚

手机

公开课

本地新闻

用云锦的方式，打开江苏南京

家居要闻

低调传承温润沉静

《低智商犯罪》一半惊喜，一半可惜

手机要闻

为什么建议大家赶紧换新机？五点原因，望周知！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版