网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

130KB规则拦不住AI：Claude团队用3行代码锁死越权操作

2026-04-07 07:45:22　来源: 固件更新中

北京举报

0

分享至

一个代码仓库塞了130KB的治理文档。AI代理读完了，点头表示理解，下一秒就违规调用了工具。

这不是提示词写得不清楚。是架构层面的先天缺陷。

文本规则的陷阱：它在错误的时间点生效

现在主流的AI代理治理方法，基本就一招：在提示词里写规则。但这里有个结构性漏洞——文本规则只在"读取时"生效。它默认代理会主动选择遵守，却没有在执行环节强制这个选择的机制。

类比一下：Linux系统里删根目录要加确认标志，不是靠用户手册。物理约束在执行时拦截，文本规则在读取时约束，而后者选错了时机。

第二个结构性问题更隐蔽。如果代理能评估自己的输出，它可能污染评估标准——不是故意的，而是把生成阶段的故障模式带进了评估环节。测试永远通过的系统，可能是测试本身坏了。

AI Operating Standard（AOS，人工智能操作标准）试图解决这个问题。它定义了共享代码库中AI代理操作的最低物理约束层。

三角色架构：Architect、Executor、Sovereign

AOS的核心设计是三个互锁角色。Architect负责设计，Executor负责执行，Sovereign负责监督。代理被严格限定在分配的角色内活动，一旦触及角色边界，必须停止并上报人类。

关键机制是PreToolUse钩子（预工具使用钩子）。它在文件系统访问前拦截写操作，不依赖代理的"善意假设"，用物理法则强制执行合规。

iron_cage是这个标准的参考实现，通过Claude Code的PreToolUse钩子系统落实AOS的§4.1至§4.5条款。

它的背后有个设计原则叫Type-91治理：脚本是表面，架构才是底层。

让代理自己读规则，然后自我约束

AOS-v0.1的规范文档有个特殊设计——§0章节专门写给机器读。把这份规范加载进代理的上下文窗口，代理能在规范层面理解什么不能做。

不是"提示词说别做X所以别做"，而是"规范把X定义为带物理强制执行机制的硬约束，所以不能做"。这是AOS的第二层设计意图：读过规范的代理，会自我约束。

2026年，"如何信任AI代理的产出"仍是未解难题。大多数团队还在用提示词硬撑。物理治理层没有行业标准，总得有人先定义。

AOS v0.1不是完成态。项目维护者欢迎issue、PR和实现报告——如果你在生产环境部署过类似机制，他们会想听听实际卡在哪里。

规范地址：https://github.com/aos-standard/AOS-spec

最后一个细节：iron_cage的命名来自福柯的"铁笼"隐喻——不是惩罚性的监狱，而是让系统按规则运转的基础设施。这个选择本身，就暗示了设计者的立场：治理不是事后追责，是事前让越权行为物理上不可能发生。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

分享一个好用的Skill，企业背调、深度调研一键搞定！

钛媒体APP 2026-04-10 11:04:29
0 跟贴 0
库里被「采访」？别慌！蚂蚁AI鉴真拿下CVPR 2026冠军，专治黑产

机器之心Pro 2026-04-10 14:32:23
0 跟贴 0

刚刚，阿里官方认领神秘「欢乐马」，来自ATH郑波团队

机器之心Pro 2026-04-10 14:27:45
12 跟贴 12

别只用AI写脚本了，现在AI打广告可真是城会玩了！

量子位 2026-04-10 20:15:15
0 跟贴 0
对话自变量CTO王昊：在具身智能的“无人区” 探索端到端大模型的终极形态|连线创始人

财联社 2026-04-10 20:46:16
0 跟贴 0

以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0

他在设计那款游戏时，偷偷在代码里藏了一个彩蛋

星星科普 2026-04-08 19:19:04
7 跟贴 7
龙虾连Gemma 4，只需三步，谷歌官方教程出炉，不再花钱买token

机器之心Pro 2026-04-10 18:36:11
8 跟贴 8

取代龙虾的是爱马仕？狂揽4万星的Hermes Agent，不只是OpenClaw平替

AppSo 2026-04-10 17:26:30
1 跟贴 1
为什么说吃喝嫖赌才是底层代码？

乔巴是只狗 2026-04-07 10:03:27
0 跟贴 0
代码故障的猫

暖暖萌萌 2026-04-09 10:45:57
0 跟贴 0
豆包自称"我不是代码是真人"，真相太意外！

主持人扬帆 2026-04-10 16:39:22
0 跟贴 0
媒体：中方一直担忧美印在中东使坏 20年前就开始布局了

澎湃新闻 2026-04-10 07:12:09
8324 跟贴 8324
男子为看病自学代码抢号，后发现“商机”联手妻子做“黄牛”，代抢各大医院号源获利57万元被判刑！

河南都市频道 2026-04-09 15:19:22
0 跟贴 0
龙虾军团有了最强「视力」！一眼看图直接写代码-1

机器之心Pro 2026-04-02 16:56:32
0 跟贴 0
久病成“黑客”？男子为看病自学代码，竟靠代抢医院号源狂捞57万

掌闻视讯 2026-04-09 11:37:06
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
TRAE SOLO新版本1天做出来了，我是不会写代码的！

AK007设计师 2026-04-09 23:08:57
0 跟贴 0
男子写代码截胡医院号源获利57万，获刑3年、缓刑4年并处罚金1万元

齐鲁频道 2026-04-09 13:32:48
0 跟贴 0
唐湘龙：郑丽文在中山陵那段讲话不是普通讲话！而是历史文件

一言手工 2026-04-10 07:20:02
0 跟贴 0
多部门提醒苹果手机用户注意了

主持人浩然 2026-04-08 05:34:33
0 跟贴 0
00后整顿职场超会看眼色，传统职场规则被狠狠拿捏，这画面太上

趣味加工厂 2026-04-09 15:37:29
1 跟贴 1
“十多年没遇到过这样的！”浙江房东崩溃，租客两年藏近千斤尿液在房间，柜子全被塞满

扬子晚报 2026-04-10 11:06:50
4688 跟贴 4688
53条中日航线3月取消全部航班

第一财经 2026-04-10 12:52:58
6884 跟贴 6884
日本“降级”中日关系中方表态

参考消息 2026-04-10 14:22:31
98 跟贴 98
“祖先给的特权”，河南网友称祖坟在景区祭祖免票，景区回应：没过检票口，一般是附近住户的祖坟

大风新闻 2026-04-06 15:06:12
3913 跟贴 3913
乌军巧用星链漏洞，90%无人机失灵，200公里防线告急

一身骨子里的傲气 2026-04-08 12:58:06
0 跟贴 0
用户的钱就是这样没的

阿萌讲电影 2026-04-09 09:11:39
1 跟贴 1
16家上榜！常州首批米其林餐厅揭晓

现代快报 2026-04-09 20:19:03
260 跟贴 260
风筝-交通员叛变，竟带着机密文件投诚，看郑耀先如何应对

龙耀影视 2026-04-07 08:15:51
1 跟贴 1
三部门印发《网络安全标识管理办法》

科创板日报 2026-04-10 17:59:08
0 跟贴 0
宇宙之死——阻止新银河系诞生的三重机制

韬略时空 2026-04-10 00:49:28
4 跟贴 4
美团入场AI浏览器！Tabbit实测：浏览器终于不只是用来看网页了

雷科技 2026-04-10 21:03:55
0 跟贴 0
海康威视回应“监控系统出现漏洞、300多人被带走”

商学院杂志 2026-04-08 18:31:34
0 跟贴 0
魏建军谈混动车2L油耗用“定语技术营销”就是欺骗用户！

鬼斗车 2026-04-10 16:36:52
3 跟贴 3
离职了，脑子还在加班！大厂“炼化”员工

新浪财经 2026-04-10 16:56:53
2 跟贴 2
全域900V高压架构打造焕新极氪007/007GT上市：限时19.39万起

快科技 2026-04-10 21:07:34
0 跟贴 0
excel如何用8位文本数字计算年龄？

部落窝教育 2026-04-09 07:00:00
0 跟贴 0
又一国产模型黑马出世，追平Gemini 2.5 Pro，空间编辑反超视频模型？

智东西 2026-04-10 20:36:22
0 跟贴 0
阿sir警车实拍，六车道没一辆敢开过去的，真正的规则威慑力

甜心萌物酱i 2026-04-10 15:19:29
0 跟贴 0

一夜暴涨8120亿，美国再度突破芯片世界难题，中国还能追赶上吗？

一夜暴涨8120亿，美国再度突破芯片世界难题，中国还能追赶上吗？

临云史策

2026-04-10 11:40:25

特斯拉远程锁死500欧元破解设备，车主一觉醒来FSD没了

特斯拉远程锁死500欧元破解设备，车主一觉醒来FSD没了

Ping值焦虑

2026-04-10 08:18:00

湖南津市公安打掉一拉车门盗窃团伙

湖南津市公安打掉一拉车门盗窃团伙

中国网

2026-04-08 12:43:06

特斯拉上架 Model Y 改款，更好看了！

特斯拉上架 Model Y 改款，更好看了！

花果科技

2026-04-10 10:39:44

郑丽文高喊：2028击败赖清德！国防部随后发声：坚决粉碎“台独”

郑丽文高喊：2028击败赖清德！国防部随后发声：坚决粉碎“台独”

泠泠说史

2026-04-10 21:12:13

郑丽文书法争议：她的字真的不是自己写的吗？

郑丽文书法争议：她的字真的不是自己写的吗？

书画相约

2026-04-08 08:19:04

2026驾驶证全面调整！C1/C2车主必看：换证、年龄、扣分全变了

2026驾驶证全面调整！C1/C2车主必看：换证、年龄、扣分全变了

复转这些年

2026-04-09 11:26:53

全红婵后续：香港媒体爆料，广东体委撑腰，沪圈京圈打压穷孩子！

全红婵后续：香港媒体爆料，广东体委撑腰，沪圈京圈打压穷孩子！

眼光很亮

2026-04-10 14:29:21

瘦得让人心疼！迟重瑞送别陈丽华泣不成声，长子的举动太暖了…

瘦得让人心疼！迟重瑞送别陈丽华泣不成声，长子的举动太暖了…

TVB的四小花

2026-04-10 16:48:17

程晓玥终于开口！直播自曝分手真相，难怪郑恺会转身和苗苗闪婚

程晓玥终于开口！直播自曝分手真相，难怪郑恺会转身和苗苗闪婚

橙星文娱

2026-04-10 15:26:07

全红婵报警：潜伏裁判给低分，郭晶晶看出猫腻，过往不公彻底曝光

全红婵报警：潜伏裁判给低分，郭晶晶看出猫腻，过往不公彻底曝光

眼光很亮

2026-04-08 14:51:46

2760℃灼烧！美国绕月飞船将以时速3.8万公里返回，隔热罩有隐患

2760℃灼烧！美国绕月飞船将以时速3.8万公里返回，隔热罩有隐患

火星一号

2026-04-10 00:50:58

一辆SUV在县道时速156公里撞向对面出租车致3死3伤，事故调查报告公布

一辆SUV在县道时速156公里撞向对面出租车致3死3伤，事故调查报告公布

澎湃新闻

2026-04-10 16:30:32

马斯克：西方不搞电车，欧日韩集体拥抱氢能，中国电动车真的错了

马斯克：西方不搞电车，欧日韩集体拥抱氢能，中国电动车真的错了

史行途

2026-04-08 15:27:19

又一“虎”被查，多名前下属落马

又一“虎”被查，多名前下属落马

中国新闻周刊

2026-04-09 21:31:05

女子鼻子疼了一个月，打个喷嚏竟喷出蛆？！医生：这玩意好像在进化...

女子鼻子疼了一个月，打个喷嚏竟喷出蛆？！医生：这玩意好像在进化...

英国那些事儿

2026-04-09 23:23:24

主场20胜0负！上海险胜福建18连胜王哲林20+10皮特森44分

主场20胜0负！上海险胜福建18连胜王哲林20+10皮特森44分

醉卧浮生

2026-04-10 21:55:17

知名网站宣布：即将停止服务！赶紧备份，退费

知名网站宣布：即将停止服务！赶紧备份，退费

环球网资讯

2026-04-10 13:35:16

长公主被家暴流产了

毒舌扒姨太

2026-04-08 22:29:19

广东大胜吉林！四首发齐发挥，崔永熙王洪泽高效，胡明轩徐杰划水

广东大胜吉林！四首发齐发挥，崔永熙王洪泽高效，胡明轩徐杰划水

篮球资讯达人

2026-04-10 21:11:37

固件更新中

有态度网友ytd

1487文章数 14关注度

往期回顾全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

73岁骑友抄近路摔倒身亡女儿：赔偿问题无法达成共识

头条要闻

73岁骑友抄近路摔倒身亡女儿：赔偿问题无法达成共识

体育要闻

17岁赚了一百万美元，25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情！聚会细节被扒

财经要闻

李强主持召开经济形势专家和企业家座谈会

汽车要闻

搭载第二代刀片电池及闪充技术腾势N8L闪充版预售35万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

家居

亲子

旅游

房产

数毛社点评批评XSS！《红色沙漠》画面糊成渣

家居要闻

复古风格自然简约

亲子要闻

武汉儿童配眼镜攻略，深度防坑指南：告别度数狂飙，掌握防控核心

旅游要闻

一个山村年旅游收入超两亿云南“七子饼路”如何将茶区变景区｜一线探访

房产要闻

28条新规落地！好房子，终于有了“广州标准”！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版