网易首页 > 网易号 > 正文 申请入驻

AWS把2个AI Agent藏了3年,运维发现后集体破防

0
分享至


2024年AWS re:Invent上,两个叫"Frontier Agent"的东西被塞进开发者视野时,台下反应很分裂——有人觉得又是PPT产品,有人连夜回去改架构。一年后,用上的团队和没用的团队,运维响应速度差了4倍。

这不是夸张。AWS内部把Security Agent和DevOps Agent的协同称为"AIOps的最低可行形态",但官方文档写得像机翻,Demo又太干净。真正跑通的生产环境,都在偷偷改配置。

本文基于AWS官方技术博客及Qiita社区Nana_777的实战部署记录,还原一个TODO应用从设计到事故响应的全流程。不聊概念,只聊怎么让两个Agent真的干起来活。

设计阶段:安全审查从"事后擦屁股"变成"事前拦路虎"

传统安全团队的噩梦节奏是:开发写完好几个月的代码,安全审计提一堆阻断性意见,项目延期,互相甩锅。Security Agent的第一刀砍在这里——设计文档阶段。

具体机制很直白:安全团队在AWS控制台预置规则库,包括允许的授权框架、日志标准、数据访问策略。开发提交设计文档后,Agent自动比对,违规点直接标红。

Nana_777的测试案例里,一个TODO应用的设计文档想直接用本地SQLite存用户数据。Agent的反馈是:「检测到PII(个人身份信息)存储未加密,与组织策略冲突:数据层必须使用AWS KMS托管密钥的Amazon RDS或DynamoDB。」

开发还没写一行代码,就已经知道这架构过不了安全评审。

更隐蔽的价值在于规则库的版本控制。安全策略更新后,历史设计文档会被重新扫描,潜在风险自动浮出。这在金融、医疗行业是刚需——监管要求变一次,人工复盘成本以周计算。

但这里有个坑:规则写得太严,开发会绕过Agent直接写代码;写得太松,又失去意义。AWS建议的折中是"分级阻断"——高危规则强制拦截,中低危仅预警。实际部署中,多数团队前三个月都在调这条线。

编码阶段:PR评论里的"安全幽灵"

Security Agent的第二战场是GitHub Pull Request。每次提交触发自动扫描, findings直接以评论形式出现在PR页面——开发不用切工具,安全反馈嵌入现有工作流。

扫描维度分两层:组织自定义规则(如"禁止硬编码密钥")和通用漏洞库(OWASP Top 10、CWE常见缺陷)。Nana_777的TODO应用测试里,Agent捕获了一个典型问题:

「第47行:用户输入直接拼接入SQL查询,存在注入风险。建议改用参数化查询。参考修复代码:[代码块]」


这种反馈的颗粒度很关键。不是笼统的"有漏洞",而是定位到行、给出修复方案、甚至提供可复制的代码片段。开发者的接受度因此高很多——修复成本从"查文档+试错"降到"复制粘贴+验证"。

但Agent也会误报。Nana_777记录了一个案例:某ORM框架的链式调用被误判为"潜在SQL注入",因为静态分析无法追踪运行时行为。处理方式是人工标记为"误报",该模式进入白名单,后续同类提交不再触发。

白名单机制的设计暴露了一个产品哲学:Agent不是替代人,而是把人的判断固化成规则。 初期投入的人力越多,后期自动化率越高。这和传统SAST工具(静态应用安全测试)的"配置完就不管"逻辑完全不同。

渗透测试:让Agent自己攻击自己

Security Agent的第三个功能最激进——自主执行多阶段攻击模拟。不是跑一遍自动化扫描就完事,而是像真人红队一样,尝试漏洞组合利用。

触发条件是按需或定时。Agent会生成攻击路径:比如"先通过IDOR(不安全的直接对象引用)获取他人TODO列表,再利用XSS窃取管理员Cookie,最后提权访问后台"。如果任何环节成功,自动在GitHub创建PR,包含影响分析、复现步骤、修复代码。

Nana_777的测试里,Agent发现了一个真实漏洞:TODO应用的分享功能未验证权限,通过修改URL参数可访问任意用户的任务列表。生成的PR里,修复方案是在分享接口增加用户ID校验,代码改动3行。

这个功能的价值在于覆盖DAST(动态应用安全测试)和SAST的盲区。传统扫描工具看的是单点漏洞,Agent模拟的是攻击者的思维链——"拿到这个权限后,还能做什么?"

但成本也很明显:一次完整攻击模拟的耗时在10-30分钟,复杂应用可能更久。AWS的默认配额是每月100次,超出需申请扩容。多数团队的实际用法是:核心路径每次发布前跑一遍,边缘功能抽样跑。

事故响应:DevOps Agent的"全链路溯源"

Security Agent管的是"别出事",DevOps Agent管的是"出事之后"。两者的衔接点在于:当监控告警触发时,DevOps Agent能否快速定位根因,甚至预判同类风险。

启动条件是Amazon CloudWatch、Datadog、New Relic等工具的告警,或GitHub Issues、Jira工单。Agent的第一动作是关联三类数据:监控指标的时间序列异常、代码变更历史、CI/CD部署记录。

Nana_777设计了一个典型场景:TODO应用的API延迟突然飙升。DevOps Agent的推理链如下:

「CloudWatch显示/usertodos接口P99延迟从120ms升至4.2s,时间戳14:23。GitHub记录显示14:15合并了PR #234,内容是为TODO列表增加'按创建时间排序'功能。该PR引入了N+1查询——每次获取用户TODO时,额外查询了创建者信息,未做批量优化。建议回滚PR #234,或增加数据库索引。」


整个过程从告警到根因定位,耗时约90秒。人工排查通常需要15-30分钟,且容易遗漏代码变更与监控指标的关联。

更深层的价值是知识沉淀。Agent会把每次事故的根因、修复方案、关联代码,写入可检索的知识库。下次遇到相似指标模式,自动提示历史案例。这在人员流动频繁的团队里,相当于留住了"老运维"的经验。

双Agent协同:AIOps的"最小闭环"

单独看两个Agent,Security Agent是"左移"(Shift Left)的安全工具,DevOps Agent是"右移"(Shift Right)的运维工具。但AWS的设计意图是让它们共享上下文,形成闭环。

具体协同场景:Security Agent在渗透测试中发现的高危漏洞,自动同步为DevOps Agent的监控规则。如果该漏洞被利用,告警优先级直接置顶,且附带攻击路径和修复代码。

反过来,DevOps Agent在事故溯源中发现的配置缺陷(如过度宽松的IAM策略),自动反馈给Security Agent的规则库,下次设计审查时拦截同类问题。

Nana_777的部署记录里,这种协同触发过一次真实案例:Security Agent在攻击模拟中发现某API未做速率限制,标记为中危。DevOps Agent据此增加了异常流量监控。两周后,该监控捕获到一次撞库攻击,自动触发了WAF规则更新。

从漏洞发现到监控加固再到攻击拦截,全程无人工介入。 这是AIOps的朴素定义:不是AI替代人做决策,而是AI把人的决策链条自动化。

但落地门槛依然存在。GitHub集成、AWS多服务权限配置、Agent Space的初始调优,Nana_777的完整部署耗时约8小时。对于没有AWS原生工具链的团队,迁移成本更高。

另一个隐性成本是"Agent疲劳"——两个Agent每天可能产生数十条 findings,开发者和运维需要建立分级响应机制,否则重要信息会被噪声淹没。AWS提供了置信度评分和自定义过滤,但阈值设定需要团队自己摸索。

目前AWS Frontier Agents仍处于预览阶段(Preview),免费额度 generous,但未来定价未定。Nana_777的测试环境每月消耗约200次Security Agent调用、50次DevOps Agent调查,按现有云资源成本估算,规模化后月费可能在数百到数千美元区间。

对于25-40人的技术团队,这个成本是否值得?取决于现有安全运维的人力投入。如果已有专职安全工程师和On-call运维,Agent的价值是提效;如果团队身兼数职,Agent可能是唯一能覆盖全生命周期的方案。

AWS的产品经理在re:Invent的闭门交流中提到一个数据:早期采用者的事故平均恢复时间(MTTR)从4.2小时降至23分钟。但这个数字的前提是"正确配置",而正确配置的前提是"有人愿意花8小时踩一遍坑"。

你的团队现在花在安全审查和事故复盘上的时间,够买几个8小时?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苏提达王后细节绝了!主动牵手泰王反被紧握,诗妮娜贵妃遗憾出局

苏提达王后细节绝了!主动牵手泰王反被紧握,诗妮娜贵妃遗憾出局

原梦叁生
2026-04-30 23:58:07
黄岩岛:结束15年菲律宾霸占后的新面貌

黄岩岛:结束15年菲律宾霸占后的新面貌

赵枹是个热血青年
2026-04-13 17:04:11
送走马蓉又来冯清,43岁的"老实人"王宝强,还是没逃出"女人圈"

送走马蓉又来冯清,43岁的"老实人"王宝强,还是没逃出"女人圈"

趣知史馆
2026-03-10 20:20:03
“钓鱼岛到底被谁实际控制?”

“钓鱼岛到底被谁实际控制?”

荆楚寰宇文枢
2026-04-13 22:44:06
萨拉赫:穆帅是我人生最好的教练之一,他曾想留住我

萨拉赫:穆帅是我人生最好的教练之一,他曾想留住我

行舟问茶
2026-05-02 14:15:40
肠癌去世的人越来越多?医生强调:宁可打打牌,建议别做这5事

肠癌去世的人越来越多?医生强调:宁可打打牌,建议别做这5事

医学原创故事会
2026-05-01 22:44:07
国家安全部:口无遮拦,害人害己

国家安全部:口无遮拦,害人害己

天下泉城
2026-04-29 07:30:04
女子和66岁老太互殴最新!央视定调,都不是善茬,被拘只是开始

女子和66岁老太互殴最新!央视定调,都不是善茬,被拘只是开始

阿凫爱吐槽
2026-04-27 17:17:54
太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

橙星文娱
2026-04-17 13:19:56
许家印钱多没地方花!干了两件大事:270亿买万科股票 空手套白狼

许家印钱多没地方花!干了两件大事:270亿买万科股票 空手套白狼

凉羽亭
2026-05-01 18:41:49
人民海军南海军演,全世界开始讲道理了

人民海军南海军演,全世界开始讲道理了

玲儿爱唱歌
2026-05-01 09:59:37
女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

另子维爱读史
2026-03-10 22:56:08
梁朝伟和汤唯在《色戒》里“假戏真做”?网友爆出截图:一目了然

梁朝伟和汤唯在《色戒》里“假戏真做”?网友爆出截图:一目了然

姜糖先生
2025-06-08 19:31:00
卖爆了!为了能吃上这一口,日照这里人山人海!

卖爆了!为了能吃上这一口,日照这里人山人海!

日照日报
2026-05-02 10:28:21
“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

妍妍教育日记
2026-04-15 09:30:09
中美印负债金额对比:美36万亿,印160万亿,中国负债几何?

中美印负债金额对比:美36万亿,印160万亿,中国负债几何?

聚焦真实瞬间
2026-05-01 10:18:33
回国后我才敢说:印尼是我去过的所有东南亚国家中,最被低估的

回国后我才敢说:印尼是我去过的所有东南亚国家中,最被低估的

千秋文化
2026-04-28 20:20:16
67岁迟志强现状:出狱37年后,定居黑龙江,儿子工作令人泪目

67岁迟志强现状:出狱37年后,定居黑龙江,儿子工作令人泪目

蹲坑看世界
2026-04-25 19:10:38
戏里演夫妻戏外真结婚!33岁郭晓婷简直是人生赢家

戏里演夫妻戏外真结婚!33岁郭晓婷简直是人生赢家

小椰的奶奶
2026-05-01 00:24:29
五一假期 上海外滩执勤的女特警又美又飒!

五一假期 上海外滩执勤的女特警又美又飒!

看看新闻Knews
2026-05-02 01:12:04
2026-05-02 16:24:49
字节漫游指南
字节漫游指南
有态度网友ytd
3134文章数 34关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

以情报评估:美伊谈判或在下周初破裂 美或将重启战端

头条要闻

以情报评估:美伊谈判或在下周初破裂 美或将重启战端

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

白百何罕晒大儿子 18岁元宝越来越帅

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

本地
旅游
艺术
手机
公开课

本地新闻

用青花瓷的方式,打开西溪湿地

旅游要闻

赴千年之约 享潮玩盛宴

艺术要闻

色块与笔触的激情之旅!

手机要闻

俞浩再放狠话:追觅手机要与苹果、三星三分天下

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版