去年有件事挺有意思。安全圈的人一边喊着AI要颠覆一切,一边拿着十年前的威胁模型套在智能体(Agentic AI,能自主决策、跨系统执行任务的AI系统)身上。
这就像用修自行车的扳手去拆特斯拉。工具看着差不多,拧下去才知道螺丝纹不对。
老框架的幻觉:为什么输入输出模型失效了
传统安全评估有个舒适区。请求进来,代码处理,响应出去。风险在边界上,在API的权限里,在数据库的加密中。
智能体不吃这套。它不只是在"处理"你的指令,它在"理解"你的意图,然后自己决定怎么走。
同一个prompt,上午执行是查报表,下午可能因为上下文变化变成删数据。没有确定路径,没有可复现的漏洞扫描报告。安全团队拿着OWASP清单逐项打勾,勾打完心里踏实了,实际风险一点没少。
更麻烦的是行为漂移。训练数据、环境状态、工具可用性,任何一个变量变了,智能体的决策逻辑就跟着变。上周安全的配置,这周可能就是后门。
风险不在代码里,在行为里。而行为是活的。
Claude Code的50万行启示:护城河在"缰绳"不在"马"
今年Anthropic的Claude Code源代码泄露,50万行代码被扒了个干净。很多人盯着功能列表做竞品分析,却漏了最关键的东西。
代码显示,Claude Code的核心竞争力不是底层模型。是那套把模型"拴住"的系统设计——权限沙箱、工具调用审计、上下文隔离、执行回滚机制。
换句话说,Anthropic花了最大力气做的,是让这匹烈马别踹翻马车。
这解释了为什么同样用Claude 3.5 Sonnet,有人能搭出生产级安全工具,有人却把密钥喂给了错误处理的prompt。模型是公共资源,"缰绳"才是私有资产。
对安全从业者来说,这意味着评估重心要换。别问"用了什么模型",问"模型被允许做什么、怎么做、做错了怎么收"。
从"漏洞猎人"到"行为考古学家"
传统安全团队的角色是找漏洞。代码审计、渗透测试、漏洞赏金,目标明确:这里有个buffer overflow,那里有个SQL注入。
智能体安全需要新技能树。你要做的是行为考古——给系统一堆模糊意图,看它会怎么理解、怎么拆解、怎么执行,在哪一步可能跑偏。
这工作更像产品经理做用户调研,而不是工程师做代码review。你得设计"恶意用户故事":如果我说"帮我清理一下旧文件",系统会理解成删日志还是删数据库?如果两个工具都能达成目标,它会优先调哪个?
没有现成工具帮你做这个。 vendors卖的AI安全解决方案,大多还在用传统API安全的思路包装一下。买过来,该漏还是漏。
理解无法外包。这是手艺活。
Qwen的低调威胁:开源模型的安全悖论
阿里通义千问(Qwen)去年成了全球下载量最大的开源模型家族。这事在安全圈讨论不多,但影响深远。
开源意味着任何人都能微调、能部署、能改行为。没有厂商的安全护栏,没有统一的更新节奏。企业用了Qwen做内部智能体,相当于自己养了一匹马,却没人告诉你这马的脾气记录在哪。
更微妙的是资源不对称。Qwen团队比OpenAI、Anthropic小得多,迭代更快,文档更薄。安全研究者追着闭源模型做red team,开源这边反而成了盲区。
当智能体能力下沉到中小团队,安全评估能力没跟上。这是结构性缺口。
90天生存指南:安全从业者的转型清单
如果只有三个月时间调整职业方向,该押注什么?
第一,放弃"AI安全专家"的笼统标签。细分到具体场景:智能体权限设计、多系统调用审计、prompt注入防御、工具链沙箱化。选一个,挖深。
第二,动手建东西。不是用Claude写脚本,是用Claude搭系统。把GitHub当成作品集,项目要能被面试官点开、能跑、能问细节。五个项目方向:AI治理策略引擎、智能体行为监控面板、自动化red team工具、多模型权限对比框架、prompt版本控制系统。
第三,理解业务语言。安全团队过去和开发对接,现在要和产品、运营、甚至法务解释为什么"这个智能体不能接那个API"。翻译能力决定影响力。
第四,接受模糊性。智能体安全没有"修复"只有"缓解",没有"通过"只有"当前可接受"。这心态转变最难,也最关键。
微软OpenAI分手背后的信号
微软和OpenAI的关系变化,很多人看成商业八卦。对安全从业者,这是基础设施层松动的信号。
过去两年,企业AI安全策略建立在"OpenAI+Azure"的假设上。模型能力、合规认证、数据驻留,一站式解决。现在GPT-5被提前退役,Satya Nadella押注自研模型,客户得重新评估:同一套智能体,换底座后行为还一样吗?
多模型策略从"备选"变成"必须"。安全团队要设计的不再是单一厂商的集成方案,是模型无关的治理框架。这工作量和复杂度,不是一个量级。
当250亿美元的"背叛"成为公开事实,企业CISO(首席信息安全官)的待办清单上,"供应商锁定风险评估"的优先级该上调几格?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.