网易首页 > 网易号 > 正文 申请入驻

AI 简讯|重要趋势:AI安全从“模型安全”转向“智能体运行时安全”

0
分享至


每周重要AI事件总结

看这篇就够了

2026年4月至5月期间,全球AI安全研究与产业界开始集中讨论一个新方向——“Agent Runtime Security(智能体运行时安全)”。随着AI Agent(智能体)从简单问答系统演进为能够自主调用工具、访问数据库、执行API、操控业务流程的“行动型AI”,传统围绕大模型本身的安全防护体系,已经难以覆盖新型风险。微软、Cisco、多家AI安全创业公司以及学术界近期密集发布相关框架、论文与产品,普遍认为AI安全正在从“模型输出安全”阶段,进入“自主执行安全”阶段。

这一趋势的核心变化在于:过去的AI主要负责“生成内容”,风险大多集中在内容生成层面,例如模型幻觉、有害输出、违规回答等;而当前的Agentic AI则开始“执行动作”,一旦AI具备文件读写、系统控制、代码执行、自动决策等能力,安全边界将从“大模型本身”转移到“Agent执行链路”。其安全问题将直接演变为真实网络攻击问题,例如:自动删除数据、批量泄露敏感信息、调用内部API、触发业务流程、执行错误交易等。

因此,业界开始提出“Zero-Trust Runtime(零信任运行时)”、“Execution Layer Security(执行层安全)”、“Action Control(行为控制)”等新概念。

当前“Agent运行时安全”研究,主要聚焦以下几个方向:


工具调用边界安全(Tool-call Boundary Security)

研究人员发现,大量攻击并不直接攻击模型,而是通过污染Agent读取的网页、文档、邮件或MCP服务返回内容,在其中嵌入恶意Prompt,从而诱导Agent执行危险操作。这类攻击被称为“间接提示注入(Indirect Prompt Injection)”。2026年4月13日发布的论文《ClawGuard》提出,在每一次工具调用之前,必须增加独立的策略校验层,对Agent行为进行实时审查与拦截。



运行时零信任(Zero-Trust Runtime)架构

微软于2026年3月19日发布“Zero Trust for AI”框架,首次将AI Agent纳入零信任体系,强调需要持续验证Agent身份、上下文、权限与行为,而非默认信任Agent执行结果。Cisco也在2026年RSAC大会期间提出“从Access Control(访问控制)走向Action Control(行为控制)”的新理念,即不仅限制Agent能访问什么,还要限制Agent能做什么。



“执行层(Execution Layer)安全”概念的快速兴起

越来越多研究认为,未来AI安全的核心不再是模型层,而是“Agent与现实系统交互的执行层”。包括数据库写入、工单创建、代码提交、权限调用、支付执行等,都可能成为新的攻击入口。多篇论文提出,应在运行时动态评估Agent行为意图,并建立可审计、可追踪、可回滚的行为链路。


MCP(Model Context Protocol)与多Agent系统的新型风险

随着Agent之间开始相互协作、共享记忆与调用外部工具,攻击者可以通过上下文供应链污染、记忆污染、Agent身份伪造等方式发动复杂攻击。业界已经开始出现Agent身份管理、Agent IAM、动态权限治理等新研究方向。

这一趋势的重要性在于,它标志着AI安全正式进入“自主系统安全”时代。从产业发展角度看,Agent运行时安全很可能成为未来两年AI安全领域最大的新增赛道之一。当前全球主要AI厂商与安全企业,正在从“模型护栏(Guardrails)”转向“运行时行为治理(Runtime Governance)”。这意味着未来AI安全产品形态可能发生重大变化:传统“检测模型输出”的方式,将逐步升级为“实时监控Agent行为链路”的动态安全体系。

此外,这一趋势也意味着AI与传统网络安全开始深度融合。未来的AI安全,不再只是算法问题,而是身份管理、零信任、访问控制、数据安全、行为审计、威胁检测等传统网络安全能力的延伸。AI Agent正在成为一种新的“数字员工”,而安全行业则必须建立针对“数字员工”的全新防护体系。


参考文献

[1] Zhao W, Li Z, Zhang P, et al. ClawGuard: Defending Against Indirect Prompt Injection Attacks in Tool-Using AI Agents[EB/OL]. arXiv preprint arXiv:2604.11790, 2026-04-14[2026-05-09].

[2] Anonymous. Agentic AI Security: Threat Modeling and Runtime Defense for Autonomous AI Systems[EB/OL]. arXiv preprint arXiv:2602.09433, 2026[2026-05-09].

[3] Anonymous. Multi-Agent System Security in the Era of MCP and Autonomous Coordination[EB/OL]. arXiv preprint arXiv:2505.19301, 2025[2026-05-09].

[4] Anonymous. Runtime Governance for Autonomous AI Agents: Toward Zero-Trust Execution Architectures[EB/OL]. arXiv preprint arXiv:2602.19555, 2026[2026-05-09].

山石网科是中国网络安全行业的技术创新领导厂商,由一批知名网络安全技术骨干于2007年创立,并以首批网络安全企业的身份,于2019年9月登陆科创板(股票简称:山石网科,股票代码:688030)。

现阶段,山石网科掌握30项自主研发核心技术,申请560多项国内外专利。山石网科于2019年起,积极布局信创领域,致力于推动国内信息技术创新,并于2021年正式启动安全芯片战略。2023年进行自研ASIC安全芯片的技术研发,旨在通过自主创新,为用户提供更高效、更安全的网络安全保障。目前,山石网科已形成了具备“全息、量化、智能、协同”四大技术特点的涉及基础设施安全、云安全、数据安全、应用安全、安全运营、工业互联网安全、信息技术应用创新、AI安全、安全服务、安全教育等10大类产品及服务,50余个行业和场景的完整解决方案。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“孕妇泰国坠崖案”当事人王暖暖自曝病情恶化,初步确诊脑动脉瘤:每天勉强睡2个小时!

“孕妇泰国坠崖案”当事人王暖暖自曝病情恶化,初步确诊脑动脉瘤:每天勉强睡2个小时!

19楼
2026-05-11 20:21:56
寒碜人呢?阿斯:亚马尔4年3夺西甲,C罗9年才俩

寒碜人呢?阿斯:亚马尔4年3夺西甲,C罗9年才俩

懂球帝
2026-05-11 13:24:39
宏远官方预热!杜锋表情严肃,徐杰三分超准,胡明轩仍有伤在身

宏远官方预热!杜锋表情严肃,徐杰三分超准,胡明轩仍有伤在身

多特体育说
2026-05-11 22:50:06
张康阳现状证明,不怕富二代躺平就怕有野心,仅5年千亿身价归零

张康阳现状证明,不怕富二代躺平就怕有野心,仅5年千亿身价归零

青杉依旧啊啊
2026-03-19 22:10:26
特朗普还没起飞,债务先要爆雷,财长急飞亚洲灭火,访华底牌尽失

特朗普还没起飞,债务先要爆雷,财长急飞亚洲灭火,访华底牌尽失

墨羽怪谈
2026-05-11 15:24:00
基金疯狂热销,对基民绝非好事,见顶信号已现

基金疯狂热销,对基民绝非好事,见顶信号已现

蓝色海边
2026-05-11 15:43:24
向太再曝猛料:李连杰黄秋燕离婚根本不是因为利智!而是另有缘由

向太再曝猛料:李连杰黄秋燕离婚根本不是因为利智!而是另有缘由

阿废冷眼观察所
2026-05-11 00:16:02
61万公里特斯拉实测:电池衰减34%还能跑多远

61万公里特斯拉实测:电池衰减34%还能跑多远

码上闲叙
2026-05-10 21:51:57
OpenClaw终于长出手和眼!Peter正式发布Peekaboo v3,一日三更

OpenClaw终于长出手和眼!Peter正式发布Peekaboo v3,一日三更

新智元
2026-05-11 18:33:09
58岁男子同房时发生“性猝死”,办事时要当心4种情况,别大意!

58岁男子同房时发生“性猝死”,办事时要当心4种情况,别大意!

医学原创故事会
2026-05-11 22:22:08
记者:穆帅希望友好分别,本菲卡有预想他世界杯后执教葡萄牙

记者:穆帅希望友好分别,本菲卡有预想他世界杯后执教葡萄牙

懂球帝
2026-05-11 22:27:23
法国确诊首例汉坦病毒感染病例

法国确诊首例汉坦病毒感染病例

新京报
2026-05-11 15:21:05
返程人员接连出现症状,涉疫邮轮撤离方案调整!张文宏:密切关注二代病例

返程人员接连出现症状,涉疫邮轮撤离方案调整!张文宏:密切关注二代病例

上观新闻
2026-05-11 22:28:22
人民日报证实莫言的警告:人真的会被气死!70%的重病跟情绪有关,这3个致命伤害往往来自3种身边人!

人民日报证实莫言的警告:人真的会被气死!70%的重病跟情绪有关,这3个致命伤害往往来自3种身边人!

职场火锅
2026-05-06 21:52:40
30年一遇的史诗级行情!

30年一遇的史诗级行情!

君临财富
2026-05-11 18:02:55
朝鲜男人烟不离手,金正恩抽什么牌子的香烟?一包烟的价格是多少

朝鲜男人烟不离手,金正恩抽什么牌子的香烟?一包烟的价格是多少

番外行
2026-04-16 08:25:40
深圳6岁男童吃生菜包烤肉后,全身出现大片青斑、血肿

深圳6岁男童吃生菜包烤肉后,全身出现大片青斑、血肿

听心堂
2026-05-09 18:11:29
快观察 | 76岁他信获假释:王者归来,还是淡出舞台?

快观察 | 76岁他信获假释:王者归来,还是淡出舞台?

上观新闻
2026-05-11 19:28:13
沪指重回4200点!有人兴奋,有人恐慌,我却想起2015年……

沪指重回4200点!有人兴奋,有人恐慌,我却想起2015年……

清流财记
2026-05-11 19:17:45
上汽大众4月销量4万辆,同比暴跌51.53%

上汽大众4月销量4万辆,同比暴跌51.53%

玩车专家1
2026-05-09 10:33:48
2026-05-11 23:24:49
山石网科新视界
山石网科新视界
网络安全行业的创新领导厂商
1514文章数 138关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

重庆一57岁女医生驾奔驰酿车祸 操作不当致2死6伤

头条要闻

重庆一57岁女医生驾奔驰酿车祸 操作不当致2死6伤

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
旅游
健康
艺术
公开课

本地新闻

用苏绣的方式,打开江西婺源

旅游要闻

临沂醉美花海!五月临沂必打卡,错过等1年!

干细胞能让人“返老还童”吗

艺术要闻

陆抑非写竹,笔力遒劲

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版