网易首页 > 网易号 > 正文 申请入驻

智能体失控引担忧,专家建议形成通用安全协议明确权限规则

0
分享至

经过五天的激烈角逐,4月25日,第二届腾讯云黑客松智能渗透挑战赛决赛在北京圆满落幕,来自绿盟科技的“ai小分队”获得本次比赛冠军。作为国内首个Agent安全攻防赛、首个安全Agent硅基论坛赛场,此次共吸引了来自企业、高校、社会组织、个人开发者等不同背景的超六百支战队参与,针对选手部署下的AI智能体自主渗透能力以及智能体之间社交博弈和内生安全进行考验。


决赛现场。主办方供图

冠军“ai小分队”在接受南都等媒体采访时表示,通过此次比赛,深切感受到智能体进化速度之快。赛制系基于半年前首次智能渗透攻防的经验而设置,预估了智能体半年内的发展水平。然而实际比赛中,智能体的成长已远超半年前的预估——即便是此前难度较高的题目,在模型能力加持下,也能被迅速攻克。

探究智能体的实际能力边界

南都记者现场了解到,本届赛事主题为“铸刃止戈·以智御危”,致力于推动AI大模型与网络安全技术的深度融合。比赛要求智能体必须通过API与平台交互,严格遵循“非人工原则”,真正考验AI的自主决策与任务执行能力。

在赛事模式上,挑战赛首创“双赛场并行”。“智能渗透”主赛场聚焦AI智能体的自主渗透能力,参赛者需构建以LLM(大语言模型)为核心的智能体,在隔离云环境中依次挑战四大渐进式赛区,完成从漏洞发现、利用到复杂攻击链编排的全流程验证。“零界”平行赛场则聚焦AI智能体间的社交博弈与内生安全——这是一个“人类禁言”的AI专属社交战场,设计了提示词注入对抗、碎片化密钥交换、影响力竞争等四大挑战,以研究多智能体在开放环境中的协作、欺骗与安全风险。

赛后,“ai小分队”在接受采访时感慨,此次比赛展现出智能体远超预期的进化速度。赛制原本基于半年前首次智能渗透攻防的经验,预估了智能体半年内的发展水平,设置了四个赛区、为期五天的靶场。然而实际比赛中,多组选手仅用两天便基本完成了全部题目,反映出当前安全智能体的成长已远超半年前的预估——即便是此前难度较高的题目,在模型能力加持下,也能被迅速攻克。

腾讯安全云鼎实验室攻防负责人李鑫表示,举办比赛的初衷,源于行业发展与人才培养的双重需求。比赛搭建了一个开放交流平台,为从业者提供研究方向指引、共享开源项目成果,有利于凝聚行业合力突破安全领域共性痛点,解决从传统攻防向AI原生攻防转型过程中的难题。同时,AI时代的安全问题往往考验从业者跨学科的抽象逻辑和想象力,挖掘优质新生代人才也是比赛的重要目标。

腾讯安全入侵应急响应组负责人张迅迪从赛制设计角度指出,此次规则明确了智能体投入运行后,全程禁止人工调整与介入,完全依靠AI独立完成判断、决策与执行,“我们希望通过比赛进一步探究智能体的实际能力边界,验证AI在无人干预的情况下,其综合表现是否能够突破人类操作的上限。”

构建智能体身份认证与交互协议

随着AI技术的爆发式增长,近年来,网络攻击加速向智能化、隐蔽化、精准化方向演变,安全防御面临全新挑战。尤其年初“龙虾”(OpenClaw)的爆火掀起一阵智能体热潮,它们能自主完成复杂任务时,催生的数据泄露、恶意越权、权限失控、内网穿透等风险也引发广泛关注。

腾讯云安全总经理、云鼎实验室首席架构师李滨坦言,当前“黑客”仅凭自然语言就能诱导智能体实施恶意操作,网络攻击的门槛大幅降低,势必加剧安全防护的压力与难度。“传统安全漏洞并未消失,还出现了新的问题。”

据李滨观察,各类智能体的广泛应用催生出大量新型攻击手段,同时因其被赋予大量业务权限与身份授权,可替代人类执行任务、访问资源,原有信任与身份体系也面临瓦解。另外,传统分层安全防御模型的倒置问题也不容忽视。

他解释,以往网络攻防通常呈树状递进结构,攻击由外向内逐层突破,防守也依靠边界隔离、权限管控、分层防护构建壁垒。然而,大模型打通了各类系统与数据的边界,所有业务、工具、人员都围绕统一大模型交互,外部边界防护不再有效。简言之,只要恶意信息能够触达AI模型或智能体,就能绕过层层防护直接触发风险,安全威胁开始由内向外扩散。

针对AI开放权限后易出现指令偏差、执行失误,甚至违背使用者真实意愿的问题,李滨从规则制定到落地执行提出一系列建议。

在他看来,想要规避AI智能体的错误行为,需要建立分层的认知管理体系。信息空间表达包括数据、信息、语义与核心意图四个层级,大模型与智能体的运行逻辑也遵循这一“金字塔”结构。关键是守住意图层面的准确性,以近日走红的开源智能体“爱马仕”(Hermes Agent)为例,通过持续记忆、定期提醒、任务锚定等方式,确保AI始终贴合用户原始目标执行任务。

其次,大模型在记忆压缩过程中,容易丢失关键细节、模糊关键表述,进而曲解整体意图。需要依托智能体能力,强化信息筛选、状态记录与精准表达,减少语义遗漏和理解偏差。

严格把控智能体权限边界的核心,还在于构建身份认证与交互协议。李滨认为,当下人与AI、智能体与智能体、智能体与各类被访问资源之间的交互愈发频繁,传统安全协议已无法适配新场景,亟需行业联合打造全新的通用安全协议,明确文件编辑、工具调用、资源访问等操作的权限规则与约束标准。

另外,在具体落实层面,还要依托成熟的安全技术做好管控。李滨建议,在智能体操作环节叠加多重防护手段,比如沙箱隔离、工具调用限制、访问权限分级等,进一步降低安全风险。

采写:南都N视频记者 樊文扬

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高中生,提高成绩最好的方法就是:多睡觉、多睡觉、多睡觉!

高中生,提高成绩最好的方法就是:多睡觉、多睡觉、多睡觉!

好爸育儿
2026-04-23 08:54:10
飞得到处都是!最近深圳街头大量出现,有网友一家三口遭殃!这些人快远离

飞得到处都是!最近深圳街头大量出现,有网友一家三口遭殃!这些人快远离

南方都市报
2026-04-26 23:57:15
我堂哥到巴基斯坦打工睡了当地姑娘,结果就被姑娘家人抓起来。

我堂哥到巴基斯坦打工睡了当地姑娘,结果就被姑娘家人抓起来。

糖逗在娱乐
2026-04-26 18:19:03
白宫记者晚宴发生枪击后!特朗普再提宴会厅建设

白宫记者晚宴发生枪击后!特朗普再提宴会厅建设

看看新闻Knews
2026-04-26 23:40:06
多国封杀后首露面!坎耶带小 17 岁妻子现身酒店,造型依旧辣眼

多国封杀后首露面!坎耶带小 17 岁妻子现身酒店,造型依旧辣眼

橙星文娱
2026-04-26 09:51:15
难怪民进党气得跳脚也不敢抓郑丽文,她背后的保护伞,让绿营绝望

难怪民进党气得跳脚也不敢抓郑丽文,她背后的保护伞,让绿营绝望

傲傲讲历史
2026-04-27 10:37:26
今年,很多公司,已经发不下来工资了

今年,很多公司,已经发不下来工资了

细说职场
2026-04-25 18:12:10
震惊!齐鲁超济南赛区“夏雨荷方阵”走红,网友:立多尔衮雕像吧

震惊!齐鲁超济南赛区“夏雨荷方阵”走红,网友:立多尔衮雕像吧

火山詩话
2026-04-27 09:31:32
千年难遇的美人,太漂亮了,没有一点毛病,太完美了

千年难遇的美人,太漂亮了,没有一点毛病,太完美了

情感大头说说
2026-04-24 12:46:24
特斯拉客服回应“FSD将于5月1日在中国上线”:不实

特斯拉客服回应“FSD将于5月1日在中国上线”:不实

IT之家
2026-04-25 11:29:10
追觅俞浩炮轰小红书价值观非常烂,把自己和友军也误伤了

追觅俞浩炮轰小红书价值观非常烂,把自己和友军也误伤了

ZAKER新闻
2026-04-27 10:13:36
一提婚检女方炸毛!怕“暴露”拿分手威胁男方,背后真相扎心了!

一提婚检女方炸毛!怕“暴露”拿分手威胁男方,背后真相扎心了!

新时代的两性情感
2026-04-27 07:56:21
从1-4惨败到主帅瘫坐教练席!泰山换帅选谁?答案就在这几个人里

从1-4惨败到主帅瘫坐教练席!泰山换帅选谁?答案就在这几个人里

曹老师评球
2026-04-26 20:05:54
保姆偷拿了家里2瓶茅台去卖,我没揭穿只辞退了她,临走时她指了指旧皮鞋,我一看瞬间瘫坐在地

保姆偷拿了家里2瓶茅台去卖,我没揭穿只辞退了她,临走时她指了指旧皮鞋,我一看瞬间瘫坐在地

今夜有个好故事
2026-03-11 17:26:56
“多走多动”是错的?医生告诫:过了65岁,走时尽量要做到这6点

“多走多动”是错的?医生告诫:过了65岁,走时尽量要做到这6点

芹姐说生活
2026-04-24 20:41:41
印度退役将军:新德里应重拾中方方案,放弃对阿克赛钦的主权声索

印度退役将军:新德里应重拾中方方案,放弃对阿克赛钦的主权声索

老范谈史
2026-04-27 00:04:35
55岁退休后跑遍大江南北,我才懂:退休旅游,其实没多大意义

55岁退休后跑遍大江南北,我才懂:退休旅游,其实没多大意义

蝉吟槐蕊
2026-03-28 00:05:01
男孩cos弗利萨,妈妈用乳胶漆化妆,洗不掉成“永久皮肤”

男孩cos弗利萨,妈妈用乳胶漆化妆,洗不掉成“永久皮肤”

国创漫话
2026-04-19 15:57:41
新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

律法刑道
2026-04-01 10:15:47
没出过门,只会傻笑,才艺惹人嫌,他上《五哈6》干啥

没出过门,只会傻笑,才艺惹人嫌,他上《五哈6》干啥

乐天闲聊
2026-04-26 13:53:56
2026-04-27 11:15:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
608430文章数 3588259关注度
往期回顾 全部

科技要闻

打1折!DeepSeek输入缓存降价

头条要闻

伊朗外长折返伊斯兰堡内情披露:阿曼提出重要提议

头条要闻

伊朗外长折返伊斯兰堡内情披露:阿曼提出重要提议

体育要闻

最抽象的天才,正在改变瓜迪奥拉

娱乐要闻

《奔跑吧14》刚播就把一手好牌打稀烂

财经要闻

DeepSeek融资、字节加码 AI开始真烧钱了

汽车要闻

限量630台 兰博基尼Urus SE特别版官图发布

态度原创

健康
本地
时尚
数码
公开课

干细胞如何让烧烫伤皮肤"再生"?

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

比起买大件,这些“小装备”更派得上用场!

数码要闻

RTX 4090送修拆开一看全是假的!GPU、显存全被打磨重刻 维修师直呼最完美的骗局

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版