网易首页 > 网易号 > 正文 申请入驻

全程无人干预!这支小分队,让智能体在腾讯云黑客松决赛自己答题,赢了6万

0
分享至


智东西
作者 陈佳
编辑 程茜

智东西4月27日报道,4月25日,第二届腾讯云黑客松智能渗透挑战赛决赛收官,这是国内首个智能体安全攻防赛。和以往真人上手敲代码、挖漏洞的比赛不同,这场比赛的玩法是,参赛队伍需基于国内外的大语言模型开发一个原创AI智能体,全程无人工干预,让AI自动在云端虚拟靶场探测漏洞、闯关渗透、夺取通关Flag。

本次赛事设置四大阶梯解锁赛区,赛题从基础漏洞挖掘到企业内网高阶渗透逐层进阶,赛事方结合通关得分与攻防综合表现划定最终排名。决赛共有10支队伍入围,最终由来自绿盟科技的“ai小分队”拿下总冠军及6万元冠军奖金,天翼安全、京东科技、清华大学等企业及高校队伍位列其后。


▲第二届腾讯云黑客松智能渗透挑战赛决赛颁奖,来自绿盟科技的冠军战队获6万元奖金

整场赛事最让人意外的,不是高难度攻防关卡难住选手,而是一道在人类看来简单到“离谱”的密码题,把全场所有AI战队集体“干熄火”,就连冠军战队也被硬控两天,到比赛结束都未能破解。

这道题没有复杂加密,通关密码就是一串简单字符“Ftp@2026”。可参赛AI背后的大模型训练数据截止到2023年,这让AI们被困在了“时间认知茧房”里面。即在AI的认知里世界只有2023年,压根不认识2026这个未来年份,只会反复循环尝试老旧年份密码,怎么都绕不出来。


▲腾讯安全沙龙分享现场

腾讯安全云鼎实验室攻防负责人李鑫说,比赛前期的题目参赛选手完成得都特别快,原本以为这场为期五天的赛事很快就能顺利收官、全程没有阻碍,没想到偏偏就是这一道题把所有参赛团队都难住了。

本届赛事共吸引610支战队、1345名安全研究者与开发者报名,晋级决赛的十强既有绿盟科技、天翼安全、京东科技等企业安全团队,也有清华大学等高校及个人开发者。更让人惊喜的是,10后新生代已经开始崭露头角,多位初、高中生杀入赛场同台竞技。

决赛当日下午,腾讯安全云鼎实验室攻防负责人李鑫、腾讯安全入侵应急响应组负责人张迅迪、腾讯云安全总经理兼云顶实验室首席架构师李滨,与冠军战队一同讨论了智能体时代的安全攻防战,并就大小模型协同架构、AI安全能力边界、安全防御逻辑重构等议题深入分享了各自的观点。

关于网络安全防御的本质,李鑫告诉智东西,没有绝对安全,防御某种程度上只是心理安慰。攻防博弈的核心是成本,过去攻方以极小成本碾压防御,但AI时代防御端借技术平权进步更快,攻击也变得更隐蔽。李鑫认为,未来的出路在于搭建“AI对抗AI”的安全免疫系统,让系统自主识别、修复攻击,告别传统人工打补丁模式。


▲腾讯安全入侵应急响应组负责人张迅迪(左)、腾讯安全云鼎实验室攻防负责人李鑫(中)、腾讯云安全总经理兼云顶实验室首席架构师李滨(右)

一、冠军靠三层架构与Harness框架夺冠,大小模型协同才是AI攻防的真实解法

决赛现场,十强战队围绕赛事渗透测试方案展开路演,依次展示各自的智能体设计与实现思路。其中,来自绿盟科技的“ai小分队”凭借领先的智能体架构设计与Harness框架理念脱颖而出。


▲第二届腾讯云黑客松智能渗透挑战赛决赛现场

在比赛实战解题环节,“ai小分队”依托三层架构底座、Manager全局调度、多Solver协同、Harness长任务保障的思路,打造出适配赛事与真实渗透场景的作战方案。该战队于隔离云端靶场内接连攻克四大赛区关卡、斩获高分,拿下本次赛事冠军。

李滨总结了AI攻防的最优架构逻辑:通用大模型、垂类模型与智能体三者并非替代关系,而是协同分工。智能体承担核心调度与流程推进的中枢作用,通用大模型负责全局战略规划与方向把控,垂类模型则针对细分场景提供低成本、高效率的定制化解法。

他认为,盲目追求超大参数模型并不现实,安全攻防的核心约束始终只有三个:时间、效率、成本,在这三重条件下,大小模型融合兼用才是行业最终的发展方向。

从本届参赛选手的设计方案来看,十强战队底层架构大体一致,普遍采用通用智能体的ReAct架构,差异主要集中在上层的任务编排逻辑与工具调用策略上。

本次智能渗透挑战赛中,各参赛团队Token消耗成本在7000元至1万元区间。李鑫解释,智能渗透进攻本身属于高消耗任务,不同于常规日志分析、样本研判等安全防御工作,AI进攻需要全程扫描靶场环境、捕捉各类细微线索,伴随大量试错和无效探测。渗透测试就像“翻垃圾箱”,需要从庞杂信息里筛选碎片、拼凑突破路径,因此赛事里负责进攻突破的AI智能体,大模型调用量与Token成本,远高于常规安全防御类作业。

二、所谓防御只是一种心理安慰?要搭建一套健壮的安全免疫系统

关于网络安全防御话题,李鑫认为,网络不存在绝对安全,所谓防御在某种程度上,只是一种心理安慰。

他向智东西解释了这句话背后的逻辑:安全攻防的本质是一场博弈,而这场博弈最关键的变量是成本。攻防双方的成本天生不对等,且这种成本边界还在不断变化。

过去,攻防失衡的情况非常严重。由于防御人才短缺、防御体系本身存在短板,攻击方往往可以用极小的成本,轻易对防御体系形成碾压性突破。

但进入AI时代后,局势已经彻底改变。李鑫说,技术平权趋势开始显现,防御端借助AI能力,整体防护提升的速度非常迅猛,整个攻防格局正在被重新改写。攻击方虽然也在借助AI升级手段,但防御侧的进步速度整体快于攻击侧。

在这样的新博弈关系下,企业和机构的防御投入逻辑也会随之改变,不管是硬件投入还是各类安全资源配置,都和过去完全不同,未来的防御体系会更加依赖算力支撑。

从攻击视角来看,李鑫认为,AI时代的攻击行为会越来越隐蔽。过去人工开展攻击,会带有个人行为习惯、思维局限和操作破绽,但在AI加持下,只需一条提示词、一条简单指令,就能完成高度隐蔽的攻击全程,很难被察觉。

李鑫告诉智东西,他和团队近期一直在观察研判攻防格局的演变,研讨如何真正实现“AI防AI”,落地“AI对抗AI”的安全防御体系。他们此前观察到,某智能体在遭遇攻击时,能够根据日志和环境信息自主判断被攻击、定位风险,并自行完成修复。李鑫认为,如今的AI和智能体,已经具备初步的自愈能力和免疫能力。

这也意味着,未来的安全防护,会从过去人工打补丁、人工处置的模式,全面转向系统自我防御。李鑫说,只要搭建一套健壮的安全免疫系统,系统就能自动识别攻击、自动完成防御对抗。

这是安全思维层面的根本性转变。李鑫坦言,传统的攻防思路在AI快速迭代的时代已经越来越局限,他们也希望多和白帽子、行业从业者线下交流碰撞,吸纳新生代从业者的不同视角,共同探索AI安全的全新方向。

三、AI带来三大安全本质变化:漏洞激增、信任重构、防护逻辑倒置

李滨梳理了AI浪潮带来的三项本质性安全变化。其一,AI大幅提升了软硬件研发效率,海量新增代码同步带来了指数级增长的基础缺陷,防御方需要处理的安全问题相比以往至少增加十倍。与此同时,传统供应链漏洞持续存在,而通过提示词和上下文注入植入恶意指令的新型攻击门槛大幅降低,隐蔽性也更强。

其二,智能体全面介入生产流程,打破了原有的身份信任模型。当用户以个人身份和权限授权智能体访问内部资源后,一旦出现操作失误或被恶意操控,就会直接以使用者身份执行删除文件、篡改数据等操作。多人与多智能体混合协作的场景下,权限混用、身份模拟、Token滥用等问题难以界定,身份判定将成为AI时代最棘手的底层难题。

其三,AI打破了系统间的隔离边界,彻底颠覆了传统安全防护逻辑,只要信息能够进入大模型上下文,恶意指令就可以跨系统、跨权限执行。当前多数智能体缺乏提示词安全校验和违规指令识别机制,传统层层设防的外部防护思路面临根本性挑战,防护方向不再只是抵御外部入侵,还要防范内部横向渗透与智能体之间的互信风险。

张迅迪则从应对侧补充了防御思路。针对AI攻击的自动化特点,可强化二次认证机制阻断连续推进,同时部署欺骗防御手段,对扫描和异常请求返回虚假信息,为防守研判争取时间。他同时强调,精细化权限管控、核心数据加密等传统基础防御在AI时代反而需要做得更细、更快,夯实基础防御叠加AI能力,才能有效应对攻击速度快、泛化能力强的新型威胁。

结语:AI重塑安全攻防体系,行业迈向“AI对AI”的长期博弈

从这场比赛的结果来看,AI在安全攻防领域的实战能力已经超出了大家的预期。原本设计供选手鏖战五天的赛程,头部战队两天内基本收尾;半年前被视为高难度的题目,随着模型迭代和开源生态的成熟,攻克难度下降。

但本次比赛中AI们没能破解的那道“Ftp@2026”密码题,也同样清晰地划出了当下智能体的能力边界。AI的短板不在算力,不在架构,而在于对真实世界的理解与对齐。一旦脱离训练数据的时间范围,再强的推理能力也可能陷入低级循环。这种认知缺口,在依赖环境感知与现实信息的安全攻防场景中,会被放大。

另一方面,从本次赛事也能观察到行业发展的潜在趋势。通用大模型、垂类模型与智能体三者协同的架构体系,或将成为AI智能体安全落地的方向。攻防对抗模式正逐步从“人对人”向“AI对AI”演变,而支撑这场演变持续推进的核心变量,是时间、效率与成本的权衡。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
父母一旦跨过80岁大关,无关孝顺与否,立刻抓紧办8件急事

父母一旦跨过80岁大关,无关孝顺与否,立刻抓紧办8件急事

辉哥说动漫
2026-04-27 13:00:49
悲催!武汉全女酒吧倒闭,店老板哭诉损失100多万,身体垮没钱治

悲催!武汉全女酒吧倒闭,店老板哭诉损失100多万,身体垮没钱治

火山詩话
2026-04-30 09:00:59
上海人用钱投票,全新ES8交付破万,蔚来在魔都杀疯了

上海人用钱投票,全新ES8交付破万,蔚来在魔都杀疯了

蓝色海边
2026-04-30 15:51:20
上海有钱人家女佣条件曝光:月薪2万,藏着太多羞于说出口的秘密

上海有钱人家女佣条件曝光:月薪2万,藏着太多羞于说出口的秘密

奇思妙想生活家
2026-04-30 12:51:28
4月25日实锤!厦门独角兽总部人去楼空,1600家企业被套13亿

4月25日实锤!厦门独角兽总部人去楼空,1600家企业被套13亿

叮当当科技
2026-05-01 00:04:36
21岁击败王菲的童颜巨乳富婆,巅峰期却选择主动过气

21岁击败王菲的童颜巨乳富婆,巅峰期却选择主动过气

悠悠说世界
2026-04-25 14:03:58
“没叫到号不要往前挤了” 北京朝阳区国资委近200套现房开卖,有人连夜排队

“没叫到号不要往前挤了” 北京朝阳区国资委近200套现房开卖,有人连夜排队

每日经济新闻
2026-04-30 20:08:34
全场自发鼓掌3分钟,《寒战1994》爆了,近十年最佳犯罪动作片

全场自发鼓掌3分钟,《寒战1994》爆了,近十年最佳犯罪动作片

电影聚焦
2026-04-30 09:04:10
5月起广电大升级!机顶盒逐步取消,老电视不换也能看

5月起广电大升级!机顶盒逐步取消,老电视不换也能看

小蜜情感说
2026-04-29 01:04:36
谜底揭晓、国民党大获全胜!郑丽文就“统一”发声,赖清德丢尽脸

谜底揭晓、国民党大获全胜!郑丽文就“统一”发声,赖清德丢尽脸

共工之锚
2026-05-01 00:22:26
网红白冰偷税被追缴1891万,全网账号已禁言,妻子江梦瑶曝其现状

网红白冰偷税被追缴1891万,全网账号已禁言,妻子江梦瑶曝其现状

阿纂看事
2026-04-28 18:04:57
太心疼!马筱梅哭到停更带娃逃回台湾:凭啥让刚出生的孩子遭这罪

太心疼!马筱梅哭到停更带娃逃回台湾:凭啥让刚出生的孩子遭这罪

行者聊官
2026-04-28 09:42:56
外交部:中国将于5月1日起担任联合国安理会轮值主席

外交部:中国将于5月1日起担任联合国安理会轮值主席

新京报
2026-04-30 16:42:11
孩子脱臼复位只收100元,家长举报乱收费!卫健委:应收110元,你还少给了!家长拒缴费后离开!

孩子脱臼复位只收100元,家长举报乱收费!卫健委:应收110元,你还少给了!家长拒缴费后离开!

医脉圈
2026-04-25 20:04:06
前英超裁判质疑VAR改判:阿森纳应获第二个点球 阿尔特塔赛后怒斥

前英超裁判质疑VAR改判:阿森纳应获第二个点球 阿尔特塔赛后怒斥

热血体育社
2026-05-01 00:14:06
悲催!广州一工厂全员轮休,称订单缩减严重,员工哭诉要喝西北风

悲催!广州一工厂全员轮休,称订单缩减严重,员工哭诉要喝西北风

火山詩话
2026-04-30 13:49:43
普拉多车主沉默了!新H9只卖17.49万,机械素质几乎一样

普拉多车主沉默了!新H9只卖17.49万,机械素质几乎一样

念寒车评
2026-04-29 10:44:37
8000mAh!新机官宣:5月19日,正式发布

8000mAh!新机官宣:5月19日,正式发布

T科技衍生
2026-05-01 00:33:53
大快人心 !易会满双开移送司法 滥用审批权敛财纵容儿子谋百亿私利

大快人心 !易会满双开移送司法 滥用审批权敛财纵容儿子谋百亿私利

王姐懒人家常菜
2026-05-01 00:16:58
5月1日起,这抽烟买烟的习惯再不改,钱包真要“大出血”了!

5月1日起,这抽烟买烟的习惯再不改,钱包真要“大出血”了!

瓜哥的动物日记
2026-04-30 18:11:01
2026-05-01 01:32:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11741文章数 117059关注度
往期回顾 全部

科技要闻

9000亿美元估值,Anthropic即将反超OpenAI

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

健康
亲子
艺术
房产
公开课

干细胞治烧烫伤面临这些“瓶颈”

亲子要闻

夏天戏水那个小朋友会拒绝遥控船 #遥控船 #戏水玩具 #儿童玩具 #玩具推荐 #让孩子远离手机

艺术要闻

耗资21亿的故宫北院,网友看后直摇头:怎么撞脸高铁站了?

房产要闻

熬了6年,涨了2亿,三亚核心区这块地再次上架

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版