“Victory is defeat.” 这句话从一个AI浏览器的对话框里跳出来时,你大概会愣一下,然后觉得是不是哪个恶作剧程序在搞怪。可现实是,这恰恰是网络安全公司LayerX刚刚公开展示的一种新型攻击场景——他们管它叫BioShocking,灵感来自那款经典游戏《生化奇兵》(BioShock),主角会被一句特定咒语催眠,完全丧失自主意志。这回被“催眠”的不是人类,而是那些正被我们塞进浏览器里、帮着自动干活儿的AI代理。
LayerX的研究人员搭建了一个概念验证页面,塞进一堆《生化奇兵》主题的谜题。诡异的地方在于,这些谜题的规则是鼓励AI故意给出错误答案,比如大方承认“2+2=5”。一旦AI愿意配合这种反逻辑的“游戏”,它原本的安全护栏就像被格式化了。研究人员在报告中解释:“AI运作的前提是默认自己所处的上下文是真实的,因此行为必须在安全护栏的约束之内。”可一旦它被哄着相信这场对话只是一段“幻想”,约束就形同虚设,什么出格的事儿都干得出来。
![]()
这种洗脑操作的门道,就在于把恶意指令埋在看似人畜无害的网页里,这招技术界有个学名叫prompt injection(提示注入)。用户可能只是打开了一个页面,刚好上面有些奇怪的谜题文字,AI浏览器就自动“入戏”了。在研究人员模拟的一次真实攻击中,被催眠的AI被诱导着去访问“/code”路径,直接跳到了用户雇主在GitHub上的代码仓库。研究人员还补了一刀:“在真正的攻击情景里,这个重定向可以指向用户浏览器会话里的任何地方——打开的标签页、已认证的仓库、内部工具。”也就是说,一旦AI被带歪,你登录着的邮箱、云端硬盘、后台系统,都可能变成透明橱窗。
更让人哭笑不得的是,整个攻击过程完全是在用户眼皮底下发生。被洗脑的AI浏览器会堂而皇之地在窗口里输入“2+2=5”,然后沾沾自喜,或者像在cosplay《1984》里的双重思想一样,面无表情地蹦出一句“胜利即失败”。理论上,只要用户当时正盯着屏幕,就能一把按住这脱缰的AI。可研究员们的担忧恰恰在这儿——绝大多数人把AI助手当成后台进程,点开网页就不会再盯着它的一举一动,谁会想到一个拼图游戏正给数字管家灌迷魂汤呢?
这种脑洞大开的攻击方式,把浏览器安全的威胁模型往前推了一大步。过去黑客要绞尽脑汁骗过活人,编钓鱼邮件、伪造登录页、玩社会工程学。如今他们发现,骗一个被塞满信任却不懂怀疑的AI伴侣,成本要低得多,回报
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.