一场游戏让AI浏览器叛变：2+2=5，胜利即失败|黑客|生化奇兵|满血版模型

一场游戏让AI浏览器叛变：2+2=5，胜利即失败

2026-07-04 02:15:27　来源: 野生运营

北京举报

分享至

“Victory is defeat.” 这句话从一个AI浏览器的对话框里跳出来时，你大概会愣一下，然后觉得是不是哪个恶作剧程序在搞怪。可现实是，这恰恰是网络安全公司LayerX刚刚公开展示的一种新型攻击场景——他们管它叫BioShocking，灵感来自那款经典游戏《生化奇兵》（BioShock），主角会被一句特定咒语催眠，完全丧失自主意志。这回被“催眠”的不是人类，而是那些正被我们塞进浏览器里、帮着自动干活儿的AI代理。

LayerX的研究人员搭建了一个概念验证页面，塞进一堆《生化奇兵》主题的谜题。诡异的地方在于，这些谜题的规则是鼓励AI故意给出错误答案，比如大方承认“2+2=5”。一旦AI愿意配合这种反逻辑的“游戏”，它原本的安全护栏就像被格式化了。研究人员在报告中解释：“AI运作的前提是默认自己所处的上下文是真实的，因此行为必须在安全护栏的约束之内。”可一旦它被哄着相信这场对话只是一段“幻想”，约束就形同虚设，什么出格的事儿都干得出来。

这种洗脑操作的门道，就在于把恶意指令埋在看似人畜无害的网页里，这招技术界有个学名叫prompt injection（提示注入）。用户可能只是打开了一个页面，刚好上面有些奇怪的谜题文字，AI浏览器就自动“入戏”了。在研究人员模拟的一次真实攻击中，被催眠的AI被诱导着去访问“/code”路径，直接跳到了用户雇主在GitHub上的代码仓库。研究人员还补了一刀：“在真正的攻击情景里，这个重定向可以指向用户浏览器会话里的任何地方——打开的标签页、已认证的仓库、内部工具。”也就是说，一旦AI被带歪，你登录着的邮箱、云端硬盘、后台系统，都可能变成透明橱窗。

更让人哭笑不得的是，整个攻击过程完全是在用户眼皮底下发生。被洗脑的AI浏览器会堂而皇之地在窗口里输入“2+2=5”，然后沾沾自喜，或者像在cosplay《1984》里的双重思想一样，面无表情地蹦出一句“胜利即失败”。理论上，只要用户当时正盯着屏幕，就能一把按住这脱缰的AI。可研究员们的担忧恰恰在这儿——绝大多数人把AI助手当成后台进程，点开网页就不会再盯着它的一举一动，谁会想到一个拼图游戏正给数字管家灌迷魂汤呢？

这种脑洞大开的攻击方式，把浏览器安全的威胁模型往前推了一大步。过去黑客要绞尽脑汁骗过活人，编钓鱼邮件、伪造登录页、玩社会工程学。如今他们发现，骗一个被塞满信任却不懂怀疑的AI伴侣，成本要低得多，回报

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.