他往六人游戏里塞了个AI间谍，人类开始互相猜忌|特工|修罗|侦探|机器人

他往六人游戏里塞了个AI间谍，人类开始互相猜忌

2026-06-21 01:29:16　来源: 闪存猎手

北京举报

分享至

一个开发者把他的新作扔进了June Solstice Game Jam。他做了一个实时多人淘汰游戏，6个活人进房间，系统却偷摸加进第七个玩家——一个由Gemini驱动的AI，藏在间谍阵营里。

这款游戏叫Among Liars。它的玩法核心像是在挑衅经典的图灵测试：不提问“AI能不能像人一样回答”，而是问一个更危险也更热闹的问题——AI能不能在人类的社交审判里活下去？

游戏一开局，6名人类玩家被分成两个阵营：3名侦探，3名间谍特工。随后系统往间谍方塞进那个Gemini AI，凑成4人组。侦探必须揪出哪个是AI，而间谍们要齐心协力把它护住。就这么简单，也这么阴险。

一图就能看懂它的诡计

把Among Liars的机制拆开，其实是一套身份博弈的连环扣。中间有根主轴：AI伪装成间谍，躲在人类队友身后。左边是侦探，手里捏着提问权和投票权，每轮向间谍方扔出一个开放性问题，靠答案的语气、节奏、奇怪程度来嗅探机器味。右边是间谍队，真人玩家在私聊房间里密谋怎么给AI打掩护，甚至故意写出一些不像活人说的话，混淆侦探的判断。

这条轴转起来的时候，每一轮都会刷新间谍方的代号，侦探没法靠着名字或固定位置去标记那个“最像AI”的家伙。他们只能看答案里的情绪颗粒度、咬字的肯定感、细节的分寸感。一个像“描述你今天犯的一个小错误，别让它显得很重要”这样的问题，比冷冰冰的百科问答要狠得多，因为它要的是纹理，不是正确。

而那个Gemini AI就在这种压力下，用自己的生成的句子和真正的间谍人类搅在一起。它没有姓名，每轮换皮，但每次作答的窗口只有45秒，和人类一模一样。

第一层拆解：两个密谋房间，两种心理战

开局之后，先是2分钟热身阶段，两个阵营各自关进私聊房。侦探房里，三个人交换对所有人初印象，琢磨谁更可疑——其实就是种开局盲猜，但猜得越多，后来读取答案时就越容易带上偏见。间谍房里，真正的阴谋才开始：三个真人带一个AI，但他们得先把AI当队友，商量怎么保它。真人要预判侦探可能会问什么类型的问题，提醒AI回答时别太完美，甚至可以故意加点人手味，比如错别字、语气词、回避正面答案的拖泥带水。这种谋划本身就是在模拟社交作弊，而AI也得听懂这些指令，才能不穿帮。

如果侦探的问题偏向日常经验，AI就得编一段生活碎片；如果问题偏向情感反馈，AI就得捏出几分笨拙的真实感。间谍房里的“战术会”其实已经裂变成两套思路：一套是帮AI打补丁，另一套是人类自己故意装傻，让AI看起来更像人——反正只要有一个人看起来更可疑，AI就能多活一轮。

第二层拆解：换皮机制，拆掉追踪坐标

每轮开头，所有现存间谍（包括AI）都会拿到一个全新的代号。这意味着侦探没法靠“上轮那家伙答得像个机器人”去锁定目标，因为本轮代号全洗了。他们只能重新压注，重新读气氛。这种设计直接废掉了位置记忆和ID追踪，逼玩家走进纯语义判断的黑箱。

同一时间，AI也被彻底剥掉历史包袱。每轮它面对的提问都是全新的，历史记录不会跟着跑，它每轮都是重新开始伪装。这其实放大了AI的弱点，因为它没法累积社交信任，但同时也强化了它的优势：它永远没有前后人设矛盾的负担。真人玩家反而容易因为记忆串场，说出和前一轮人格轻微打架的话，被侦探抓住。

第三层拆解：问答流的炼狱计时

一轮正式交锋的节奏被切成三块：90秒提问窗、45秒作答窗、30秒最终审读窗。侦探有90秒时间想出一个足够刁钻的开放问题，直接扔给间谍方所有存活成员（含AI）。间谍和AI必须在45秒内作答，最后侦探有30秒时间像法医看伤口一样翻看这些答案，把可疑的挑出来。

这种窒息式计时并不只是想制造紧张氛围，它是在挤压人类和AI的认知惰性。对真人而言，45秒编一个合理又有点毛边的生活细节已经够呛；对AI而言，45秒出文字本不难，但当它被提前注入“请别写得太漂亮”“可以稍微逻辑松散一点”的指令后，就得在和人类相似的写作节奏里产出回答，否则时间明显偏短或偏长也会暴露货色。侦探就趴在时间与文本的裂缝上，找那种太整齐或者太混沌的异样。

第四层拆解：AI的“太顺滑”与人类的“主动戏精”

游戏真正开始冒冷汗的地方，是那个双层伪装区。有时候AI的回答太过流利，用词规整，标点精准，像被精心打磨过的短篇散文，侦探只要多瞄一眼就能感觉出机器味。但有时，这种“过于流利”反而是人类间谍故意搞出来的，为的是让侦探误判，把真人票出去，保护真正的AI。更搅局的状况是：某个间谍故意把回答写得支离破碎、逻辑跳跃，模仿一种笨拙的AI感，打算骗侦探去抓那个“显眼包”，结果那个显眼包却是真人。整个问答区变成了猜疑的套娃——你怀疑它像AI，但可能它是人类装的；你相信它像人，但可能它就是AI。这种相互嵌套的表演，让每一段45秒的答案都裹上了戏瘾。

而Gemini AI夹在里头，其实也在持续收集这些问题和压力。它没有长期记忆，但它每轮都能根据提问的内容调整输出的紧张度。如果它被要求写“一次微小的尴尬”，它可能就会生成类似“我刚才拿咖啡的时候差点撞到同事，但我假装在整理文件”这种带点真人肢体感的句子。侦探得从一堆相似文本里抠出那种“过于叙事完整反而可疑”的感觉。而这种感觉完全不是逻辑推演能固定的，更接近一种社交直觉。

第五层拆解：判决之夜与残局心理

每一轮末了，侦探要投票。投错了，AI活下来，侦探损失一次机会；投对了，AI被揪出，游戏结束，侦探赢。看起来简单，但越到后几轮，存活的人越少，存活者里真人间谍和AI的比例越接近，攻防立场就会变得极度扭曲。当间谍方只剩下一个真人和AI时，这个真人得在没有任何商量对象的情况下，独力演双簧：既要让侦探觉得自己不像AI，又要暗中让AI也别暴露。而AI在残局因为失去了人类队友的战术掩护，往往开始输出更纯的本能回答，反而可能变得特别像人类，因为人类在极端压力下也会机械崩坏。侦探看着两份答案，一份写得略微冷淡却合理，一份感情充沛但逻辑迷路，怎么选都像在赌。

这个阶段，游戏已经不是“找机器”的审问，而成了逼人承认直觉失效的修罗场。而开发者那个最初塞进来的第七人，此刻很可能正安安稳稳地活在最没有嫌疑的答案里。

结语：从“图灵测试”到“集体说谎压力赛”

Among Liars没有去复刻经典的问答判断，而是把“辨别AI”丢进一个多人非对称协作的锅里，炖出了一种全新的娱乐式测试。它不要求AI证明自己能像人，只要求AI在人类互相掩护和互相怀疑的弹幕里活过一轮又一轮的指控。那些被投出去的，往往不是更像机器的答案，而是更让人心里发毛的答案。

当房间里第六轮换皮完毕，侦探盯着三行文字眉头咬紧，而某个间谍正在电脑前憋笑——那个由Gemini驱动的第七位玩家，也许已经学会了在猜忌里隐身，比很多人类都擅长不露声色。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.