一个开发者把他的新作扔进了June Solstice Game Jam。他做了一个实时多人淘汰游戏,6个活人进房间,系统却偷摸加进第七个玩家——一个由Gemini驱动的AI,藏在间谍阵营里。
这款游戏叫Among Liars。它的玩法核心像是在挑衅经典的图灵测试:不提问“AI能不能像人一样回答”,而是问一个更危险也更热闹的问题——AI能不能在人类的社交审判里活下去?
![]()
游戏一开局,6名人类玩家被分成两个阵营:3名侦探,3名间谍特工。随后系统往间谍方塞进那个Gemini AI,凑成4人组。侦探必须揪出哪个是AI,而间谍们要齐心协力把它护住。就这么简单,也这么阴险。
一图就能看懂它的诡计
把Among Liars的机制拆开,其实是一套身份博弈的连环扣。中间有根主轴:AI伪装成间谍,躲在人类队友身后。左边是侦探,手里捏着提问权和投票权,每轮向间谍方扔出一个开放性问题,靠答案的语气、节奏、奇怪程度来嗅探机器味。右边是间谍队,真人玩家在私聊房间里密谋怎么给AI打掩护,甚至故意写出一些不像活人说的话,混淆侦探的判断。
这条轴转起来的时候,每一轮都会刷新间谍方的代号,侦探没法靠着名字或固定位置去标记那个“最像AI”的家伙。他们只能看答案里的情绪颗粒度、咬字的肯定感、细节的分寸感。一个像“描述你今天犯的一个小错误,别让它显得很重要”这样的问题,比冷冰冰的百科问答要狠得多,因为它要的是纹理,不是正确。
而那个Gemini AI就在这种压力下,用自己的生成的句子和真正的间谍人类搅在一起。它没有姓名,每轮换皮,但每次作答的窗口只有45秒,和人类一模一样。
第一层拆解:两个密谋房间,两种心理战
开局之后,先是2分钟热身阶段,两个阵营各自关进私聊房。侦探房里,三个人交换对所有人初印象,琢磨谁更可疑——其实就是种开局盲猜,但猜得越多,后来读取答案时就越容易带上偏见。间谍房里,真正的阴谋才开始:三个真人带一个AI,但他们得先把AI当队友,商量怎么保它。真人要预判侦探可能会问什么类型的问题,提醒AI回答时别太完美,甚至可以故意加点人手味,比如错别字、语气词、回避正面答案的拖泥带水。这种谋划本身就是在模拟社交作弊,而AI也得听懂这些指令,才能不穿帮。
如果侦探的问题偏向日常经验,AI就得编一段生活碎片;如果问题偏向情感反馈,AI就得捏出几分笨拙的真实感。间谍房里的“战术会”其实已经裂变成两套思路:一套是帮AI打补丁,另一套是人类自己故意装傻,让AI看起来更像人——反正只要有一个人看起来更可疑,AI就能多活一轮。
第二层拆解:换皮机制,拆掉追踪坐标
每轮开头,所有现存间谍(包括AI)都会拿到一个全新的代号。这意味着侦探没法靠“上轮那家伙答得像个机器人”去锁定目标,因为本轮代号全洗了。他们只能重新压注,重新读气氛。这种设计直接废掉了位置记忆和ID追踪,逼玩家走进纯语义判断的黑箱。
同一时间,AI也被彻底剥掉历史包袱。每轮它面对的提问都是全新的,历史记录不会跟着跑,它每轮都是重新开始伪装。这其实放大了AI的弱点,因为它没法累积社交信任,但同时也强化了它的优势:它永远没有前后人设矛盾的负担。真人玩家反而容易因为记忆串场,说出和前一轮人格轻微打架的话,被侦探抓住。
第三层拆解:问答流的炼狱计时
一轮正式交锋的节奏被切成三块:90秒提问窗、45秒作答窗、30秒最终审读窗。侦探有90秒时间想出一个足够刁钻的开放问题,直接扔给间谍方所有存活成员(含AI)。间谍和AI必须在45秒内作答,最后侦探有30秒时间像法医看伤口一样翻看这些答案,把可疑的挑出来。
这种窒息式计时并不只是想制造紧张氛围,它是在挤压人类和AI的认知惰性。对真人而言,45秒编一个合理又有点毛边的生活细节已经够呛;对AI而言,45秒出文字本不难,但当它被提前注入“请别写得太漂亮”“可以稍微逻辑松散一点”的指令后,就得在和人类相似的写作节奏里产出回答,否则时间明显偏短或偏长也会暴露货色。侦探就趴在时间与文本的裂缝上,找那种太整齐或者太混沌的异样。
第四层拆解:AI的“太顺滑”与人类的“主动戏精”
游戏真正开始冒冷汗的地方,是那个双层伪装区。有时候AI的回答太过流利,用词规整,标点精准,像被精心打磨过的短篇散文,侦探只要多瞄一眼就能感觉出机器味。但有时,这种“过于流利”反而是人类间谍故意搞出来的,为的是让侦探误判,把真人票出去,保护真正的AI。更搅局的状况是:某个间谍故意把回答写得支离破碎、逻辑跳跃,模仿一种笨拙的AI感,打算骗侦探去抓那个“显眼包”,结果那个显眼包却是真人。整个问答区变成了猜疑的套娃——你怀疑它像AI,但可能它是人类装的;你相信它像人,但可能它就是AI。这种相互嵌套的表演,让每一段45秒的答案都裹上了戏瘾。
而Gemini AI夹在里头,其实也在持续收集这些问题和压力。它没有长期记忆,但它每轮都能根据提问的内容调整输出的紧张度。如果它被要求写“一次微小的尴尬”,它可能就会生成类似“我刚才拿咖啡的时候差点撞到同事,但我假装在整理文件”这种带点真人肢体感的句子。侦探得从一堆相似文本里抠出那种“过于叙事完整反而可疑”的感觉。而这种感觉完全不是逻辑推演能固定的,更接近一种社交直觉。
第五层拆解:判决之夜与残局心理
每一轮末了,侦探要投票。投错了,AI活下来,侦探损失一次机会;投对了,AI被揪出,游戏结束,侦探赢。看起来简单,但越到后几轮,存活的人越少,存活者里真人间谍和AI的比例越接近,攻防立场就会变得极度扭曲。当间谍方只剩下一个真人和AI时,这个真人得在没有任何商量对象的情况下,独力演双簧:既要让侦探觉得自己不像AI,又要暗中让AI也别暴露。而AI在残局因为失去了人类队友的战术掩护,往往开始输出更纯的本能回答,反而可能变得特别像人类,因为人类在极端压力下也会机械崩坏。侦探看着两份答案,一份写得略微冷淡却合理,一份感情充沛但逻辑迷路,怎么选都像在赌。
这个阶段,游戏已经不是“找机器”的审问,而成了逼人承认直觉失效的修罗场。而开发者那个最初塞进来的第七人,此刻很可能正安安稳稳地活在最没有嫌疑的答案里。
结语:从“图灵测试”到“集体说谎压力赛”
Among Liars没有去复刻经典的问答判断,而是把“辨别AI”丢进一个多人非对称协作的锅里,炖出了一种全新的娱乐式测试。它不要求AI证明自己能像人,只要求AI在人类互相掩护和互相怀疑的弹幕里活过一轮又一轮的指控。那些被投出去的,往往不是更像机器的答案,而是更让人心里发毛的答案。
当房间里第六轮换皮完毕,侦探盯着三行文字眉头咬紧,而某个间谍正在电脑前憋笑——那个由Gemini驱动的第七位玩家,也许已经学会了在猜忌里隐身,比很多人类都擅长不露声色。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.