通研院&北大：智能体如何提升社交能力？|检测器|大模型

通研院&北大：智能体如何提升社交能力？

2026-02-13 15:09:49　来源: 集智俱乐部

北京举报

分享至

导语

为什么许多社交智能体“写得通顺，却一眼假”？问题往往不在语言能力，而在它们既不像某个稳定的个体，也未真正嵌入社会关系网络。北京通用人工智能研究院联合北京大学研究提出自演化社交智能体 EvoBot，通过生成器与检测器的对抗博弈，让模型在社会反馈中持续升级，逐步学会更真实的个性化表达与社会化互动。

关键词：社交智能体、拟人化生成、个性化、社会化、对抗学习、自演化

孔繁奇、封雪丨作者

论文题目：Enhancing LLM-Based Social Bot via an Adversarial Learning Framework 论文链接：https://aclanthology.org/2025.emnlp-main.1185/ 发表时间：2025年11月4日论文来源： EMNLP 2025

社交平台上，一条“像人”的动态不只取决于语法和知识，更取决于两个更隐蔽的因素：它是否贴合某个具体个体的稳定风格（个性化），以及它是否会被周围社交邻居持续塑造（社会化）。不少大模型“写得对”，却仍然“一眼假”，问题往往不在句子通不通顺，而在它不像某个具体的人在某个具体的圈子里说话。

北京通用人工智能研究院联合北京大学提出了自演化社交智能体 EvoBot，在“生成器-检测器”的对抗博弈框架下，把拟人化生成变成一个能自动升级难度的训练任务，使模型在社交网络中持续迭代。相关成果已被自然语言处理顶会 EMNLP 2025 接收并作 Oral 展示。

问题：社交智能体为什么常常“一眼假”？

当前社交智能体的一个核心瓶颈是“既个性化又社会化”。个性化关乎个体差异，同样是表达赞同，有人简短直接，有人爱用反问，有人习惯加表情或话题标签。社会化关乎邻域影响，好友关系、社区氛围与热点事件会持续改变一个人的发言内容与立场走向。只学到“通用写作能力”的大模型，往往会留下两类稳定的可识别痕迹。其一是风格过于平均，不像某个稳定个体的长期表达分布；其二是生成内容缺少社会语境，看起来像“单机写作”，而不是在关系网络里互动。针对这两个问题，本文提出了一个两阶段训练框架优化模型，先让模型更像某个具体的人，再让模型在“社会反馈”的压力下持续修正自己的表达策略。

方法：把拟人化训练变成“矛与盾”的持续博弈

EvoBot的关键设计，是把“像人”变成一场持续升级的对抗。框架里，生成器（EvoBot）负责模仿人类发布社交动态，检测器（Detector）负责区分“真实人类内容”和“AI生成内容”。具体而言，EvoBot的学习分为两个阶段：

第一阶段：监督微调（SFT），注入个体“人格”。在此阶段，本文利用真实人类用户数据对基础大模型（Llama2-7B）进行监督微调。训练任务是让模型初步学习该社区的表达方式、语言习惯等。通过这一过程，EvoBot初步具备了模仿不同个体、生成个性化内容的能力，这构成了每个智能体的“初始人格”。

第二阶段：对抗性学习，驱动动态“演化”。本文设计了一个由EvoBot（生成器）和基于关系图卷积神经网络（R-GCN）[2] 的Detector（检测器）构成的对抗性学习闭环。与传统方法不同，本文的生成器和检测器是相互适应、协同演化的。在每一轮迭代中，EvoBot生成一批新的“拟人”内容，而检测器的任务就是从这些内容和真实人类内容中，把AI的“仿冒品”揪出来。如果EvoBot生成的内容成功“骗过”了检测器，就会被标记为“更优”样本，指导模型朝这个方向优化；反之，则被标记为“较差”样本，从而构造出偏好数据对，通过直接偏好优化（DPO）[3] 技术驱动EvoBot学习。最关键的是，检测器自身也在不断升级。每一轮博弈后，检测器会将EvoBot的“更优”样本集加入自己的错题集进行再训练，提升识别能力。这就为EvoBot创造了一个任务难度持续提升的学习环境，迫使其不断学习和模仿更高级、更难以分辨的人类行为模式，最终形成一个能力持续增强的良性循环。

图1: EvoBot框架概览

实验：个体层更像人，群体层更像社会

EvoBot不是在“干净、单一”的文本集合里训练，而是直接从真实社交网络中抽取结构与语境。研究使用 TwiBot-22 数据集 [4]，包含约100万用户、近1亿条推文以及好友关系等图结构信息。为了在可控成本下保留网络结构差异，研究采用 Louvain 社区发现方法切分出12个高度连接且具有代表性的社区，这些社区在拓扑形态（星形、网状等）、语言（英语、阿拉伯语、日语、土耳其语等）与话题上都呈现明显差异。这种异质性为本文训练和评估EvoBot在复杂、多元环境下的适应性和类人程度供了坚实的基础。

图2: 12个社区中用户连接关系的可视化

表1: 社区数据统计，包括用户与机器人的数量、边的数量、推文数量和代表语言

具体地，本文在这12个社区上，从个性化和社会化两个角度系统地评估了EvoBot。

个性化评估

首先，本文分析了EvoBot与检测器在4轮对抗训练中的“共同成长”过程。结果清晰地展示了两者间的协同进化。随着迭代的进行，EvoBot规避检测的能力越来越强，意味着它生成的内容越来越类人（如图3中各行所示）。与此同时，检测器的识别性能也在不断提升（如图3中各列所示）。

图3：Detector分类性能。左:F1-score;右:Accuracy。行表示检测器的版本；列表示EvoBot的版本。色块上数值越大表示EvoBot被识别出来的概率越高。

本文对比了最终版的EvoBot与六种基线模型（包括原始Bot、传统GAN、Llama2-7b、GPT-4o-mini，以及两个消融版本）。在两种不同架构（RGCN和GAT）的检测器下，EvoBot均取得了最低的被识别率，展示了其最强的拟人化生成能力。消融实验也证明，监督微调（SFT）和对抗学习（ADV）两个阶段对于最终的优异性能缺一不可。同时，进一步分析表明EvoBot在生成内容多样性和表达风格上都达到了很高的类人水平，这说明EvoBot不仅能生成类人的社交文字而且对人类社交方式有更深层次的理解。

表2: RGCN和GAT检测器下不同生成器的Accuracy和F1-Score。数值越小，说明生成器逃避检测的能力越强。

社会化评估1:群体观点模拟

实验将EvoBot置于多智能体模拟环境中，复现了真实世界中关于“COVID-19”和“俄乌冲突”两大事件的观点演变过程。实验结果表明，相比于传统的基于规则的智能体模型（如BC和Lorenz模型）以及其他LLM基线，无论是在群体平均观点还是观点多样性上，EvoBot都最接近真实数据，成功捕捉到了现实群体中复杂动态的观点变化。这些对比指标均是在事件发生的一段时间内的统计结果，充分证明了EvoBot的优势在于精准捕捉了观点的动态演变过程，而不仅是拟合某个静态的结果。

表3: 群体观点的模拟结果

社会化评估2:信息传播模拟

本文还模拟了关于“超级碗赛事”这一热点新闻在社交网络中的传播过程。结果显示，相比于基线模型，EvoBot驱动的信息传播曲线更贴近真实世界的传播模式，即“初期快速爆发，随后逐渐放缓”的典型规律。这些群体层面的涌现现象，强有力地证明了EvoBot框架在模拟复杂社会动态方面的有效性和先进性。

图4: 随着时间的推移，讨论洛杉矶公羊队超级碗夺冠的累积用户数量变化曲线

总结展望：为什么“自演化”很重要？

在“生成器-检测器”的对抗学习框架下，基于大模型的社交智能体EvoBot持续提升能力，在个性化内容生成和宏观社会现象模拟方面均表现出色，验证了该框架的有效性。

EvoBot所展示的这种自动化的、无需持续外部干预的“自演化”学习框架，为各行业构建更智能、更具适应性的AI智能体提供了一种新的思路和启发。这种通过对抗博弈创造动态学习环境、驱动智能体持续迭代的方法，为解决“如何让智能体在部署后仍能自主学习和进化”这一核心难题提供了宝贵的探索，对未来开发更稳健、更自主的人工智能系统具有一定的借鉴意义。

参考文献

[1] Kong, F., Zhang, X., Chen, X., Yang, Y., Zhu, S. C., & Feng, X. (2025, November). Enhancing llm-based social bot via an adversarial learning framework. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (pp. 23246-23271).

[2] Schlichtkrull, Michael, et al. "Modeling relational data with graph convolutional networks." European semantic web conference. Cham: Springer International Publishing, 2018.

[3] Rafailov, Rafael, et al. "Direct preference optimization: Your language model is secretly a reward model." Advances in neural information processing systems 36 (2023): 53728-53741. Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

[4] Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

群体智能读书会

如果你对这些反直觉但极有用的现象感兴趣——从蚁群搭桥、鱼群同步、到无人机集群表演、集群机器人协作、群智优化与多智能体系统、网络舆论建模研究等——欢迎加入「群体智能」读书会：我们用动物—人类—机器三条线，希望把群体智能的涌现这件事讲清楚、讲透彻；用物理学、数理逻辑、多主体建模、计算传播等多学科视角，去追问同一个核心：集群何以比个体更聪明？群体智能又在何时涌现？

集智俱乐部联合北京师范大学系统科学学院韩战钢教授、暨南大学计算传播研究中心赵甜芳副教授、新疆大学物理科学与技术学院玉素甫·艾比布拉副教授等来自11所高校的学者，共同发起本次，尝试用一条普适的线索，把自然界的鸟群蚁群、人类社会的集群行为、以及人工智能时代的多智能体与群智优化，放在同一张地图上重新理解。读书会自2026年1月17日开始，安排在每周六下午 14:00–16:00，欢迎所有对群体智能如何涌现、如何被理解、以及如何被设计，感兴趣的朋友一起加入：带着问题来，带着更有趣的问题去。

详情请见：

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.