网易首页 > 网易号 > 正文 申请入驻

通研院&北大:智能体如何提升社交能力?

0
分享至


导语

为什么许多社交智能体“写得通顺,却一眼假”?问题往往不在语言能力,而在它们既不像某个稳定的个体,也未真正嵌入社会关系网络。北京通用人工智能研究院联合北京大学研究提出自演化社交智能体 EvoBot,通过生成器与检测器的对抗博弈,让模型在社会反馈中持续升级,逐步学会更真实的个性化表达与社会化互动。

关键词:社交智能体、拟人化生成、个性化、社会化、对抗学习、自演化

孔繁奇、封雪丨作者


论文题目:Enhancing LLM-Based Social Bot via an Adversarial Learning Framework 论文链接:https://aclanthology.org/2025.emnlp-main.1185/ 发表时间:2025年11月4日 论文来源: EMNLP 2025

社交平台上,一条“像人”的动态不只取决于语法和知识,更取决于两个更隐蔽的因素:它是否贴合某个具体个体的稳定风格(个性化),以及它是否会被周围社交邻居持续塑造(社会化)。不少大模型“写得对”,却仍然“一眼假”,问题往往不在句子通不通顺,而在它不像某个具体的人在某个具体的圈子里说话。

北京通用人工智能研究院联合北京大学提出了自演化社交智能体 EvoBot,在“生成器-检测器”的对抗博弈框架下,把拟人化生成变成一个能自动升级难度的训练任务,使模型在社交网络中持续迭代。相关成果已被自然语言处理顶会 EMNLP 2025 接收并作 Oral 展示。

问题:社交智能体为什么常常“一眼假”?

当前社交智能体的一个核心瓶颈是“既个性化又社会化”。个性化关乎个体差异,同样是表达赞同,有人简短直接,有人爱用反问,有人习惯加表情或话题标签。社会化关乎邻域影响,好友关系、社区氛围与热点事件会持续改变一个人的发言内容与立场走向。只学到“通用写作能力”的大模型,往往会留下两类稳定的可识别痕迹。其一是风格过于平均,不像某个稳定个体的长期表达分布;其二是生成内容缺少社会语境,看起来像“单机写作”,而不是在关系网络里互动。针对这两个问题,本文提出了一个两阶段训练框架优化模型,先让模型更像某个具体的人,再让模型在“社会反馈”的压力下持续修正自己的表达策略。

方法:把拟人化训练变成“矛与盾”的持续博弈

EvoBot的关键设计,是把“像人”变成一场持续升级的对抗。框架里,生成器(EvoBot)负责模仿人类发布社交动态,检测器(Detector)负责区分“真实人类内容”和“AI生成内容”。具体而言,EvoBot的学习分为两个阶段:

第一阶段:监督微调(SFT),注入个体“人格”。在此阶段,本文利用真实人类用户数据对基础大模型(Llama2-7B)进行监督微调。训练任务是让模型初步学习该社区的表达方式、语言习惯等。通过这一过程,EvoBot初步具备了模仿不同个体、生成个性化内容的能力,这构成了每个智能体的“初始人格”。

第二阶段:对抗性学习,驱动动态“演化”。本文设计了一个由EvoBot(生成器)和基于关系图卷积神经网络(R-GCN)[2] 的Detector(检测器)构成的对抗性学习闭环。与传统方法不同,本文的生成器和检测器是相互适应、协同演化的。在每一轮迭代中,EvoBot生成一批新的“拟人”内容,而检测器的任务就是从这些内容和真实人类内容中,把AI的“仿冒品”揪出来。如果EvoBot生成的内容成功“骗过”了检测器,就会被标记为“更优”样本,指导模型朝这个方向优化;反之,则被标记为“较差”样本,从而构造出偏好数据对,通过直接偏好优化(DPO)[3] 技术驱动EvoBot学习。最关键的是,检测器自身也在不断升级。每一轮博弈后,检测器会将EvoBot的“更优”样本集加入自己的错题集进行再训练,提升识别能力。这就为EvoBot创造了一个任务难度持续提升的学习环境,迫使其不断学习和模仿更高级、更难以分辨的人类行为模式,最终形成一个能力持续增强的良性循环。


图1: EvoBot框架概览

实验:个体层更像人,群体层更像社会

EvoBot不是在“干净、单一”的文本集合里训练,而是直接从真实社交网络中抽取结构与语境。研究使用 TwiBot-22 数据集 [4],包含约100万用户、近1亿条推文以及好友关系等图结构信息。为了在可控成本下保留网络结构差异,研究采用 Louvain 社区发现方法切分出12个高度连接且具有代表性的社区,这些社区在拓扑形态(星形、网状等)、语言(英语、阿拉伯语、日语、土耳其语等)与话题上都呈现明显差异。这种异质性为本文训练和评估EvoBot在复杂、多元环境下的适应性和类人程度供了坚实的基础。


图2: 12个社区中用户连接关系的可视化


表1: 社区数据统计,包括用户与机器人的数量、边的数量、推文数量和代表语言

具体地,本文在这12个社区上,从个性化和社会化两个角度系统地评估了EvoBot。

个性化评估

首先,本文分析了EvoBot与检测器在4轮对抗训练中的“共同成长”过程。结果清晰地展示了两者间的协同进化。随着迭代的进行,EvoBot规避检测的能力越来越强,意味着它生成的内容越来越类人(如图3中各行所示)。与此同时,检测器的识别性能也在不断提升(如图3中各列所示)。


图3:Detector分类性能。左:F1-score;右:Accuracy。行表示检测器的版本;列表示EvoBot的版本。色块上数值越大表示EvoBot被识别出来的概率越高。

本文对比了最终版的EvoBot与六种基线模型(包括原始Bot、传统GAN、Llama2-7b、GPT-4o-mini,以及两个消融版本)。在两种不同架构(RGCN和GAT)的检测器下,EvoBot均取得了最低的被识别率,展示了其最强的拟人化生成能力。消融实验也证明,监督微调(SFT)和对抗学习(ADV)两个阶段对于最终的优异性能缺一不可。同时,进一步分析表明EvoBot在生成内容多样性和表达风格上都达到了很高的类人水平,这说明EvoBot不仅能生成类人的社交文字而且对人类社交方式有更深层次的理解。


表2: RGCN和GAT检测器下不同生成器的Accuracy和F1-Score。数值越小,说明生成器逃避检测的能力越强。

社会化评估1:群体观点模拟

实验将EvoBot置于多智能体模拟环境中,复现了真实世界中关于“COVID-19”和“俄乌冲突”两大事件的观点演变过程。实验结果表明,相比于传统的基于规则的智能体模型(如BC和Lorenz模型)以及其他LLM基线,无论是在群体平均观点还是观点多样性上,EvoBot都最接近真实数据,成功捕捉到了现实群体中复杂动态的观点变化。这些对比指标均是在事件发生的一段时间内的统计结果,充分证明了EvoBot的优势在于精准捕捉了观点的动态演变过程,而不仅是拟合某个静态的结果。


表3: 群体观点的模拟结果

社会化评估2:信息传播模拟

本文还模拟了关于“超级碗赛事”这一热点新闻在社交网络中的传播过程。结果显示,相比于基线模型,EvoBot驱动的信息传播曲线更贴近真实世界的传播模式,即“初期快速爆发,随后逐渐放缓”的典型规律。这些群体层面的涌现现象,强有力地证明了EvoBot框架在模拟复杂社会动态方面的有效性和先进性。


图4: 随着时间的推移,讨论洛杉矶公羊队超级碗夺冠的累积用户数量变化曲线

总结展望:为什么“自演化”很重要?

在“生成器-检测器”的对抗学习框架下,基于大模型的社交智能体EvoBot持续提升能力,在个性化内容生成和宏观社会现象模拟方面均表现出色,验证了该框架的有效性。

EvoBot所展示的这种自动化的、无需持续外部干预的“自演化”学习框架,为各行业构建更智能、更具适应性的AI智能体提供了一种新的思路和启发。这种通过对抗博弈创造动态学习环境、驱动智能体持续迭代的方法,为解决“如何让智能体在部署后仍能自主学习和进化”这一核心难题提供了宝贵的探索,对未来开发更稳健、更自主的人工智能系统具有一定的借鉴意义。

参考文献

[1] Kong, F., Zhang, X., Chen, X., Yang, Y., Zhu, S. C., & Feng, X. (2025, November). Enhancing llm-based social bot via an adversarial learning framework. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing (pp. 23246-23271).

[2] Schlichtkrull, Michael, et al. "Modeling relational data with graph convolutional networks." European semantic web conference. Cham: Springer International Publishing, 2018.

[3] Rafailov, Rafael, et al. "Direct preference optimization: Your language model is secretly a reward model." Advances in neural information processing systems 36 (2023): 53728-53741. Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

[4] Feng, Shangbin, et al. "Twibot-22: Towards graph-based twitter bot detection." Advances in Neural Information Processing Systems 35 (2022): 35254-35269.

群体智能读书会

如果你对这些反直觉但极有用的现象感兴趣——从蚁群搭桥、鱼群同步、到无人机集群表演、集群机器人协作、群智优化与多智能体系统、网络舆论建模研究等——欢迎加入「群体智能」读书会:我们用动物—人类—机器三条线,希望把群体智能的涌现这件事讲清楚、讲透彻;用物理学、数理逻辑、多主体建模、计算传播等多学科视角,去追问同一个核心:集群何以比个体更聪明?群体智能又在何时涌现?

集智俱乐部联合北京师范大学系统科学学院韩战钢教授、暨南大学计算传播研究中心赵甜芳副教授、新疆大学物理科学与技术学院玉素甫·艾比布拉副教授等来自11所高校的学者,共同发起本次,尝试用一条普适的线索,把自然界的鸟群蚁群、人类社会的集群行为、以及人工智能时代的多智能体与群智优化,放在同一张地图上重新理解。读书会自2026年1月17日开始,安排在每周六下午 14:00–16:00,欢迎所有对群体智能如何涌现、如何被理解、以及如何被设计,感兴趣的朋友一起加入:带着问题来,带着更有趣的问题去。



详情请见:

1.

2.

3.

4.

5.

6.

7.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
以色列南部遭伊朗导弹袭击

以色列南部遭伊朗导弹袭击

财联社
2026-04-08 05:26:29
35岁北大韦东奕,宣布喜讯!

35岁北大韦东奕,宣布喜讯!

深度知局
2026-04-08 20:16:28
71岁辽足功勋离世!妻子是女篮名帅,女儿六冠王,一门三杰太传奇

71岁辽足功勋离世!妻子是女篮名帅,女儿六冠王,一门三杰太传奇

洲洲影视娱评
2026-04-08 20:14:24
湖南省人民政府办公厅原一级巡视员郑建新被“双开”

湖南省人民政府办公厅原一级巡视员郑建新被“双开”

界面新闻
2026-04-08 09:03:54
6天升1米,中国第一大淡水湖水位突破13米,今年夏季会不会雨少?

6天升1米,中国第一大淡水湖水位突破13米,今年夏季会不会雨少?

环球科学猫
2026-04-07 13:24:24
轰30分+三分9中8!中国女篮19岁新星崛起:女版欧文闪耀大学联赛

轰30分+三分9中8!中国女篮19岁新星崛起:女版欧文闪耀大学联赛

李喜林篮球绝杀
2026-04-08 12:26:34
诈尸了!哈梅内伊死而复生?特朗普大秀军功,伊朗做出了一个举动

诈尸了!哈梅内伊死而复生?特朗普大秀军功,伊朗做出了一个举动

阿笎评论哥
2026-04-07 16:48:55
老牌日系车企卖不过新势力!本田3月在华销量3.62万辆,不及零跑、理想

老牌日系车企卖不过新势力!本田3月在华销量3.62万辆,不及零跑、理想

澎湃新闻
2026-04-08 21:02:29
抵达南京!郑丽文这套服装的3层深意,90%的人都没看懂

抵达南京!郑丽文这套服装的3层深意,90%的人都没看懂

靓仔情感
2026-04-07 20:34:48
特朗普称能轻易恢复对伊朗动武

特朗普称能轻易恢复对伊朗动武

新华社
2026-04-08 17:56:01
特朗普刚按下停火按钮,又收到一个更坏消息:美国经济或陷入衰退

特朗普刚按下停火按钮,又收到一个更坏消息:美国经济或陷入衰退

丁丁鲤史纪
2026-04-08 16:42:48
又开打了!不是美军,不是以色列,阿联酋不宣而战,炸伊朗炼油厂

又开打了!不是美军,不是以色列,阿联酋不宣而战,炸伊朗炼油厂

军机Talk
2026-04-08 19:28:10
陈丽华公司曝离世内幕,对迟重瑞称呼暴露关系,生前的话字字催泪

陈丽华公司曝离世内幕,对迟重瑞称呼暴露关系,生前的话字字催泪

天马幸福的人生
2026-04-08 03:49:00
2.0升!丰田新车官宣:17.98万元起

2.0升!丰田新车官宣:17.98万元起

手机评测室
2026-04-08 11:49:40
内塔尼亚胡证实以色列袭击伊朗铁路桥梁

内塔尼亚胡证实以色列袭击伊朗铁路桥梁

新京报
2026-04-07 22:22:12
网传282人微信群:不准骂任何运动员,但全红婵除外,查完才知是假的

网传282人微信群:不准骂任何运动员,但全红婵除外,查完才知是假的

罗纳尔说个球
2026-04-07 21:50:44
骗走50亿被央视曝光!用小鲜肉的血抗衰,“捞金女王”这次真栽了

骗走50亿被央视曝光!用小鲜肉的血抗衰,“捞金女王”这次真栽了

涵豆说娱
2026-04-08 18:36:49
彻底崩了!《乘风2026》突发停播,倪萍道歉没用,节目组兜不住了

彻底崩了!《乘风2026》突发停播,倪萍道歉没用,节目组兜不住了

橙星文娱
2026-04-06 10:24:31
东北3岁小网红继续做吃播,父母是真不想上班

东北3岁小网红继续做吃播,父母是真不想上班

九方鱼论
2026-04-07 05:02:58
耻辱?30岁大满贯冠军生涯首次吞双蛋!仅得17分,将球拍砸烂泄愤

耻辱?30岁大满贯冠军生涯首次吞双蛋!仅得17分,将球拍砸烂泄愤

我爱英超
2026-04-08 19:16:48
2026-04-08 23:00:49
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5748文章数 4667关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

艺术
亲子
手机
公开课
军事航空

艺术要闻

齐白石『凌波仙子』

亲子要闻

胡图图说他差几分就能兑换发卡

手机要闻

雷军:REDMI K90 Max夺冠 4小时重载游戏不超37℃

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

文化符号当“弹药” 美伊将信息战带入新阶段

无障碍浏览 进入关怀版