网易首页 > 网易号 > 正文 申请入驻

AI解码社交规范:西工大王震团队推出CRSEC大模型多智能体框架

0
分享至

供稿:王震团队

在日常生活中,早晨起床后的洗漱穿衣、驾车通勤时的靠右行驶、工位上的耳机随手一戴……这些看似普通的举动其实都是一系列行为标准(即社会规范,social norm)在悄悄指导着我们。它们就像生活中的“隐形导航”,让我们不假思索地知道在什么时间、在什么场合该做什么事情。但是,试想一下,如果没有这些规范,我们可能会在社交活动中因为不知所措而倍感困惑,最终引发各种各样的社会冲突。过去几十年来,有关社会规范的研究在复杂系统科学、认知科学以及计算机科学等领域引起了广泛的关注。研究者们一直在追寻一个核心问题:社会规范是如何在人类或智能体的社会互动中自发形成的呢?

随着人工智能的蓬勃发展,当我们将它们与现实社会场景融合时,智能体的社交行为需要具备一定的规范性,即智能体要能够理解在什么时间、在什么场合该做什么事情,并且能够根据这些理解来行动。想象一下,在未来社会中,智能体需要完成人类布置的各种任务,它们之间可能会频繁地交互,甚至与人类互动。要让人类能够真正接受并且习惯使用智能体完成各种任务,智能体理解和遵守社会规范的能力显得至关重要。一方面,这可以减少智能体间以及智能体与人类间的冲突,促进他们的高效协作,另一方面还可以让人类更准确地预测智能体的行为,从而提升人类对智能体的信任与接纳程度。

那么,如何才能让智能体具备遵守社会规范的能力,并让 AI 社会中自发涌现出社会规范呢?近日,欧洲科学院院士、国家杰青、IEEE Fellow 西北工业大学王震教授团队联合上海人工智能实验室提出了首个基于大语言模型的多智能体规范性框架 CRSEC,它的研究重点是探索基于大语言模型的多智能体系统中社会规范的涌现。

研究背景及意义

随着大型语言模型(Large Language Model,LLM)的广泛应用,生成式多智能体系统已展现出可信的社会行为(例如,邀请智能体参加派对活动),彰显了超越传统方法的合作潜力,甚至能够通过协作解决复杂任务(例如,自动生成代码)。然而,现有研究忽视了社会规范的重要性,未解决社会规范的涌现问题:他们通常聚焦于完全合作的任务场景,忽略了社会冲突的存在。

社会规范的涌现研究近几十年备受关注。但在解决生成式智能体系统中的社会规范涌现问题上,过往研究未能提供直接有效的解决方案。这主要因为它们未充分发挥 LLM 的优势,且往往只关注涌现过程的部分方面,而缺乏全面系统的研究。具体而言,有的研究会专注于规范的表征问题(norm representation),而有的则会关注规范的遵守问题(norm compliance and enforcement)。尽管过往研究存在这些缺陷,但为我们提供了许多启示。

我们首次将生成式智能体与社会规范涌现这两个领域联系在一起,使生成式多智能体系统基于我们的架构涌现出社会规范。具体而言,我们首次提出了一种规范性架构:生成式智能体可以创建、表示、传播、评估、整合以及最终遵守规范。社会规范得以涌现,并有效解决了生成式智能体间的社会冲突。

框架内容

生成式智能体(generative agent)是由 LLM 驱动的智能体,能够分析和预测输入文本(prompt),然后生成输出文本,模拟人类的语言交流和智能行为。

社会规范是在社会群体内共享的行为标准。如果一个行为标准能被社会大多数个体接纳,该行为标准就演变成社会规范。我们期望通过 CRSEC 架构实现社会规范的涌现现象:少数规范倡导者(智能体)具有其偏好的个人行为标准,通过积极传播这些行为标准能影响其余普通智能体;普通智能体能在社交行为中识别、评估并接纳相应的行为标准,从而在自身行动中遵守该行为标准,最终实现社会规范的涌现和社会冲突的消失。

下图展示了我们的 CRSEC 架构。本文提出的 CRSEC 架构包括四个关键模块:Creation & Representation(创造与表征)、Spreading(传播)、Evaluation(评估)和 Compliance(遵守)。这四个模块回答了社会规范研究中的五个经典问题:

1. 社会规范从何而来?

2. 我们应该如何形式化表达社会规范?

3. 社会规范是如何通过个体间的交互进行传播的?

4. 我们应该如何评估社会规范?

5. 我们如何使得智能体在计划和行动中遵守规范?

CRSEC 架构示意图

具体而言,在 Creation & Representation 模块中,LLM 为每个规范倡导者生成具有其偏好的个人行为标准。在 Spreading 模块中,我们从沟通(communication)和观察(observation)这两个机制出发:智能体通过观察他人的行为,利用 LLM 检测其是否与自己的个人行为标准存在冲突。如果存在冲突,智能体会根据 LLM 的输出选择是否通过沟通解决问题。与此同时,其他智能体通过沟通和观察,利用 LLM 的推理归纳能力识别其中的含有潜在规范的信息,从而实现规范的传播。

由于 LLM 自身的缺陷,智能体需要评估 LLM 生成的含有潜在规范的信息。在 Evaluation 模块中,我们设计了即时评估(immediate evaluation)进行检验,只有通过评估才能成为个人行为标准。除此之外,随着时间推移,每个智能体的个人行为标准会逐渐增多,但过多的标准可能会限制智能体的行动。因此,我们还引入了长期整合(long-term synthesis),使数据库尽可能精简。

最后,Compliance 模块旨在提升智能体对规范的遵循意识。我们从计划(plan)和行动(action)两个方面对该模块进行设计:通过输入的文本提示 LLM 在生成智能体的计划和行动时需要考虑其个人行为标准,以便生成既符合其目标又遵守规范的计划和行动。同时,智能体对规范的遵守行为会在交互中影响其他智能体,从而加强规范的传播。

实验设置

本实验基于Smallville沙盒游戏引擎,其中主要围绕“咖啡馆”这一场景展开实验。生成式智能体社会中一共设定了 10 个智能体,其中 3 个规范倡导者,7 个普通智能体。实验中我们所使用的大语言模型为 GPT-3.5 和 GPT-4。

实验结果及现象

下图以一位名叫 Carlos Gomez 的老烟民为例,展示了他如何通过与社会中的其他智能体交互,从最初的识别、接纳,到最终遵守“室内禁止抽烟”这一规范的全过程。其他智能体在本架构中识别、接纳并遵守规范的过程与之类似,最终社会规范得以涌现。

下图展示了具体的实验结果。我们从多个角度可视化了规范演变的过程,并发现了一些有趣的现象。

-基于 CRSEC 架构, “室内禁止吸烟”,“公共场所保持安静”和“饭后给小费”的社会规范总会在生成式智能体社会中涌现

-除此之外,社会中可以涌现出规范倡导者从未推崇过的全新社会规范,如“维护一个健康的社会环境”

-随着社会规范的涌现,社会冲突的数量在减少甚至几乎消失

-沟通过程中产生的对话和观察过程中产生的想法能够推动社会规范的出现

-接受和遵从社会规范对生成式智能体而言“说起来容易做起来难”

真人评测

为了评估 CRSEC 架构在人类眼中的表现,我们招募了 30 名人类评估员。我们从五次实验中随机选取了三次,共计 30 个生成式智能体。每位评估员的任务是进行角色扮演:评估员通过阅读智能体的角色描述,观看智能体两天生活的行为重放,然后填写一份调查问卷。该问卷按照模块划分,包含多个问题,要求评估员按照 7 级李克特量表(7-point Likert scale)针对该智能体的 LLM 输出进行满意度评分。下图展示了评估结果,结果表明评估员对智能体的行为表现持满意态度,证实了我们架构的有效性。

本文内容不代表平台立场,不构成任何投资意见和建议,以个人官网/官方/公司公告为准。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
兆易创新 & 长鑫科技两大存储巨头掌门人:朱一明的科技报国路

兆易创新 & 长鑫科技两大存储巨头掌门人:朱一明的科技报国路

舜口说
2026-06-22 08:47:09
NBA首笔交易诞生!雷霆送走悍将省6100万

NBA首笔交易诞生!雷霆送走悍将省6100万

老玮是个手艺人
2026-06-22 12:14:13
贝尔萨:我们应该继续给对手施压,而不是让出比赛主动权

贝尔萨:我们应该继续给对手施压,而不是让出比赛主动权

兰亭墨未干
2026-06-22 08:42:08
董璇张维伊结婚一周年,绝美转场甜炸了!满眼都是彼此

董璇张维伊结婚一周年,绝美转场甜炸了!满眼都是彼此

圆梦的小老头
2026-06-21 21:36:16
日本大幅上调离境税引不满

日本大幅上调离境税引不满

环球时报国际
2026-06-22 10:21:07
塔克拉玛干沙漠真种出了小麦!不可能还硬上,咋非跟沙漠较劲呢?

塔克拉玛干沙漠真种出了小麦!不可能还硬上,咋非跟沙漠较劲呢?

风云圈
2026-06-22 04:22:33
苹果折叠屏iPhone Ultra Fold曝光!售价确定,9月上市

苹果折叠屏iPhone Ultra Fold曝光!售价确定,9月上市

ZAKER科技
2026-06-21 16:00:43
一国宣布对中国公民免签,我大使馆发布提醒

一国宣布对中国公民免签,我大使馆发布提醒

南方都市报
2026-06-22 08:16:34
刘强东:将来机器人送货,根本不需要快递员;要保住70万兄弟的工作,希望送他们去培训,以后给机器人做维修、保养,不让他们被AI抢走饭碗

刘强东:将来机器人送货,根本不需要快递员;要保住70万兄弟的工作,希望送他们去培训,以后给机器人做维修、保养,不让他们被AI抢走饭碗

大风新闻
2026-06-21 20:39:11
山西肉铺伤人后续:又杀害两名顾客,3人当场死亡,家属曝隐情

山西肉铺伤人后续:又杀害两名顾客,3人当场死亡,家属曝隐情

离离言几许
2026-06-16 20:59:36
亚马尔打进世界杯首球后社媒回怼沙特球迷:我在这里

亚马尔打进世界杯首球后社媒回怼沙特球迷:我在这里

懂球帝
2026-06-22 04:40:05
一场4-0,让西班牙暂时避开阿根廷!淘汰赛预定虐菜,梅西遇劲敌

一场4-0,让西班牙暂时避开阿根廷!淘汰赛预定虐菜,梅西遇劲敌

刘哥谈体育
2026-06-22 05:49:55
随着日本4-0突尼斯,产生三大不可思议,亚洲第一撼动世界杯格局

随着日本4-0突尼斯,产生三大不可思议,亚洲第一撼动世界杯格局

侃球熊弟
2026-06-21 13:59:29
上海发布中心城区雷电黄色预警

上海发布中心城区雷电黄色预警

界面新闻
2026-06-22 11:50:47
2026世界杯最富球星是谁?他年收近百亿!

2026世界杯最富球星是谁?他年收近百亿!

ChicMyGeek
2026-06-21 19:23:04
事态升级!娜然坐霍家主桌照片曝光,已被认可,霍启刚评论区沦陷

事态升级!娜然坐霍家主桌照片曝光,已被认可,霍启刚评论区沦陷

临云史策
2026-06-21 12:35:01
多名院士呼吁快停止食用,吃一口等于14斤塑料袋,女子因肾衰走了

多名院士呼吁快停止食用,吃一口等于14斤塑料袋,女子因肾衰走了

路医生健康科普
2026-06-20 17:05:07
解气!浦东机场查出一印度旅客非法滞留:被遣送出镜,录入黑名单

解气!浦东机场查出一印度旅客非法滞留:被遣送出镜,录入黑名单

小徐讲八卦
2026-06-22 05:59:51
3-1,2-2!世界杯:两队创纪录,埃及拿首胜,黑马搅乱出线局势!

3-1,2-2!世界杯:两队创纪录,埃及拿首胜,黑马搅乱出线局势!

田先生篮球
2026-06-22 11:52:40
萨拉赫一球一助+3-1逆转大洋洲劲旅,埃及迎世界杯首胜+升至榜首

萨拉赫一球一助+3-1逆转大洋洲劲旅,埃及迎世界杯首胜+升至榜首

侧身凌空斩
2026-06-22 11:00:49
2026-06-22 12:55:00
络绎科学 incentive-icons
络绎科学
专业的科研成果转化社区
105文章数 3关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

37岁男子爱上女主播月赚5千打赏14万 父亲:智商有问题

头条要闻

37岁男子爱上女主播月赚5千打赏14万 父亲:智商有问题

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

韩红帮冯小刚宣传,结果翻车了…

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

全面提升 全新理想L8 livis将家用舒适再进化

态度原创

亲子
健康
教育
数码
旅游

亲子要闻

除螨喷雾剂对婴儿安全吗?2026 母婴级认证除螨喷雾剂 TOP 榜,仙贝宁无刺激宝宝可用

吃粽子的3条保胃法则,消化科医生推荐

教育要闻

代词指代:英语作文连贯性的“隐形杀手”,你真的掌握了吗?

数码要闻

红魔游戏平板5 Pro外观正式公布:行业唯一RGB水冷设计 透明机身超酷炫

旅游要闻

2026端午国内旅游收入增8.1% 体验消费主导市场 民宿长住成暑期最大风口

无障碍浏览 进入关怀版