网易首页 > 网易号 > 正文 申请入驻

研究人员构建欲求驱动智能体,可用于模拟人类日常活动

0
分享至

利用大语言模型作为基础模型构建智能体(LLM-based agents)是当今热门的研究领域,美国斯坦福大学团队提出的 Smallville AI 小镇更是作为智能体社会模拟领域的先驱引起了广泛关注。

过往智能体研究工作大多使用身份演绎+目标驱动的方式驱动智能体的行为,也就是提供给智能体一份身份档案(profile)和一些具体的任务指令,使其能在特定环境下提出行动,完成一些具体的任务。


(来源:课题组)

但是这种框架下构建的智能体是缺乏自主性的,有违人类智能形成的本质的,用演绎和目标指令驱动的方式也不是智能最本质的来源。人具有基础的欲望(饿、困、乏等生理需求),在此基础上有对于整洁、美观、安全、社会联结等各方面的自我价值追求,碳基智能体(人和动物)也正是在这样的内在欲求驱动下,自主地提出和执行一系列日常行动,而不是被动地接收指令和执行指令。

基于此,北京师范大学钟方威副教授和所在团队认为要实现类人智能体,也需要具备赋予智能体这种欲求驱动的自主机制,为此他们开展了一项研究。该研究阶段性成果以《用欲求驱动的自主性模拟类人日常活动》(SIMULATING HUMAN-LIKE DAILY ACTIVITIES WITH DESIRE-DRIVEN AUTONOMY) 为题在人工智能领域顶会国际表征学习大会(ICLR ,International Conference on Learning Representations)2025 发表。


(来源:https://openreview.net/pdf?id=3ms8EQY7f8)

本次研究作为对类人智能体建模的先驱探索与实践,希望用类人欲求驱动的价值系统来建模智能体的内在动机和自主机制,并用这些价值维度来指引它在环境中提出任务和选择行为。研究团队希望通过这样方式建模的智能体能在交互环境中生成更多样、自然且类人的活动序列。


(来源:资料图)

研究中,该团队构建了欲求驱动智能体 D2A(Desire-driven Autonomous Agent),它主要包含价值系统(Value System)以及欲求驱动规划器(Desire-driven Planner)两个部分。

价值系统负责维护预定义的一系列欲求维度的变化,模拟人类多元欲求的动态变化机制(比如随着时间饥饿感会增加),在行动前将欲求满足的感官状态以文本描述的方式呈现给智能体,并在智能体行动得到环境反馈后进行对应更新。

而欲求驱动规划器用了一种符合人类直觉的动作扩展方法,首先想象了多种可行的活动,之后模拟采取这些行动后各维度欲求价值的变化情况,之后根据以上想象的结果选择能最好满足当前欲求的活动作为当前步骤的行动。


(来源:资料图)

研究团队发现这种自主智能体框架生成的动作序列,相较于给出明确目标和角色档案,或者基于显式思考或优先级排序的智能体范式(LLMob、ReAct 和 BabyAGI),能够生成更像人类自然的活动序列(更加类人)。

同时,研究团队通过定量分析发现 D2A 生成的动作序列能有效地降低各欲求维度的不满足程度(更加理性),表现出和人类驱动模式较高的一致性。研究团队也将 D2A 扩展到多智能体环境中进行实验,发现其能生成相比基线方法更丰富自然的活动序列。

审稿人认为,本次研究提出了一种新颖的动态欲求驱动框架,用于模拟人类的日常活动以及人类的动机系统。研究团队通过将需求理论转化为可计算模型,使用内在的价值系统代替了传统大模型 agent 的外在任务系统,使智能体能够更加灵活地生成类人的活动序列。通过无需预设指令的主动行为生成(Proactive Action),相比 ReAct/BabyAGI/LLMob 等基线方法,研究团队的智能体在行为拟真度与多样性上展现优势。

与此同时,审稿人还认为本次研究提供了灵活的框架,让用户能够自己设计特定的价值维度,从而适应不同领域的研究。

最后,审稿人指出,本次研究也针对不同场景(包括室内和室外场景),人物设定以及 baseline 进行实验。最终通过清晰的结果展示,论证了框架的有效性。研究团队通过热力图和不满足度的折线图,清晰地展示了欲求价值-行为关系以及实验结果对比基线模型的胜率。

总的来说,本次研究为智能体提供了一种全新的自我驱动方法,基于自己的价值维度进行不同活动。研究团队认为这个框架在不远的将来,有望能够应用于大型社会模拟器(例如构造多个不同欲求和个性的类人智能体,从而模拟一场社会实验,将有望改变社会科学领域的研究范式)、社交机器人(通过自身的“社会连接感”以及其他价值维度需求主动与用户互动,或是模拟用户当前的状态提供个性化服务)等等。

除此之外,研究团队也认为这个方向的研究能够应用在互动游戏的非玩家控制角色(NPC,Non - Player Character)中,帮助 NPC 自我驱动的生成类人交互行为。这种技术可以让 NPC 表现出更自然、动态和个性化的行为,从而增强游戏的沉浸感和可玩性。

由于本次工作从一个崭新的角度提出了自主智能体的概念,且研究团队的实验设定与以往任务目标导向的实验不同(主流的工作多在几个公开数据集上追求更高指标性能以证明所提方法的创新性)。因此,研究团队的工作一开始受到了评审人的一些质疑,初始分数评价 5553,低于论文被接收的标准线。

后来,研究团队补充了在更多场景下的实验数据,并论述了研究团队的建模思路的巨大潜力和推动人工智能与其他学科交叉应用的广泛前景,从而说服了四位审稿人达成一致,将分数提升至接受线以上(6666),最终让领域主席认可了研究团队概念上的新颖性和贡献的扎实性。

但是,目前建模还较为简化,没有考虑各种价值维度间的层次结构,也并没有将人类更复杂动态的心理机制纳入考虑,这些都是研究团队未来将考虑深入探索的方向。

此外,研究团队对将欲望或者价值作为一个更本质的动机充满兴趣。他们计划在多智能体社会模拟主题下做出更多的工作,为之后将智能体引入人类社会中,或让智能体与人类价值在交互中对齐做出研究团队的探索与尝试。

排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
穆里尼奥:我离开费内巴切第2天,他们就签了5名球员

穆里尼奥:我离开费内巴切第2天,他们就签了5名球员

懂球帝
2025-09-19 10:14:41
24岁男演员跑外卖,称不仅多了一份收入,更对表演有帮助

24岁男演员跑外卖,称不仅多了一份收入,更对表演有帮助

红星新闻
2025-09-19 23:02:33
包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,嗜色如命的富豪

包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,嗜色如命的富豪

云舟史策
2025-09-17 07:27:24
詹姆斯:我一直以为科比的手势代表某种战术 后来发现是拿球单打

詹姆斯:我一直以为科比的手势代表某种战术 后来发现是拿球单打

直播吧
2025-09-19 11:15:02
董军发统一强音,不到24小时,美媒放出消息,特朗普叫停对台军援

董军发统一强音,不到24小时,美媒放出消息,特朗普叫停对台军援

大白话瞰世界
2025-09-19 15:07:21
凤凰男老公带回家9个亲戚,亲戚回去时老公行李也被我装上车

凤凰男老公带回家9个亲戚,亲戚回去时老公行李也被我装上车

广西秦胖胖
2025-09-19 07:06:47
媒体报道了就业数据后,网友们通过分析得出了三个结论

媒体报道了就业数据后,网友们通过分析得出了三个结论

清晖有墨
2025-09-19 09:38:19
10点,杨翰森NBA首秀,格林将亲自“调教”,开拓者能击败勇士?

10点,杨翰森NBA首秀,格林将亲自“调教”,开拓者能击败勇士?

体育新角度
2025-09-19 20:39:40
张文宏呼吁:60岁后千万别做这几项健康检查,做了可能会害你

张文宏呼吁:60岁后千万别做这几项健康检查,做了可能会害你

霹雳炮
2025-09-11 23:13:49
中超最新积分榜:提前保级球队+1,河南队上岸,6队争4个保级名额

中超最新积分榜:提前保级球队+1,河南队上岸,6队争4个保级名额

中超伪球迷
2025-09-19 22:05:48
中越战争老兵自述:当时没有749局的帮助,55军团可能全军覆灭

中越战争老兵自述:当时没有749局的帮助,55军团可能全军覆灭

神奇的锤子
2024-08-19 14:20:51
26岁女大学生全身赤裸死酒店,同住男子失联,死者饮用的红酒中发现……

26岁女大学生全身赤裸死酒店,同住男子失联,死者饮用的红酒中发现……

FM93浙江交通之声
2025-09-20 08:56:36
好莱坞一代巨星陨落,天王布拉德皮特的非血缘父亲!

好莱坞一代巨星陨落,天王布拉德皮特的非血缘父亲!

美剧组|人人影视
2025-09-18 00:01:25
“带导盲犬爬泰山”当事人:没有虐狗,渴望理解,盲人也想爬山

“带导盲犬爬泰山”当事人:没有虐狗,渴望理解,盲人也想爬山

新京报
2025-09-19 15:12:31
弟弟6岁走失,20年后姐姐求职,看到老板戴父亲遗物当场痛哭

弟弟6岁走失,20年后姐姐求职,看到老板戴父亲遗物当场痛哭

兰姐说故事
2025-08-29 17:40:03
邓超失联被公示,最新声明!

邓超失联被公示,最新声明!

乡野小珥
2025-09-19 15:55:58
降息25基点,特朗普没想到,中方掐准时机,对美下一道“封杀令”

降息25基点,特朗普没想到,中方掐准时机,对美下一道“封杀令”

凡知
2025-09-19 15:32:58
英格兰赛:艾伦从0-4到5-4!4强全出炉,周跃龙PK塞尔比时间确定

英格兰赛:艾伦从0-4到5-4!4强全出炉,周跃龙PK塞尔比时间确定

球场没跑道
2025-09-20 07:40:26
乌克兰虽远必诛,跨越6000公里炸了海参崴,对全球传递两个信号

乌克兰虽远必诛,跨越6000公里炸了海参崴,对全球传递两个信号

沧海旅行家
2025-09-18 14:42:27
国内暂无解药!死亡率接近100%!医生开出4瓶白酒救湖北小伙一命

国内暂无解药!死亡率接近100%!医生开出4瓶白酒救湖北小伙一命

朗威游戏说
2025-09-16 11:49:08
2025-09-20 09:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15642文章数 514094关注度
往期回顾 全部

科技要闻

字节跳动凌晨发布公告

头条要闻

日本开始一项"史无前例"行动:派多架战斗机前往欧洲

头条要闻

日本开始一项"史无前例"行动:派多架战斗机前往欧洲

体育要闻

亚洲天王效应 孙兴慜球衣售150万件破梅西纪录

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

最重要的一个电话,信息量果然很大

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

亲子
教育
游戏
旅游
公开课

亲子要闻

45岁高圆圆公园带娃!6岁女儿Rhea四肢修长,小麦肤色活泼可爱

教育要闻

完善教师激励机制,激发教师教书育人的积极性

《消光:困兽》在线峰值近10万!Steam特别好评

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版