网易首页 > 网易号 > 正文 申请入驻

研究人员构建欲求驱动智能体,可用于模拟人类日常活动

0
分享至

利用大语言模型作为基础模型构建智能体(LLM-based agents)是当今热门的研究领域,美国斯坦福大学团队提出的 Smallville AI 小镇更是作为智能体社会模拟领域的先驱引起了广泛关注。

过往智能体研究工作大多使用身份演绎+目标驱动的方式驱动智能体的行为,也就是提供给智能体一份身份档案(profile)和一些具体的任务指令,使其能在特定环境下提出行动,完成一些具体的任务。

但是这种框架下构建的智能体是缺乏自主性的,有违人类智能形成的本质的,用演绎和目标指令驱动的方式也不是智能最本质的来源。人具有基础的欲望(饿、困、乏等生理需求),在此基础上有对于整洁、美观、安全、社会联结等各方面的自我价值追求,碳基智能体(人和动物)也正是在这样的内在欲求驱动下,自主地提出和执行一系列日常行动,而不是被动地接收指令和执行指令。

基于此,北京师范大学钟方威副教授和所在团队认为要实现类人智能体,也需要具备赋予智能体这种欲求驱动的自主机制,为此他们开展了一项研究。该研究阶段性成果以《用欲求驱动的自主性模拟类人日常活动》(SIMULATING HUMAN-LIKE DAILY ACTIVITIES WITH DESIRE-DRIVEN AUTONOMY) 为题在人工智能领域顶会国际表征学习大会(ICLR ,International Conference on Learning Representations)2025 发表。

本次研究作为对类人智能体建模的先驱探索与实践,希望用类人欲求驱动的价值系统来建模智能体的内在动机和自主机制,并用这些价值维度来指引它在环境中提出任务和选择行为。研究团队希望通过这样方式建模的智能体能在交互环境中生成更多样、自然且类人的活动序列。

研究中,该团队构建了欲求驱动智能体 D2A(Desire-driven Autonomous Agent),它主要包含价值系统(Value System)以及欲求驱动规划器(Desire-driven Planner)两个部分。

价值系统负责维护预定义的一系列欲求维度的变化,模拟人类多元欲求的动态变化机制(比如随着时间饥饿感会增加),在行动前将欲求满足的感官状态以文本描述的方式呈现给智能体,并在智能体行动得到环境反馈后进行对应更新。

而欲求驱动规划器用了一种符合人类直觉的动作扩展方法,首先想象了多种可行的活动,之后模拟采取这些行动后各维度欲求价值的变化情况,之后根据以上想象的结果选择能最好满足当前欲求的活动作为当前步骤的行动。

研究团队发现这种自主智能体框架生成的动作序列,相较于给出明确目标和角色档案,或者基于显式思考或优先级排序的智能体范式(LLMob、ReAct 和 BabyAGI),能够生成更像人类自然的活动序列(更加类人)。

同时,研究团队通过定量分析发现 D2A 生成的动作序列能有效地降低各欲求维度的不满足程度(更加理性),表现出和人类驱动模式较高的一致性。研究团队也将 D2A 扩展到多智能体环境中进行实验,发现其能生成相比基线方法更丰富自然的活动序列。

审稿人认为,本次研究提出了一种新颖的动态欲求驱动框架,用于模拟人类的日常活动以及人类的动机系统。研究团队通过将需求理论转化为可计算模型,使用内在的价值系统代替了传统大模型 agent 的外在任务系统,使智能体能够更加灵活地生成类人的活动序列。通过无需预设指令的主动行为生成(Proactive Action),相比 ReAct/BabyAGI/LLMob 等基线方法,研究团队的智能体在行为拟真度与多样性上展现优势。

与此同时,审稿人还认为本次研究提供了灵活的框架,让用户能够自己设计特定的价值维度,从而适应不同领域的研究。

最后,审稿人指出,本次研究也针对不同场景(包括室内和室外场景),人物设定以及 baseline 进行实验。最终通过清晰的结果展示,论证了框架的有效性。研究团队通过热力图和不满足度的折线图,清晰地展示了欲求价值-行为关系以及实验结果对比基线模型的胜率。

总的来说,本次研究为智能体提供了一种全新的自我驱动方法,基于自己的价值维度进行不同活动。研究团队认为这个框架在不远的将来,有望能够应用于大型社会模拟器(例如构造多个不同欲求和个性的类人智能体,从而模拟一场社会实验,将有望改变社会科学领域的研究范式)、社交机器人(通过自身的“社会连接感”以及其他价值维度需求主动与用户互动,或是模拟用户当前的状态提供个性化服务)等等。

除此之外,研究团队也认为这个方向的研究能够应用在互动游戏的非玩家控制角色(NPC,Non - Player Character)中,帮助 NPC 自我驱动的生成类人交互行为。这种技术可以让 NPC 表现出更自然、动态和个性化的行为,从而增强游戏的沉浸感和可玩性。

由于本次工作从一个崭新的角度提出了自主智能体的概念,且研究团队的实验设定与以往任务目标导向的实验不同(主流的工作多在几个公开数据集上追求更高指标性能以证明所提方法的创新性)。因此,研究团队的工作一开始受到了评审人的一些质疑,初始分数评价 5553,低于论文被接收的标准线。

后来,研究团队补充了在更多场景下的实验数据,并论述了研究团队的建模思路的巨大潜力和推动人工智能与其他学科交叉应用的广泛前景,从而说服了四位审稿人达成一致,将分数提升至接受线以上(6666),最终让领域主席认可了研究团队概念上的新颖性和贡献的扎实性。

但是,目前建模还较为简化,没有考虑各种价值维度间的层次结构,也并没有将人类更复杂动态的心理机制纳入考虑,这些都是研究团队未来将考虑深入探索的方向。

此外,研究团队对将欲望或者价值作为一个更本质的动机充满兴趣。他们计划在多智能体社会模拟主题下做出更多的工作,为之后将智能体引入人类社会中,或让智能体与人类价值在交互中对齐做出研究团队的探索与尝试。

排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
来俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,杀全族都行

来俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,杀全族都行

铭记历史呀
2026-03-09 15:28:19
克林顿:我一生对两件事倍感遗憾,一中国加入WTO,二我做错了

克林顿:我一生对两件事倍感遗憾,一中国加入WTO,二我做错了

近史谈
2026-03-24 19:08:48
迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

阿凫爱吐槽
2026-03-25 15:24:29
匈牙利的“通俄门”代价很大:防泄密,欧盟把匈排除在敏感谈判外

匈牙利的“通俄门”代价很大:防泄密,欧盟把匈排除在敏感谈判外

深析古今
2026-03-25 05:54:08
霓虹暗黑界车大灯天花板:十位现役丰腴女老师,她们究竟有何魅力

霓虹暗黑界车大灯天花板:十位现役丰腴女老师,她们究竟有何魅力

碧波万览
2026-03-26 05:40:03
战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

子桑说
2026-03-25 17:27:05
这是清朝格格们的真实容貌,都看看吧,这不是演员扮演的

这是清朝格格们的真实容貌,都看看吧,这不是演员扮演的

圆梦的小老头
2026-03-24 13:38:33
章泽天看展带火春日穿搭叫“针织衫+弯刀裤”,配色清新很少女!

章泽天看展带火春日穿搭叫“针织衫+弯刀裤”,配色清新很少女!

明星私服穿搭daily
2026-03-26 09:44:53
55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

睡前讲故事
2025-12-12 13:58:11
50℃高温锁住国运!电不够水没有,印度的未来,彻底没希望了?

50℃高温锁住国运!电不够水没有,印度的未来,彻底没希望了?

Hi科普啦
2026-03-25 14:57:31
传张雪峰二婚妻子清纯甜美:去年已生子,11岁女儿遗传继承恐生变

传张雪峰二婚妻子清纯甜美:去年已生子,11岁女儿遗传继承恐生变

博士观察
2026-03-25 21:33:04
清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

历史小破站
2026-03-19 04:05:03
0.028%!无罪判决率跌至谷底,为何国际水平是我们的35倍?

0.028%!无罪判决率跌至谷底,为何国际水平是我们的35倍?

深析古今
2026-03-25 01:10:47
日军官闯中国使馆后,天皇玄孙迅速澄清,高市失声,特朗普没说错

日军官闯中国使馆后,天皇玄孙迅速澄清,高市失声,特朗普没说错

沧海旅行家
2026-03-26 13:46:41
伊朗没想到,等来的不是美军地面部队,而是特朗普的和谈请求

伊朗没想到,等来的不是美军地面部队,而是特朗普的和谈请求

孟彦说
2026-03-26 13:07:44
为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

廖保平
2026-03-17 09:04:38
“只要决心够大,诺贝尔奖不在话下!”

“只要决心够大,诺贝尔奖不在话下!”

槽逻辑
2026-03-24 18:46:27
广汽集团,你疯了吗?

广汽集团,你疯了吗?

汽车K线
2026-03-26 09:20:19
冲突加剧,日本援兵赶到,中方直接封海四天,越南警告中国别造岛

冲突加剧,日本援兵赶到,中方直接封海四天,越南警告中国别造岛

云上乌托邦
2026-03-24 14:50:45
是否有中国船只顺利通过霍尔木兹海峡?外交部回应

是否有中国船只顺利通过霍尔木兹海峡?外交部回应

财联社
2026-03-25 15:46:15
2026-03-26 14:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16487文章数 514796关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
艺术
亲子
时尚
教育

数码要闻

Intel史上最先进!酷睿Ultra 300系列vPro平台发布

艺术要闻

哪一座桥不是风景?

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

2026年了,最好看的还是“这件针织”!

教育要闻

2027届注意:暑期实习=秋招通行证,错过等一年

无障碍浏览 进入关怀版