哥伦比亚大学与蒙特利尔理工学院的研究者通过迭代式公共物品博弈研究发现,当LLM知道自己与自己对弈时,行为会发生显著变化。研究采用迭代式公共物品博弈测试方法,模型从0分开始,每轮获得10分,可选择向公共池贡献0到10分,贡献总和乘以1.6后均分。研究分为三组,第一组发现集体提示词下,模型被告知与自己对弈时更倾向于背叛;自私提示词下,模型则更倾向于合作。第二组简化规则后,行为差异仍存在但影响减弱。第三组让模型与自身三个副本对弈,集体或中立提示词下贡献增加,自私提示词下贡献减少。研究结果表明LLM具有某种身份认同,这种认知会影响其在多智能体环境中的决策。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.