随着人工智能(AI)技术的快速发展,大语言模型(如DeepSeek)因其强大的语言理解和生成能力,逐渐被应用于心理学领域,尤其是在生成“虚拟被试”上。但这些虚拟被试能否准确反映真实人群的心理特征,尤其是不同地区人群心理结构差异呢?近日,由我课题组撰写的论文“大语言模型模拟区域心理结构的有效性:人格与幸福感的实证检验”发表在国内心理学权威期刊《心理科学》上。
本研究旨在评估大语言模型(DeepSeek)基于人口统计特征条件下,模拟群体心理特征的能力。基于与中国家庭追踪调查(2018年)人口学特征相匹配的样本(N = 2943),构建AI生成的“虚拟被试”,与真实被试数据进行对比,分析中国人大五人格与幸福感的区域差异及其关系。研究发现,模拟数据在幸福感和大五人格的区域分布趋势上与真实数据总体一致,仅在细节上表现出特异性,且部分人格维度对幸福感具有预测作用。这表明,以DeepSeek为代表的大语言模型模拟区域心理结构方面的潜力,但其应用需要关注文化敏感性和细粒度特征的建模。研究为评估大语言模型在人群心理特征建模的有效性提供了实证支持。
研究结果表明(见下图),DeepSeek模型在总体上成功再现了真实数据的大致趋势,比如经济发达的华东地区表现出较高的幸福感。然而在具体人格特质方面,虚拟样本表现出明显的偏差,例如外向性和开放性明显低于真实样本,尤其是在西北地区;宜人性和神经质则显著高于真实数据,东北地区尤为突出。此外,AI模拟数据中的幸福感普遍偏低,东北地区的幸福感更是显著低估。
进一步的区域分析显示,无论是真实还是虚拟样本,各区域的心理特征和幸福感都存在显著差异,但虚拟样本对区域心理特质的再现仍有局限性。例如,真实样本中东北地区幸福感较高,而虚拟样本却显示华东地区幸福感最高。这表明模型可能过于依赖经济发展指标,未充分考虑文化与社会因素对幸福感的综合影响。最后,在对大五人格特质与幸福感之间关系的回归分析中,真实数据表明尽责性、外向性、开放性与低神经质显著预测较高的幸福感;而AI模拟数据则呈现了显著差异,例如外向性在虚拟数据中甚至负向预测幸福感,宜人性被过度强调,而尽责性则失去了预测作用。这种差异显示了大语言模型在捕捉人类情感体验和社会互动复杂性上的局限性。
本研究在方法论上具有创新性,首次尝试在心理学领域以大语言模型作为“虚拟被试”与大规模的真人数据进行对比,为大规模区域差异研究提供新的工具和研究范式。研究明确指出了AI模拟数据的应用价值,包括预测真实调查趋势、预实验验证假设,以及解决真实样本获取困难等实际问题。然而,文中强调AI模拟数据不可完全替代真实调查,只能作为辅助工具使用。同时,还探讨了当前AI模拟方法的局限与未来改进的方向,包括丰富模型训练语料、增强情感模拟能力、提高文化敏感性等。特别指出,当前的大语言模型可能存在强化社会刻板印象的风险,例如东北地区幸福感的低估可能源于模型语料中负面刻板印象的过度强化。
总体而言,本研究验证了DeepSeek在宏观趋势模拟方面的潜力,揭示了AI在心理结构模拟上的局限性。这一成果对跨文化和区域心理学研究提供了新视角,同时也明确指出了AI在心理测量与数据模拟领域未来的发展方向和研究潜力。
本文的第一作者为我系2021级博士生柯罗马,通讯作者为我与原课题组助理研究员/博士后童松(现北京师范大学硕士生导师)。本研究得到了清华大学水木学者计划(2021SM157)、国家博士后国际交流引进计划(YJ20210266)、清华大学支持基础文科博士后计划的支持;同时也得到了清华大学产业研究院自选课题的资助(2024-06-18-LXHT003)。
论文链接: https://jps.ecnu.edu.cn/CN/10.16719/j.cnki.1671-6981.20250412
柯罗马, 李增逸, 廖江群, 童松, 彭凯平. 大语言模型模拟区域心理结构的有效性:人格与幸福感的实证检验*[J]. 心理科学, 2025, 48(4): 907-919.
Ke Luoma, Li Zengyi, Liao Jiangqun, Tong Song, Peng Kaiping. Effectiveness of Large Language Models in Simulating Regional Psychological Structures: An Empirical Examination of Personality and Subjective Well-being[J]. Journal of Psychological Science, 2025, 48(4): 907-919.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.