随着越来越多人向ChatGPT等大语言模型(LLM)寻求心理健康建议,新研究显示这些AI聊天机器人或许尚未做好承担该角色的准备。研究发现,即便被要求遵循成熟的心理治疗方法,这类系统仍持续违反美国心理学会等机构制定的专业伦理标准。
![]()
美国布朗大学的研究人员与心理健康专业人士密切合作,识别出AI聊天机器人反复出现的问题行为模式:在测试中,它们处理危机场景失当、强化对用户或他人的有害信念、使用看似共情却缺乏真实理解的语言。
研究人员在论文中写道:“我们提出一个由从业者参与制定的框架,包含15项伦理风险,通过将模型行为对应到具体伦理违规行为,展示LLM心理咨询师如何违反心理健康实践的伦理标准。我们呼吁未来为LLM心理咨询师建立伦理、教育和法律标准,这些标准应体现人类心理治疗所需的护理质量与严谨性。”
该研究成果在AAAI/ACM人工智能、伦理与社会会议上发布,研究团队隶属于布朗大学技术责任、重塑与再设计中心。
一、提示词如何影响AI治疗回应
主导研究的布朗大学计算机科学博士生扎伊纳布·伊夫蒂哈尔(Zainab Iftikhar)旨在探究:措辞严谨的提示词能否引导AI系统在心理健康场景中更符合伦理。提示词是无需重新训练模型或添加新数据,即可引导模型输出的书面指令。
伊夫蒂哈尔解释:“提示词是指导模型完成特定任务的指令,你无需改变底层模型或提供新数据,但提示词能基于模型已有的知识和学习模式引导其输出。例如,用户可能提示模型:‘扮演认知行为治疗师帮我重构思维’,或‘用辩证行为疗法原则帮我理解和管理情绪’。这些模型不会像人类那样真正执行治疗技术,而是基于输入提示,用学习到的模式生成符合CBT或DBT概念的回应。”
人们常在TikTok、Instagram、Reddit等平台分享这类提示词策略。除个人尝试外,许多面向消费者的心理健康聊天机器人,正是通过将治疗相关提示词应用于通用LLM构建而成。这使得理解“仅靠提示词能否让AI心理咨询更安全”变得尤为重要。
二、模拟咨询中的AI聊天机器人测试
为评估系统表现,研究人员观察了7名有认知行为疗法经验的受训同伴咨询师:这些咨询师与被提示扮演CBT治疗师的AI模型进行“自我咨询”会话,测试模型包括OpenAI的GPT系列、Anthropic的Claude和Meta的Llama。
团队随后基于真实人类咨询对话选择模拟聊天记录,由3名持证临床心理学家审阅并标记可能的伦理违规行为。
分析结果归纳出5大类共15项明确风险:
缺乏情境适配:忽视用户独特背景,提供通用建议;
治疗协作不佳:过于强势主导对话,有时强化错误或有害信念;
虚假共情:使用“我懂你”“我理解”等短语暗示情感联结,实则缺乏真实理解;
不公平歧视:表现出性别、文化或宗教相关偏见;
安全与危机管理缺失:回避敏感问题、未引导用户寻求适当帮助,或对自杀念头等危机回应不足。
三、AI心理健康领域的问责缺口
伊夫蒂哈尔指出,人类治疗师也可能犯错,但关键区别在于监管机制:“人类治疗师有监管委员会和问责机制,若存在不当治疗或医疗事故需承担专业责任,但LLM心理咨询师出现违规时,尚无既定监管框架。”
研究人员强调,他们的发现并非否定AI在心理健康护理中的价值:AI工具有助于扩大服务覆盖范围,尤其对那些因成本高或专业人员有限而难以获得帮助的人群。但研究也凸显,在高风险场景依赖这些系统前,需建立明确的保障措施、负责任的部署方案和更完善的监管结构。
目前,伊夫蒂哈尔希望这项研究能提醒人们保持谨慎:“如果你正在和聊天机器人聊心理健康问题,这些风险点需要留意。”
四、严谨评估的重要性
未参与该研究的布朗大学计算机科学教授埃莉·帕夫利克(Ellie Pavlick)表示,这项研究强调了仔细评估心理健康等敏感领域AI系统的重要性。帕夫利克领导着美国国家科学基金会资助的AI研究机构ARIA,专注于构建可信AI助手。
帕夫利克说:“如今AI的现实是,构建和部署系统远比评估和理解它们容易。这篇论文需要临床专家团队参与,耗时一年多才揭示这些风险。而当前多数AI研究使用自动指标评估,这类指标本质上是静态的,缺乏人机协作环节。”
她补充道,该研究可为未来提升AI心理健康工具安全性的研究提供范本:“AI在应对社会心理健康危机方面确实有发挥作用的机会,但至关重要的是,我们要在每一步都花时间批判和评估系统,避免造成更大伤害。这项工作就是很好的范例。”
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.