同样接触短视频、刺激性娱乐这类高强度快感,有的人能轻松保持节制,依然看重吃饭、社交这些日常快乐;有的人却会渐渐放弃原本的爱好,越来越沉迷刺激,甚至明知有坏处也停不下来。
这种个体差异的背后,和大脑奖赏系统的多巴胺信号编码模式密切相关。
![]()
2026年6月26日,瑞士日内瓦大学基础神经科学系Christian Lüscher教授团队在《Nature Neuroscience》上发表研究“Conditioned accumbal dopamine transients forecast individual preference for drug versus natural rewards and compulsive behavior”。
该研究证实,预测线索诱发的多巴胺瞬变幅度可稳定预测个体对人工奖赏与天然奖赏的偏好,且奖赏价值更新能力缺陷对应强迫性觅药行为,为成瘾易感性的早期识别提供了神经生物学依据。
![]()
天然奖赏和人工奖赏,多巴胺信号的编码模式有什么不同?
光遗传多巴胺自刺激(oDASS):通过光遗传技术直接激活VTA多巴胺神经元,作为一种“人工奖赏”,可精确控制奖赏强度。
操作性条件反射:小鼠分别学习关联天然奖赏(高脂肪溶液)与人工奖赏(oDASS或可卡因)的线索与操作。
研究采用操作性条件反射范式,同步用光纤光度法记录伏隔核多巴胺变化。
结果显示,学习初期多巴胺在奖赏递送时升高;熟练后天然奖赏的多巴胺反应完全迁移到预测线索,递送时消失;人工奖赏的多巴胺在线索和递送时均持续存在。
因此,天然奖赏的多巴胺信号在熟练后完全迁移到预测线索;人工奖赏的信号在奖赏递送时始终存在。个体偏好由线索多巴胺幅度决定。
![]()
增强人工奖赏的强度,会改变多巴胺编码和偏好吗?
奖赏重评估范式:将短时长oDASS替换为长时长(增强强度),或替换为静脉可卡因自身给药,或设置延长低强度训练对照组。
研究通过奖赏重评估范式验证关联。
结果显示,增强人工奖赏强度后,对应线索的多巴胺瞬变显著升高,小鼠偏好整体转向人工奖赏;设置延长训练范式对照发现,单纯延长低强度人工奖赏的训练时长,既不会提升线索多巴胺反应,也不会改变奖赏偏好。
因此,奖赏价值的更新取决于强度变化,而非重复次数。单纯重复低强度暴露不会提升主观价值。
解读:这项结果挑战了“成瘾是长期暴露的必然结果”的观点。如果只是反复接触低剂量药物,大脑并不会自动升级其价值,说明成瘾的易感性是“质”的问题,而非量的累积结果;大脑是否会对这些线索进行“价值更新”才是最重要的。
![]()
为什么有些人在面临负面后果时仍无法停止?
研究采用惩罚 - 坚持范式,给人工奖赏加入足部电击惩罚模拟负面后果。
结果显示,加入惩罚后,多数小鼠的人工奖赏线索多巴胺反应降低,偏好转向天然奖赏;约三分之一小鼠无法下调线索多巴胺编码,仍不顾惩罚选择人工奖赏,表现出强迫性觅药特征。早期对弱人工奖赏的偏好程度,可稳定预测后续的强迫性觅药风险。
因此,价值更新能力受损是成瘾易感性的核心,无法下调人工奖赏的价值就会不顾惩罚持续选择。
![]()
一张图看懂:大脑如何决定会不会上瘾?
该研究系统阐明了伏隔核多巴胺信号在奖赏主观价值编码中的核心作用,完整揭示了成瘾易感性个体差异的多巴胺机制。
个体差异
低风险个体:线索多巴胺反应弱 → 奖赏价值更新灵活 → 面对惩罚能放弃
高风险个体:线索多巴胺反应强 → 奖赏价值更新缺陷 → 面对惩罚仍坚持
关键预测
早期对弱人工奖赏的偏好 → 预测后续强迫性觅药风险
小编寄语:
同样接触成瘾物质,有人沉迷,有人节制,区别在于多巴胺系统对奖赏线索的编码强度。
线索多巴胺设定了主观价值,而能否在负面后果出现时下调这个价值,决定了你是否会越过成瘾的临界点。也许未来的成瘾预防,可以从识别高风险个体的线索多巴胺反应开始。
https://doi.org/10.1038/s41593-026-02331-y
![]()
欢迎转发分享
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.