网易首页 > 网易号 > 正文 申请入驻

Nat Ment Health | 渴求如何改写强化学习:酒精与大麻使用者的计算机制

0
分享至


认知神经科学前沿文献分享


基本信息

Title:A computational mechanism linking momentary craving and decision-making in alcohol drinkers and cannabis users

发表时间:2026

发表期刊:Nature Mental Health

影响因子:8.7

获取原文:

1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本



研究背景

成瘾研究中存在两个长期并行的传统:一是关注线索反应(cue-reactivity),即个体看到酒精或大麻相关线索后主观“更想要”的渴求感;二是关注决策过程中的强化学习(reinforcement learning),即人在反复试错中如何根据奖励反馈更新选择策略。然而,临床上常关注的“当下渴求”与行为学分析的“下一步选择”之间,一直缺少一个能落到计算参数上的统一解释。

本研究试图回答的核心问题是:当下渴求究竟如何影响成瘾相关决策?而决策过程中的预期价值(expected value)与实际结果(outcome),又是否会反过来塑造下一刻的渴求?如果这种双向作用存在,能否用一套统一的计算建模(computational modeling)机制来描述,并在酒精饮用者与大麻使用者之间进行跨物质比较?


实验设计与方法逻辑

研究招募了132名中高风险物质使用者(酒精组68人、大麻组65人),并设置了健康对照与“交叉线索”控制样本。实验采用改造的双臂老虎机反转学习(two-armed bandit reversal learning)范式。被试需要在两台机器间反复选择以追踪高概率奖励,任务分为金钱区块(赢得货币图片)与成瘾区块(赢得被试预先选出的最诱人酒精或大麻图片)。任务期间,被试需间歇性报告当下的渴求感与心境。

验证分为三步:首先,通过模型无关检验确认各组均能有效学习任务,排除单纯的表现差异;其次,构建决策模型,比较标准强化学习、渴求调制结果感知(o-bias)、调制学习率(α-bias)等多种候选模型,定位渴求如何影响选择;最后,构建渴求模型,检验预期价值与实际结果如何共同驱动渴求。此外,研究还评估了这些模型提取的参数能否提升对成瘾风险分数的预测能力。


核心发现

发现一:在成瘾线索下,渴求通过改变学习率影响决策,且在酒精与大麻组中方向相反

在成瘾区块中,最能解释两组行为数据的决策模型均为 α-bias 模型,即当下的渴求感会直接改变个体的学习率(learning rate)。这意味着渴求并非简单让人“更冲动”,而是改写了大脑从反馈中更新价值的速度。更关键的是,这种调制方向在两组中完全相反:酒精组的调制参数为正,意味着渴求越高,酒精相关学习越快;大麻组的调制参数为负,意味着渴求越高,大麻相关学习反而越慢。这提示两类物质使用者虽然在表面上都能学会任务,但内部的计算更新规则并不相同。


Fig. 3 中,作者展示了成瘾条件下 α-bias 模型在两组中均优于其他候选模型,且酒精组的调制参数显著为正,大麻组显著为负
发现二:当下的渴求并非单纯的线索反应,而是由预期价值与实际结果共同驱动

针对“渴求从何而来”的问题,模型比较显示,无论是在成瘾还是金钱条件下,两组最佳的渴求生成模型均为“预期价值 + 实际结果”(EV + outcome)。这表明,任务中的动态渴求不仅是被外部图片线索瞬间点燃的,还会随着个体对奖励的预期(预计会得到多大回报)以及实际获得的结果而不断更新。模型预测的渴求轨迹与被试真实的渴求评分高度相关,证实了主观想要感是一个随内部价值状态与结果证据动态变化的变量。


Fig. 4 中,作者展示了包含预期价值与实际结果的联合模型在两组中表现最佳,且模型预测值与真实渴求评分显著相关;
发现三:渴求的计算机制具有情境特异性,且部分参数能提升酒精成瘾风险预测

渴求对决策的影响高度依赖奖励情境。在金钱区块中,两组的最佳模型均变为 o-bias,即渴求不再改变学习率,而是放大对金钱结果的主观感知。此外,健康对照组和交叉线索(如酒精使用者看大麻线索)控制实验表明,这种“渴求调学习率”的耦合主要针对个体的主要使用物质。在临床预测方面,将计算模型参数加入回归分析后,能显著提升对酒精成瘾风险分数的预测效果,但对大麻风险的预测增益有限,提示不同物质可能需要不同的临床建模维度。


Fig. 5 中,作者展示了结合人口学、模型无关指标与计算参数的全模型能最佳预测酒精成瘾风险,但大麻组并未从计算参数中获益;


省流总结

本研究结合计算建模发现,渴求与强化学习在成瘾决策中存在双向耦合。渴求不仅由预期价值与实际结果共同驱动,还会以物质特异性的方式改变学习率:酒精使用者越渴求学得越快,大麻使用者越渴求学得越慢。这为理解跨物质成瘾机制提供了新的计算视角。


请打分

这篇刚刚登上Nat. Mental Health的研究,是否实至名归?我们邀请您作为“云审稿人”,一同品鉴。精读全文后,欢迎在匿名投票中打分,并在评论区分享您的深度见解。

分享人:天天

审核:PsyBrain 脑心前沿编辑部

你好,这里是「PsyBrain 脑心前沿

专注追踪全球认知神经科学的最尖端突破

视野直击 Nature, Science, Cell 正刊 及核心子刊与顶级大刊

每日速递「深度解读」与「前沿快讯

科研是一场探索未知的长跑,但你无需独行。欢迎加入PsyBrain 学术社群,和一群懂你的同行,共同丈量脑与心智的无垠前沿。

点击卡片进群,欢迎你的到来

一键关注,点亮星标 ⭐ 前沿不走丢!


一键分享,让更多人了解前沿

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
科学家做了一个模拟:很可怕!科技文明或许只能持续5000年

科学家做了一个模拟:很可怕!科技文明或许只能持续5000年

墨印斋
2026-03-18 13:40:30
冷知识:千万不要买太大的蓝莓!!!

冷知识:千万不要买太大的蓝莓!!!

果壳
2026-03-30 16:12:50
两小时密会谈崩?纽卡CEO不愿兜底,埃迪・豪的帅位悬了

两小时密会谈崩?纽卡CEO不愿兜底,埃迪・豪的帅位悬了

夜白侃球
2026-03-31 21:32:58
广东复仇江苏,张皓嘉末节救主赛后泪洒赛场,球迷连夜排队道歉

广东复仇江苏,张皓嘉末节救主赛后泪洒赛场,球迷连夜排队道歉

赫岝乡村摄影
2026-04-01 00:45:12
车管所正式通知:C1驾照“2取消、1增加”已执行,车主尽早了解。

车管所正式通知:C1驾照“2取消、1增加”已执行,车主尽早了解。

沙雕小琳琳
2026-03-31 09:30:37
杨瀚森吃T仅1天,NBA官宣改判!常规赛仅剩6场,开拓者面临抉择

杨瀚森吃T仅1天,NBA官宣改判!常规赛仅剩6场,开拓者面临抉择

小火箭爱体育
2026-03-31 11:50:49
人民日报也发了粉底液将军,居然有粉丝去冲人民日报,劝都劝不住

人民日报也发了粉底液将军,居然有粉丝去冲人民日报,劝都劝不住

动物奇奇怪怪
2026-04-01 00:31:36
澳门世界杯:奥运亚军0-3惨败,日本女单完胜,孙颖莎强势绝杀

澳门世界杯:奥运亚军0-3惨败,日本女单完胜,孙颖莎强势绝杀

小徐讲八卦
2026-03-31 09:13:57
战损惨重!特朗普紧急叫停总攻?中东六国慌了:伊朗不能接管中东

战损惨重!特朗普紧急叫停总攻?中东六国慌了:伊朗不能接管中东

丁隗解说
2026-03-31 23:23:37
出场时间第3高,垃圾时间刷10分+正负值最低,还让崔永熙打替补

出场时间第3高,垃圾时间刷10分+正负值最低,还让崔永熙打替补

弄月公子
2026-03-31 22:52:28
享界汽车就“S9‘麋鹿测试’视频”发布声明:经核实,相关测试存在恶意、刻意操控行为,已固定相关证据,并对涉嫌机构及账号采取维权行动

享界汽车就“S9‘麋鹿测试’视频”发布声明:经核实,相关测试存在恶意、刻意操控行为,已固定相关证据,并对涉嫌机构及账号采取维权行动

潇湘晨报
2026-03-29 14:11:09
意难平!高以翔离世7年,Bella嫁老外怀孕,让人不适的一幕出现了

意难平!高以翔离世7年,Bella嫁老外怀孕,让人不适的一幕出现了

橙星文娱
2026-03-26 11:32:10
“生女儿的,再厉害也是给我儿子服务!”家长低认知发言,被群嘲

“生女儿的,再厉害也是给我儿子服务!”家长低认知发言,被群嘲

妍妍教育日记
2026-03-30 18:56:05
伊朗:出动无人机,打击西门子、AT&T分支机构!以色列:空袭革命卫队空天部队总部;特朗普:美国盟友必须介入霍尔木兹海峡问题

伊朗:出动无人机,打击西门子、AT&T分支机构!以色列:空袭革命卫队空天部队总部;特朗普:美国盟友必须介入霍尔木兹海峡问题

每日经济新闻
2026-04-01 00:46:06
1只就判刑!2023年湖南男子在山上放20组弹簧套,捕猎到2只宰了吃

1只就判刑!2023年湖南男子在山上放20组弹簧套,捕猎到2只宰了吃

万象硬核本尊
2026-03-30 20:03:07
英王室新书:菲利普亲王孤独离世,女王竟错过伴侣临终瞬间

英王室新书:菲利普亲王孤独离世,女王竟错过伴侣临终瞬间

世界王室那些事
2026-03-31 16:27:02
大赚135亿!3000亿光伏龙头发布2025年年报|盘后公告集锦

大赚135亿!3000亿光伏龙头发布2025年年报|盘后公告集锦

财联社
2026-03-31 21:33:27
奇瑞官宣1500km续航!2026全固态电池热潮,到底该不该等?

奇瑞官宣1500km续航!2026全固态电池热潮,到底该不该等?

金错刀
2026-03-31 14:09:24
张雪:不肯回头的少年

张雪:不肯回头的少年

卢诗翰
2026-03-30 16:22:45
TA:热刺与德泽尔比的战术适配度存疑,这笔签约是场“豪赌”

TA:热刺与德泽尔比的战术适配度存疑,这笔签约是场“豪赌”

懂球帝
2026-04-01 00:35:07
2026-04-01 01:19:00
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
264文章数 15关注度
往期回顾 全部

科技要闻

华为2025年销售收入8809亿,净利润680亿元

头条要闻

男子玩具店买枪被羁押279天获国赔16万:打官司花40万

头条要闻

男子玩具店买枪被羁押279天获国赔16万:打官司花40万

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

油价暴涨 我们的生活成本会飙升多少?

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

本地
数码
时尚
教育
公开课

本地新闻

用Color Walk的方式解锁城市春日

数码要闻

联想推出YOGA AI Mini迷你主机,5499元

「性治疗室」里的00后,男多女少

教育要闻

微专题:高考地理中的地理实验

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版