网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

这个AI精准模拟人类行为大脑状态，上Nature了

2025-07-15 17:30:14　来源: 量子位

北京举报

0

分享至

鹭羽发自凹非寺
量子位 | 公众号 QbitAI

首个能跨领域精准预测人类认知的基础模型诞生！

不仅可以完全预判你的行为，还能知道你是如何思考、以及为什么思考。

这是一项最新登上Nature的突破性研究，来自德国的研究团队只用了5天训练时间就开发出人类认知的通用计算模型——Centaur。

Centaur现在就像一名专业的心理学家，只需传统模型Llama的0.15%参数，就可以完美模拟人类在160项心理学实验中的行为，理解人类如何学习、决策甚至犯错。

不仅仅受限于单一领域，而是真正的多任务全能选手，性能全面超越传统的特定领域认知模型。

更惊人的是，其神经表征竟与真人fMRI（功能性磁共振成像）扫描结果高度吻合。

AI，正在成为最懂人类的“读心者”。

Centaur：心理学与AI的跨界突破

在心理学领域，建立一个统一的认知理论，可以识别和描述所有人类认知、行为和情感，是所有心理学家孜孜不倦的追求。

认知的统一理论是唯一能将我们日益增长的丰富知识，置于理智掌控之下的方法。

那么首先需要构建一个能够预测和模拟人类行为的通用计算模型，它不是AlphaGo这种专为某一个领域而生的模型，而是面向所有领域、各种情况。

于是，Centaur——首个人类认知基础模型诞生了。

研究团队首先为之构建了史上最大规模的人类行为数据集Psych-101，涵盖160项心理学实验，涉及60092名参与者、超1000万次选择，以及2亿多个文本tokens。

数据集包含多臂老虎机、决策制定、记忆、逻辑推理、马尔可夫决策过程等多种任务。

此外研究人员还将全部实验数据转化为自然语言形式，为不同实验范式提供统一表达格式。

而模型本身基于开源语言模型Llama 3.1 70B构建，采用参数高效微调技术QLoRA（量化低秩适应）进行训练。

具体而言是在冻结的4位量化基础模型上，为所有非嵌入层添加秩为8的低秩适配器，最后新增参数仅占基础模型的0.15%。

然后将模型置于Psych-101数据集上进行微调，使用标准的交叉熵损失函数，只专注聚焦在人类响应token上。

值得注意的是，整个训练过程在A100 80GB GPU上，只耗时5天时间。

短短5天，一个通用的LLM模型就蜕变成了可以真正“读懂”人类的认知模型，甚至全面超越传统模型。

超越传统认知模型

研究人员为了考验Centaur的认知能力，设计了一系列实验验证。

首先是对人类行为的捕捉，判断其能否精准地预测人类行为。

实验将参与者分为90%的训练组和10%的测试组，负对数似然值作为衡量模型对人类选择拟合度的指标。

结果显示，Centaur的负对数似然值为0.44，在拟合度上显著优于Llama的0.58。

在对未参与训练者的行为预测表现也优于14种经典认知模型（如前景理论、强化学习模型），平均差异达0.13，且通过了显著性检验。

将模型自身响应反馈给模型本身后，Centaur还表现出了多个与人类相似的行为特征，例如在两步任务（Two-Step Task）中，它复现了与人类行为分布高度一致的轨迹。

此外还能区别人类与人工智能体的行为，预测人类行为准确率高达64%，而预测人工智能体的行为准确率只有35%。

基于描述选择反应时间与选项数量关系的希克定律，研究人员分析模型对人类反应时间的预测能力。

结果表明，Centaur 的响应熵所能解释的反应时间方差比例（条件 R²=0.87）高于 Llama（0.75）和领域特定模型（0.77），显示出其在捕捉人类行为时间特征方面的优势。

其次，研究人员还重点探究了Centaur的泛化能力。

只修改故事背景，不改变任务内容

实验将原来的“太空船寻宝”改为“魔毯探险”的新故事后，Centaur在新故事场景下人类行为的预测负对数似然值，依旧显著优于Llama和领域特定认知模型，说明Centaur不受任务表面描述变化影响。

修改任务结构

在原来的两臂老虎机实验上，新增成三臂，选择加一，但Centaur的负对数似然值（0.42）依旧远低于 Llama（0.62）和领域特定模型（0.98），表明其能适应任务结构的扩展与调整。

全新领域的任务

让模型处理未包含在Psych-101数据集内的逻辑推理任务，Centaur 的负对数似然值（1.65）显著低于 Llama（1.92），体现出微调后对全新认知领域的预测能力依旧强力。

最后，研究人员还聚焦于Centaur与人类神经活动的对齐性，分析验证其内部表征与人类大脑活动的联系。

实验让94名参与者完成两步任务，并记录下他们的fMRI数据，通过分析，Centaur的各层表征对全脑区域神经活动的皮尔逊相关系数均显著高于基础模型Llama，且优于传统认知模型和随机初始化控制模型。

尤其在与奖励相关脑区（如伏隔核）和运动皮层，Centaur的预测表现更为突出，说明其拥有优秀的人类神经活动预测能力。

另外在让5名参与者阅读1000个句子的语言理解任务中，Centaur中间层的表征预测效果最佳，包含最丰富信息，且在与语言处理相关的脑区表现最为稳定。

实验说明，虽然Centaur在训练过程中没有明确匹配神经数据，但在微调后却出乎意料的和人类神经活动呈现出一致性。

据推测，也许是模型内部表征捕捉到了人类认知加工的神经基础特征。

Centaur的出现证明了构建计算模型实现跨领域捕捉人类行为是可行的。

未来它或许将作为 “计算望远镜”，帮助研究者从从海量行为数据中提炼关键信息，为统一认知理论的发展提供强有力的数据驱动路径。

正如作者在论文结尾所言：

是时候将这种通用计算模型，转化为统一的人类认知理论了。

参考链接：
[1]https://x.com/jowettbrendan/status/1942501763313197374
[2]https://doi.org/10.1038/s41586-025-09215-4

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

菲尔兹奖得主王虹：父亲是数学老师她曾常被"挂黑板"

澎湃新闻 2026-07-24 10:01:46
17215 跟贴 17215
媒体：面对"白眼狼"的友邦中国要学会"闹起来动起来"

澎湃新闻 2026-07-23 22:50:11
102 跟贴 102

浙江温州一老板9000万元“抄底”百公斤金条，省下140万元，刷新交易金额纪录

扬子晚报 2026-07-24 17:37:30
124 跟贴 124

击败强敌！中国女排3比2胜美国女排，闯进世界女排联赛四强

澎湃新闻 2026-07-23 21:46:28
3481 跟贴 3481
证监会：综合施策维护市场平稳运行

每日经济新闻 2026-07-24 15:16:08
970 跟贴 970

国际原油期货持续下跌美油布油均跌近3%

财联社 2026-07-24 18:03:06
5 跟贴 5

俄罗斯重申谈判开放立场

看看新闻Knews 2026-07-24 12:26:02
916 跟贴 916
山西霍州通报“男子在采血站采血后口吐白沫、神志不清”：成立调查组

澎湃新闻 2026-07-24 03:38:02
17 跟贴 17

002415，业绩大增！拟大手笔分红！

证券时报 2026-07-24 19:26:53
2 跟贴 2
尼冰任上海世纪出版集团总裁

澎湃新闻 2026-07-24 19:50:27
3 跟贴 3
上海德比第二回合将打响，不争冠军，也要奉献精彩对决

澎湃新闻 2026-07-24 18:42:27
2 跟贴 2
克洛普出任德国男足国家队主教练

新京报 2026-07-24 20:41:26
1 跟贴 1
特斯拉也没能躲过汽车行业的“寒流”：二季度营收增长26%，利润暴跌57%，到底为什么？

都市快报橙柿互动 2026-07-24 16:40:31
66 跟贴 66
Shams：据我所知詹姆斯并没有在等待浓眉的交易发生

北青网-北京青年报 2026-07-24 08:14:14
62 跟贴 62
故宫下周一免费开放，今晚8点预约

界面新闻 2026-07-24 09:34:58
313 跟贴 313
还没发货，杭州一经销商突然关店！松下中国：已介入处理，8月初为涉事客户发货

红星新闻 2026-07-24 20:03:43
4 跟贴 4
台风“红霞”趋近交通运输部启动台风三级防御响应

财联社 2026-07-24 14:12:16
67 跟贴 67
网传广西百色遭遇严重洪灾系谣言（2026·07·24）

今日辟谣 2026-07-24 18:08:34
175 跟贴 175
10家航空公司、5家线上售票平台被约谈

界面新闻 2026-07-24 11:19:48
31 跟贴 31
第十六届中国航展12月7日至13日举行

央视新闻客户端 2026-07-24 16:39:33
1092 跟贴 1092
太空多了颗“上海芯”！力箭一号“一箭五星”发射成功，国产GPU算力入轨

上观新闻 2026-07-24 20:47:24
0 跟贴 0
NBA官方：2026年拉斯维加斯夏季联赛观赛人数创历史新高

北青网-北京青年报 2026-07-24 08:14:20
26 跟贴 26
“中国智慧”加速出海（大数据观察·中国服务）

人民网 2026-07-24 06:24:14
43 跟贴 43
安全生产许可证状态不是“有效”，投资超2亿项目中标候选人被疑资质不符，最新回应

潇湘晨报 2026-07-24 21:08:19
0 跟贴 0

他凭一人之力就让全县32万人吃不上网购的榴莲、车厘子

他凭一人之力就让全县32万人吃不上网购的榴莲、车厘子

法律学堂

2026-07-24 01:34:31

生理上能把男人喂饱的女人，是好女人；饭桌上能让男人吃好的女人，是好女人；生活中能让男人省心的女人才是最好的女人

生理上能把男人喂饱的女人，是好女人；饭桌上能让男人吃好的女人，是好女人；生活中能让男人省心的女人才是最好的女人

心理观察局

2026-07-23 06:37:22

伊朗命根子被炸！美军终于想明白，伊朗的七寸不在首都，在海岸线

伊朗命根子被炸！美军终于想明白，伊朗的七寸不在首都，在海岸线

心灵得以滋养

2026-07-24 01:49:41

4年2.75亿！正式拒绝！浓眉顶薪凉凉

4年2.75亿！正式拒绝！浓眉顶薪凉凉

篮球教学论坛

2026-07-24 13:09:27

美参议院否决限制特朗普对伊战争权力的决议案

美参议院否决限制特朗普对伊战争权力的决议案

财联社

2026-07-24 04:29:02

直线跳水！日本股市跌超1600点，韩国综指跌超200点，三星电子跌超3%、SK海力士跌超4%；美股七巨头市值一夜蒸发近8000亿美元

直线跳水！日本股市跌超1600点，韩国综指跌超200点，三星电子跌超3%、SK海力士跌超4%；美股七巨头市值一夜蒸发近8000亿美元

每日经济新闻

2026-07-24 16:23:52

吸烟真的有害吗？英国烟草公司用48只狗实验，4年竟抽掉14万支烟

吸烟真的有害吗？英国烟草公司用48只狗实验，4年竟抽掉14万支烟

掠影后有感

2026-06-24 10:52:34

朝鲜战争败给中国后，各参战国反应：英美沉默了，印度认为自己有大功

朝鲜战争败给中国后，各参战国反应：英美沉默了，印度认为自己有大功

磊子讲史

2026-07-24 18:20:15

30岁NBA三冠王！离开联盟了！！

30岁NBA三冠王！离开联盟了！！

柚子说球

2026-07-23 22:34:36

Shams辟谣！詹姆斯并不会坐等浓眉被交易选择核心取决于四大因素

Shams辟谣！詹姆斯并不会坐等浓眉被交易选择核心取决于四大因素

罗说NBA

2026-07-24 05:16:12

《马关条约》本是屈辱条约，如今成为巴丹群岛归属中国关键铁证

《马关条约》本是屈辱条约，如今成为巴丹群岛归属中国关键铁证

心灵得以滋养

2026-07-24 05:57:31

“香港演员几乎全军覆没! 无戏可拍”引发网友热议

“香港演员几乎全军覆没! 无戏可拍”引发网友热议

许三岁

2026-03-26 11:35:13

陆建勋同志逝世

新京报

2026-07-24 14:45:12

正式官宣！广东宏远国手完成转会，离开老东家

正式官宣！广东宏远国手完成转会，离开老东家

体坛瞎白话

2026-07-24 19:35:30

孙浩窦骁王晓晨共品油泼面，窦骁豪爽笑容引鱼尾纹

孙浩窦骁王晓晨共品油泼面，窦骁豪爽笑容引鱼尾纹

云深不知在何处

2026-07-23 08:04:10

美伊俄轮番暴揍，40天抗议三次，谁拿你当回事？去他个“大国梦”

美伊俄轮番暴揍，40天抗议三次，谁拿你当回事？去他个“大国梦”

施涛说

2026-07-23 10:33:07

谢霆锋丧父后首露面！同行者身份被扒，谨遵谢贤嘱托取消特别环节

谢霆锋丧父后首露面！同行者身份被扒，谨遵谢贤嘱托取消特别环节

随意吃瓜

2026-07-24 17:07:55

22年，北京老虎被母狗养大，老虎成年后，对狗妈妈的态度令人吃惊

22年，北京老虎被母狗养大，老虎成年后，对狗妈妈的态度令人吃惊

兰姐说故事

2025-01-19 10:10:03

台海战争一旦爆发，解放军决不放过台军第333旅，新账旧账一起算

台海战争一旦爆发，解放军决不放过台军第333旅，新账旧账一起算

史行途

2026-07-24 17:30:30

某大厂裁员二选一。平薪转外包或者拿钱N+1走人

某大厂裁员二选一。平薪转外包或者拿钱N+1走人

蚂蚁大喇叭

2026-07-24 17:35:49

追踪人工智能动态

13022文章数 176522关注度

往期回顾全部

科技要闻

中国等了90年，王虹邓煜同时摘下菲尔兹奖

头条要闻

浙江一幼儿园女生走光照片被选入毕业相册家长发声

头条要闻

浙江一幼儿园女生走光照片被选入毕业相册家长发声

体育要闻

小布泽：越看越不像他爸爸

娱乐要闻

张凌赫公主抱王楚然，比工业糖精好嗑

财经要闻

长鑫科技会成为下一个“中石油”吗？

汽车要闻

吉利的方盒子：来晚了，但打磨得刚好

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

艺术

手机

公开课

军事航空

旅游要闻

顺德部署暑期假日工作，邀游客顺心顺意游顺德

艺术要闻

突破百米！广州新“小蛮腰”，规模现象！

手机要闻

因“芯片通胀” 苹果要求将iPhone 18高端机OLED面板价格下调20%

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

特朗普威胁对伊发动空前打击伊朗、胡塞武装强势回应

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版