网易首页 > 网易号 > 正文 申请入驻

哈佛新论文揭示 Transformer 模型与人脑“同步纠结”全过程!AI也会犹豫、反悔?

0
分享至

大数据文摘出品

近日,来自哈佛大学、布朗大学以及图宾根大学研究者们,共同发表了一项关于Transformer模型与人类认知处理相关性的研究论文:

——《Linking forward-pass dynamics in Transformers and real-time human processing》

意译过来就是:Transformer模型的“思考过程”与人类大脑实时认知的奇妙相似

换句话说,它想搞清楚一个“老问题”:AI模型的内部处理过程,和人类大脑的实时认知,有多少相似?

过去我们研究AI和人类的相似性,最常见的做法是什么?“看结果”:让AI做题,看它答对多少,概率分布和人的选择对不对得上。例如,让GPT写作文、识别图片、做逻辑推理,然后对照人类的数据,得出一个“AI越来越像人了”的结论。

但这其实只是表象。

想象一个场景:在答一道不太确定的选择题,先想到了一个看似正确的选项,但又觉得不太对,犹豫半天,才最终敲定答案。AI模型也一样,也许在中间某一层,更倾向于一个“直觉答案”,但再往后,才被训练出来的知识“纠正”了过来。

问题来了:AI和人类,不只是最后的选项,连中间的“挣扎”和“转变”也能被对齐吗?

这篇论文的作者,换了个角度:不只看AI模型的输出,还要扒一扒Transformer每一层的“处理动态”,与人脑处理信息的“实时轨迹”是否能对上。

01 AI和人脑,真的在“想”同一件事吗?

图注:方法概述。用Transformer模型中得出的过程性指标预测人类处理负荷和行为反应指标的能力。

论文作者把Transformer每一层的输出和变化都做了记录,提出了一系列“处理负载”的指标:

  • 不确定性(entropy)

  • 信心(log probability)

  • 相对信心(正确vs直觉答案)

  • boosting(模型在某一层对正确答案的主动“拉高”)

这些东西听起来很技术,但可以简单理解为:AI每一层都在“思考”,每过一层,它对答案的信心发生了一点点变化。

有的题,AI一上来就很有把握,信心很快升高;有的题,AI在中间反复徘徊,甚至先押错,再修正。

这和我们人类做题的“熟练-犹豫-反应慢-反悔-最终确定”是不是很像?

02 实验结果:AI和人类“走弯路”的相似瞬间

图注:研究中分析的人类任务示意图。(a) 回忆(自由回答)首都名称。(b) 识别(强制选择)首都名称。(c) 通过鼠标移动对典型和非典型动物实例进行分类(Kieslich 等, 2020)。(d) 判断三段论推理的逻辑有效性。(e) 对分布外图像进行物体识别。

论文做了几个个实验,分别对应不同的认知任务和人机对比:

①“首都杀手题”——AI和人类的集体下意识。

图注:研究1a(回忆首都),Llama-2 7B模型。(a)-(d) 基于模型各层计算的处理指标。(e) 各指标相较于基线模型的BIC差异。数值越高越好。星号表示统计显著。

比如,美国州首都题。这题在答题界有个绰号,叫“首都杀手”:

  • 出题人问:“伊利诺伊州的首都是哪?”

  • 人类几乎下意识地想说:“芝加哥!”

  • 然后突然一个激灵,想起,“不对,是斯普林菲尔德!”

以为这样的“反转”只有人类会有?其实AI也会!

论文里的Llama-2模型,每一层都像个小AI脑细胞在投票。结果显示:在模型的中间层,AI的信心值一度“押宝”在芝加哥上,就像脑海里那个脱口而出的错误答案。可到了后半程,随着层数加深,AI忽然“刹车”,把信心转回了斯普林菲尔德。这就是AI和人类都在“下意识→反思→修正”的本能流程里打了个滚。

更绝的是,有的试题AI和人类都“执迷不悟”。比如问“澳大利亚首都”,一堆人写悉尼,一堆AI也把概率压在悉尼上,最后才有一部分“觉醒”,想起是堪培拉。

②“鲸鱼归属”——鼠标和神经元一起漂移

图注:研究2(动物实例分类),Llama-2 7B模型。(a)-(d) 基于模型各层计算的处理指标。(e) 各指标与基线模型的BIC差异,数值越高越好。星号表示统计显著。

再看动物分类题。问:“鲸鱼是鱼还是哺乳动物?”人类是不是脑子里先蹦出来“鱼”,又觉得哪里不对,才慢慢改口?

  • 人类实验里,受试者的鼠标先朝“鱼”方向飘过去,走了一小段“弯路”,再折回“哺乳动物”,画出一条漂亮的“纠结弧线”。

  • AI模型内部,“信心”指标在前几层也更偏向“鱼”,直到后面层数才被训练出的知识拉回“哺乳动物”。

有趣的是,AI和人类不仅选项重合,连“走神”的路径也同步:人类在鼠标上徘徊的那一秒,AI在网络里也“犹豫”着。

03. “逻辑陷阱”——AI和人类被套路的瞬间

图注:(三段论推理中的内容效应),Llama-2 7B模型。(a)-(d) 针对逻辑结果与先验信念一致的题目,基于模型各层计算的处理指标。(e)-(h) 针对引发“内容效应”的题目(即逻辑结果与先验信念不一致),基于模型各层计算的处理指标。(i) 各指标及数据子集与基线模型的BIC差异,数值越高越好。由于EntropyLayer和BoostLayer在所有题目中的数值相同,因此未进行比较。

再来点烧脑的。经典的三段论逻辑推理题:

“所有A是B,所有B是C,那么所有A是C吗?”

人类本来逻辑在线,但题目稍微掺点“常识偏见”,比如“所有有翅膀的动物会飞,所有会飞的动物能上天,所以所有有翅膀的动物都能上天吗?”大脑会直接被“常识”带偏。

AI也是。论文里发现:只要题目设计得足够“绕”,AI和人类一样,都在中间层“陷入迷雾”,先押宝在那个直觉答案上,过了几个“脑回路”,才慢慢拉回正轨。

04. “图片辨认”——AI和人类都在“雾里看花”

图注:OOD物体识别,ViT-Base模型。(a)-(b) 基于模型各层计算的处理指标。(c) 各指标分组与基线模型的BIC差异,数值越高越好。

视觉任务上也是同理。比如一张加了马赛克或奇怪滤镜的猫咪图片,问“这是啥?”你可能先说“狗?”,再揉揉眼睛,才发现是“猫”。

AI的Vision Transformer也是这样,刚开始层级信心分布很分散,也许更偏向“狗”,但随着层数推进,才慢慢聚焦到“猫”这个类别。

有没有发现?AI和人的“迷茫-清醒”过程竟然如此一致。

03 OMT:应该关注AI内部的“思考过程”

我们一直用AI做“黑箱”——输入-输出,像函数一样。但这篇论文告诉我们,也许更值得关注的,是AI内部的“思考过程”。

AI在遇到难题时,真的会“走弯路”,和人一样“卡壳”; 不同的任务,不同的模型规模,AI的“思考路径”也会变化; 这种“动态过程”不是专为模仿人类设计,而是AI自然训练出来、为了完成任务自己学会的“捷径”;

这意味着,也许我们能用AI,去发现哪些刺激、哪些设计会让人类更难处理,甚至反向指导人类实验设计。

输出只是终点,过程才是灵魂。

GPU算力按需租用

A100/H100 GPU算力按需租用,

秒级计费,平均节省开支30%以上!

扫码了解详情☝

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宜家的问题已经挺严重了

宜家的问题已经挺严重了

蔚然未来消费
2026-01-08 08:34:50
俄罗斯赤道特遣队撤回国内,美国捕马撕去莫斯科最后一块遮羞布

俄罗斯赤道特遣队撤回国内,美国捕马撕去莫斯科最后一块遮羞布

史政先锋
2026-01-07 19:38:07
广东最低温已跌至零下

广东最低温已跌至零下

南粤女声
2026-01-08 11:08:05
河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

六子吃凉粉
2026-01-08 08:39:04
美国官员称:主宰这个世界的是实力 武力与权力

美国官员称:主宰这个世界的是实力 武力与权力

看看新闻Knews
2026-01-08 11:01:03
从万亿总裁到变卑微舔狗!网友:王石在地产大佬,差不多活成笑话

从万亿总裁到变卑微舔狗!网友:王石在地产大佬,差不多活成笑话

火山詩话
2026-01-08 16:02:52
1-0绝杀!2-0爆冷!U23亚洲太疯狂:CCTV5调整直播,中伊大战打响

1-0绝杀!2-0爆冷!U23亚洲太疯狂:CCTV5调整直播,中伊大战打响

二疯说球
2026-01-08 09:20:50
一名美国公民在拍摄ICE执法,离开时被连开3枪当场击毙,随后街头失控,催泪弹清场...

一名美国公民在拍摄ICE执法,离开时被连开3枪当场击毙,随后街头失控,催泪弹清场...

北美省钱快报
2026-01-08 08:14:39
资深编审、法史学者,北京工业大学副教授解锟逝世,年仅48岁

资深编审、法史学者,北京工业大学副教授解锟逝世,年仅48岁

澎湃新闻
2026-01-08 17:04:26
昆山一外企电子大厂突发解散:300多名员工获N+1补偿金和购物卡

昆山一外企电子大厂突发解散:300多名员工获N+1补偿金和购物卡

六子吃凉粉
2026-01-08 12:34:04
农民日报关于河北农民取暖难的稿,为啥不见了?

农民日报关于河北农民取暖难的稿,为啥不见了?

笔杆论道
2026-01-08 07:02:14
安徽美女陈秀丽去世,年仅36岁,确诊前天天跑步,每天都喝黑咖啡

安徽美女陈秀丽去世,年仅36岁,确诊前天天跑步,每天都喝黑咖啡

180视角
2026-01-08 13:58:25
阿根廷大逆袭!米莱执政两年,通胀暴跌,经济增速扭负为正!

阿根廷大逆袭!米莱执政两年,通胀暴跌,经济增速扭负为正!

百态人间
2026-01-07 16:41:49
中国养老负担将越来越重:从4.7个劳动力养一个老人到1.9个劳动力供养1个老人

中国养老负担将越来越重:从4.7个劳动力养一个老人到1.9个劳动力供养1个老人

西虹市闲话
2026-01-08 13:51:18
澳大利亚2-1十人泰国获开门红!1分钟2球逆转,3天后对阵U23国足

澳大利亚2-1十人泰国获开门红!1分钟2球逆转,3天后对阵U23国足

我爱英超
2026-01-08 21:28:18
疯传!王石的瓜,好狗血!

疯传!王石的瓜,好狗血!

财经要参
2026-01-05 22:13:08
访华第2天,李在明得偿所愿,不到24小时,高市对中国提出2个请求

访华第2天,李在明得偿所愿,不到24小时,高市对中国提出2个请求

近史博览
2026-01-08 09:36:51
出差前我把家里地暖关了,当晚楼下阿姨在群里开骂…

出差前我把家里地暖关了,当晚楼下阿姨在群里开骂…

极品小牛肉
2026-01-05 14:43:53
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
总统被掳走后,委内瑞拉股市2026年已接近翻倍

总统被掳走后,委内瑞拉股市2026年已接近翻倍

凯利经济观察
2026-01-08 09:33:42
2026-01-08 23:07:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4457文章数 37368关注度
往期回顾 全部

科技要闻

智谱拿下“全球大模型第一股”,凭什么

头条要闻

10岁抗癌"王子"病情恶化 家人"放弃治疗"孩子憧憬出院

头条要闻

10岁抗癌"王子"病情恶化 家人"放弃治疗"孩子憧憬出院

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

教育
数码
亲子
旅游
公开课

教育要闻

浙江首考地理:牛拉屎放屁,我该怎么办(减排)?!

数码要闻

VESA展示DP80LL线缆、DisplayHDR True Black 1000与ClearMR认证实机效果

亲子要闻

雀巢在至少50个国家和地区召回部分婴幼儿配方奶粉

旅游要闻

特写:在台湾基隆“穿越”刘铭传隧道

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版