网易首页 > 网易号 > 正文 申请入驻

LLM为何频频翻车算术题?最新研究追踪单个神经元,「大脑短路」才是根源

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】大模型在数学问题上的表现不佳,原因在于采取启发式算法进行数学运算的,通过定位到多层感知机(MLP)中的单个神经元,可以对进行数学运算的具体过程进行解释。

由于缺少对运行逻辑的解释,大模型一向被人称为「黑箱」,但近来的不少研究已能够在单个神经元层面上解释大模型的运行机制。

例如Claude在2023年发表的一项研究,将大模型中大约500个神经元分解成约4000个可解释特征。

而10月28日的一项研究,以算术推理作为典型任务,借鉴类似的研究方法,确定了大模型中的一个模型子集,能解释模型大部分的基本算术逻辑行为。

论文地址:https://arxiv.org/abs/2410.21272

该研究首先定位了Llama3-8B/70B, Pythia-6.9B及GPT-J四个模型中负责算术计算的模型子集。

如图1所示,少数注意力头对大模型面对算术问题的正确率有显著影响。第一个 MLP(多层感知机) 明显影响操作数和操作符位置,而中间层和后期层的 MLP 将token信息投影到最后位置,提升正确答案的出现概率。

图1:Llama3-8B中发现算术相关的模型子集

该研究聚焦于单个神经元层面,发现了一组重要的神经元,它们实现了简单的启发式算法。只需要关注特定的极少量神经元,就能正确预测大模型进行算术运算的结果(图2)。

图2:大模型 中每层神经元中只需要关注1.5%的少数子集,就能预测大模型进行四则运算的结果

举个例子:当输入的提示词为“ 226−68= ”时,神经元24|12439在结果介于150和180的减法提示下显示出高激活值,可被视为一个启发式算法。而每个启发式算法识别一个数值输入模式,并输出相应的答案。

具体可分为两种不同的激活模式:第一种直接启发式指的是在某些神经元中,激活模式取决于两个操作数,值向量编码了算术计算的预期结果(图 3b,c)。

第二种间接激活模式取决于单个操作数对应的神经元中,值向量通常编码下游处理的特征,而不是直接的计算结果(图3a)。

图3:启发式方法的可视化

神经元和运算的因果联系

该如何确认特定神经元和相关数学运算之间存在因果关系?一种常见的方法是消融分析,即将大模型大模型中特定的神经元敲除,看看模型的效果会有何改变,结果如图4所示。

图4:四则运算中敲除对应的算术神经元后模型的性能对比

去掉了对应神经元后,模型的运算准确性无论加减乘除都显著下降。

不仅如此,相比去除特定算术神经元时造成的性能下降,可以发现,去除随机神经元的影响相对较小,而且这种效应在模型8B和70B不同参数量中普遍存在。

图5:敲除与算术相关的启发式算法的神经元(实线)相比与算术无关的相同数量的随机神经元(虚线)

上述结果表明,可仅根据其相关启发式算法来识别对特定对大模型进行算术重要的神经元,也证明了属于几个启发式算法的神经元与提示正确完成之间的因果关系。

此外,该结果还支持了启发式算法集合的主张:即每个启发式算法仅略微提高正确答案的几率,但它们结合在一起,使得大模型以高概率产生算术题的正确答案。

大模型为何做不对算术题

Llama3-8B模型无法可靠地对每道算术题时给出正确的回答。基于启发式规则,该研究阐述了模型为何会做错,可能的机制共有两种:

第一,由于参数量的限制,大模型缺乏足够的算术神经元,无法针对每一种情况都给出应对。

第二种原因是,可能存在回忆不完整的情况,比如某个启发式规则对应的神经元没有在运算时被触发。

图6:随机抽取了50个正确完成和50个错误完成的算术题目,考察大模型中被正确和错误激活的算术神经元个数

如图6所示,在大模型回答正确及错误时,激活的算术神经元个数不存在差异,这不支持前述的第一种算术神经元个数不足的假设。

然而,在大模型回答正确的情况下,更多比例的正确神经元被激活了,而回答错误的案例中,应当被激活的神经元激活概率反而较小。

这意味着大模型在特定算术题上失败的主要原因是对能得出正确答案的神经元缺少泛化能力,而不是算术神经元的数量不足。

「算术神经元」何时诞生

由于其训练检查点可供公众获取,该研究采用Pythia-6.9B来考察大模型过程中算术神经元的出现阶段。

结果显示,大模型在训练过程中逐渐发展其最终的算术启发式机制,且算术神经元在模型训练早期就已出现。

图7 :启发式的算术神经元的百分比随着训练增加

在模型训练的不同阶段,移除特定的启发式神经元会大幅降低模型在所有训练检查点的准确性,这表明算术准确性主要来自启发式,即使在早期阶段也是如此。算术启发式神经元与大模型算术能力的因果关系在整个训练过程中都存在。

图8:不同阶段敲除算术神经元对大模型进行算术运算准确性的影响

结论

理解大模型如何进行数学运算,不仅可以打开大模型内部运行的黑箱,解释它们为何在简单的数学题上翻车,例如最著名的「9.11和9.8哪个大」。

这项研究告诉我们,并不是因为大模型缺少相关训练,而是激活了错误的启发式神经元,例如将这个问题当成了询问哪个版本更大。

理解了大模型的算术运算,是依赖于启发式方法集,而非单纯的依靠记忆(背题目)或学会规则,这表明提高大模型的数学能力可能需要训练和架构的根本性改变,而不是像激活引导这样的小修小补。

对训练过程的分析结果指出,大模型在训练早期就学会了这些启发式方法,并随时间推移逐渐强化。这可能会导致模型过度拟合到早期的简单策略,因此可作为之后优化方向的参考。

参考资料:

https://arxiv.org/abs/2410.21272

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Vlog:自驾爆开2000公里,带娃阿尔卑斯山学滑雪,结果遇到三十年不遇大暴雪?!

Vlog:自驾爆开2000公里,带娃阿尔卑斯山学滑雪,结果遇到三十年不遇大暴雪?!

英国那些事儿
2026-03-11 23:20:39
中国反击来了!约谈马士基集团负责人:敢动巴拿马运河后果自负!

中国反击来了!约谈马士基集团负责人:敢动巴拿马运河后果自负!

吕醿极限手工
2026-03-11 11:55:18
养老金调整方向已明确,企退、事退和农民的养老金都将怎么涨?

养老金调整方向已明确,企退、事退和农民的养老金都将怎么涨?

混沌录
2026-03-11 22:28:04
知三当三、被婆婆扫地出门?孙怡高调官宣喜讯,彻底打脸董子健

知三当三、被婆婆扫地出门?孙怡高调官宣喜讯,彻底打脸董子健

观察者海风
2026-03-10 13:52:31
今日“出九九”,牢记:1不洗,2不收,3不碰,4多吃,换季少生病

今日“出九九”,牢记:1不洗,2不收,3不碰,4多吃,换季少生病

小茉莉美食记
2026-03-12 00:35:03
南通支云官方:10名球员离队,9名球员租借到其他俱乐部

南通支云官方:10名球员离队,9名球员租借到其他俱乐部

懂球帝
2026-03-11 16:05:08
反正我就是喜欢阿姨

反正我就是喜欢阿姨

贵圈真乱
2026-03-11 13:45:49
两会仅7天!全国政协委员发言字字不提全红婵,句句戳全红婵心窝

两会仅7天!全国政协委员发言字字不提全红婵,句句戳全红婵心窝

阿纂看事
2026-03-11 16:13:51
太笋了,为了流量宝马女销售公然嘲讽小米汽车是“速成鸡”

太笋了,为了流量宝马女销售公然嘲讽小米汽车是“速成鸡”

新浪财经
2026-03-10 23:32:49
苹果首款折叠屏手机!iPhone Fold细节揭秘:机身太薄放弃Face ID

苹果首款折叠屏手机!iPhone Fold细节揭秘:机身太薄放弃Face ID

快科技
2026-03-12 07:30:05
3月11日票房下滑:《镖人》13亿,《惊蛰无声》12.5亿

3月11日票房下滑:《镖人》13亿,《惊蛰无声》12.5亿

月光作笺a
2026-03-12 07:44:57
生育大局已定:不出意外的话,2026年起中国人口将迎来3大变化

生育大局已定:不出意外的话,2026年起中国人口将迎来3大变化

混沌录
2026-03-11 22:28:09
早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

早就想打!日媒首次爆料:中国双航母出动时日军战机已做战斗准备

诗意世界
2025-08-21 13:13:50
我从油车换到电车后,终于明白:还有那么多人不换车,不是傻,而是聪明

我从油车换到电车后,终于明白:还有那么多人不换车,不是傻,而是聪明

刘哥谈体育
2026-02-16 20:29:51
最新公示:王濛拟破格晋升国家级教练

最新公示:王濛拟破格晋升国家级教练

大象新闻
2026-03-11 20:41:02
豪赌还是自救?全新奥迪A6L预售“降价10万”背后的隐忧与争议

豪赌还是自救?全新奥迪A6L预售“降价10万”背后的隐忧与争议

超级宇论
2026-03-11 16:30:55
伊朗导弹为何失去饱和攻击能力:地下导弹城正在崩塌

伊朗导弹为何失去饱和攻击能力:地下导弹城正在崩塌

斌闻天下
2026-03-11 07:00:04
一嫁日本,二嫁美国,三嫁法国,绝不嫁中国人的李勤勤,咋样了?

一嫁日本,二嫁美国,三嫁法国,绝不嫁中国人的李勤勤,咋样了?

近史博览
2026-03-09 19:49:10
从成都出差重庆市,毫不夸张的讲,重庆市是个值得敬佩的地方!

从成都出差重庆市,毫不夸张的讲,重庆市是个值得敬佩的地方!

瓜哥的动物日记
2026-03-11 19:51:05
云南楚雄一共享单车防风护罩疑遭恶意插针,针头对着握把,或故意为之!有人被扎到后进行了体检,多方回应:已报案并全面排查

云南楚雄一共享单车防风护罩疑遭恶意插针,针头对着握把,或故意为之!有人被扎到后进行了体检,多方回应:已报案并全面排查

大风新闻
2026-03-11 12:07:02
2026-03-12 08:31:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14696文章数 66685关注度
往期回顾 全部

科技要闻

腾讯"养虾"暴涨后,百度急得在门口"装虾"

头条要闻

FBI警告:伊朗或对美国加州发动无人机袭击

头条要闻

FBI警告:伊朗或对美国加州发动无人机袭击

体育要闻

郭艾伦重伤,CBA下半赛季还能期待些什么

娱乐要闻

蔡少芬晒全家福照,两女儿成最大亮点

财经要闻

唤醒10万亿存量资金 公积金改革大潮来了

汽车要闻

莲花纠偏, 冯擎峰的“收”与“守”

态度原创

教育
亲子
健康
房产
公开课

教育要闻

成都高中,加大扩容

亲子要闻

产后性生活不和谐?别慌,用对心技巧,宝妈也能重获性福与爽感

转头就晕的耳石症,能开车上班吗?

房产要闻

最低杀到7800元/㎡!海口2026第一波房价大调整来了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版