网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

研究发现：看似超级智能的大模型，正常训练下连基本乘法都不会

2026-01-04 10:31:59　来源: 装满幸福

四川举报

0

分享至

AI能写复杂代码、做逻辑推理，却搞不定小学四年级的四位数乘法。

这事听着像段子，却是真实存在的研究发现。

芝加哥大学有个团队做了项研究，牵头的是博士生白晓燕和教授谭晨浩，还联合了麻省理工、哈佛这些名校以及谷歌DeepMind的研究者，他们的成果发在了arXiv预印本服务器上。

谁能想到最先进的AI会栽在这种基础算术上。

团队测试了不同层数的模型，从两层到十二层，结果都一样惨，四位数相乘的正确率低得可怜。

这种“能搞定复杂推理，却在简单任务上翻车”的现象，被研究团队命名为“崎岖前沿”。

本来想，是不是模型层数不够、训练数据太少？但测试下来发现不是这么回事。

哪怕把模型做得更大、训练时间拉得更长，准确率还是上不去。

这就有意思了，AI处理代码编写、数据分析这种高难度任务时游刃有余，怎么偏偏在乘法这种人类小学生都能掌握的技能上掉链子？

后来才明白，问题的关键不在任务难度高低，而在任务本身的特性。

咱们人类做四位数乘法时，得记住进位，还得把中间算出来的部分积暂时存着，最后再汇总相加。

这种需要暂存中间信息并用到后续步骤里的能力，学术上叫“长程依赖”。

AI搞不定乘法，核心就是缺了这方面的能力。

标准的大语言模型，本质上是靠识别训练数据里的模式来工作的。

复杂任务虽然难，但可能存在更多可复用的模式，可四位数乘法的组合太多了，模型根本没法靠记忆覆盖所有情况。

更麻烦的是，标准的微调方法会让模型陷入“局部最优解”的陷阱。

打个比方，这就像爬山找最高峰，模型爬到一个小山包就以为到顶了，压根不知道真正的山顶还在更远的地方。

没有能存储和检索中间信息的架构支持，再怎么训练都是白费功夫。

这一点挺颠覆认知的，以前大家总觉得“模型越大、参数越多，能力就越强”，现在看来并非如此。

长程依赖问题也不是只出现在乘法里。

如此看来，这个问题其实是大模型的共性短板，只是在乘法这种需要精准分步计算的任务上，暴露得更明显而已。

就在大家觉得没办法的时候，研究团队发现了一个成功案例，用“隐式思维链”训练的模型，做四位数乘法的准确率居然能达到百分之百。

我特意去了解了下这种训练方法，它不是让模型一步出答案，而是强迫模型把推理过程内化到自身的隐藏状态里，不用依赖显式的分步标记。

这有点像教小孩心算，一开始可以掰手指、写草稿，慢慢就得在脑子里完成整个过程。

研究团队解剖这两种模型后发现，用隐式思维链训练的模型，首先学会了记住重要的中间信息，从它的内部状态里能解码出累计总和这些关键数据，标准模型却完全做不到。

更让人惊讶的是，这种模型还会自己组织注意力路径。

早期的网络层负责计算数字对的乘积并存储，后续层再精准检索需要的数值，形成了一套高效的内部运算结构。

甚至，它还自发形成了精妙的数学结构，用傅里叶基的波形模式编码数字，通过闵可夫斯基和这种几何运算来处理乘法，这些都不是研究人员编程写进去的。

基于这个发现，团队还给出了一个简单的解决方案：在标准训练里加一个目标，让模型学会追踪每一步的累加总和。

没想到效果立竿见影，原本彻底失败的双层模型，准确率一下子就提了上来，还自己学会了类似的存储检索机制。

毫无疑问，这项研究的价值远不止让AI学会乘法。它揭示了大模型学习和思考的基本原理，证明了正确的训练引导和架构设计，比单纯堆参数、堆数据更重要。

这也解释了为啥AI在数学上的表现总不稳定，用模式匹配的思路去解决需要严格逻辑推理的问题，本身就是用错了工具。

未来的AI要想真正走向“智能”，可能需要明确区分记忆和逻辑这两种能力，在架构上给它们提供针对性的支持。

随着AI越来越多地融入关键决策过程，搞清楚它的学习规律，找到正确的提升方向，远比追求参数规模的堆砌更有意义。

声明：个人原创，仅供参考

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

刚下飞机行李就没了！杭州姑娘花10多万去南极旅游却崩溃：衣物全靠借

环球网资讯 2026-03-03 08:53:57
5886 跟贴 5886
日本政府紧张研判：派自卫队去霍尔木兹海峡

都市快报橙柿互动 2026-03-05 13:57:55
12131 跟贴 12131

福建人再次登顶中国首富

漳视新闻 2026-03-05 15:49:34
249 跟贴 249

冬天正从广东消失？气象专家解析冬季天气反常原因

齐鲁壹点 2026-03-05 11:55:36
94 跟贴 94
中超首轮赛前发布会安排：泰山队为宿茂臻携彭啸出席

闪电新闻 2026-03-05 16:18:52
34 跟贴 34

养老金月最低标准再提20元

新华社 2026-03-05 10:04:27
836 跟贴 836

“一天能挣五六百元”，广州老板街头排队抢人！网友：能不能带我一个

环球网资讯 2026-03-05 15:27:13
175 跟贴 175
比亚迪发布第二代刀片电池，王传福：从10%充到97%只用9分钟

蓝鲸新闻 2026-03-05 19:39:30
6456 跟贴 6456

外媒分享特斯拉FSD v14.2.2.5实测报告：极端化表现引发用户困惑

环球网资讯 2026-03-05 16:51:01
49 跟贴 49
美股三大指数集体收跌，道指跌1.61%，纳指跌0.26%

每日经济新闻 2026-03-06 05:12:08
1 跟贴 1
大风315 | 男子称5000元买到假银条，因商家失联要求平台先行退一赔三被拒；律师说法

大风新闻 2026-03-05 16:32:15
197 跟贴 197
代表建议，鼓励大学生加入家政行业

中国新闻周刊 2026-03-05 09:21:03
3788 跟贴 3788
政府工作报告：2025年GDP增长5%

新华社 2026-03-05 09:08:16
2152 跟贴 2152
普通高中学位供给将增加

新华社 2026-03-05 10:01:03
39 跟贴 39
山姆1.38公斤冰块卖37.9元，消费者称比冰块融化速度慢，而且颜值高，门店工作人员：销量不错，现货极少

观威海 2026-03-04 10:39:05
1313 跟贴 1313
“沪七条”落地首周：上海新房二手房齐火爆，长三角客群扎堆入市

界面新闻 2026-03-05 09:43:30
264 跟贴 264
600号边上，上海这家名字特别的研究所火了！招聘要求博士，还给编制！网友好奇：上班即修仙？

极目新闻 2026-03-05 17:12:31
524 跟贴 524
OpenClaw火了先赚钱的是上门安装500元一次

蓝鲸新闻 2026-03-05 19:07:09
20 跟贴 20
推进农业转移人口市民化

新华社 2026-03-05 09:56:48
2 跟贴 2
探索多渠道盘活存量商品房

新华社 2026-03-05 10:07:21
117 跟贴 117
起诉之间

作家方晓莉 2026-03-06 06:32:54
9 跟贴 9
椰树屡教不改！被罚3次共100万，为何还敢用低俗广告博眼球？

无情有思可 2026-03-06 06:23:16
0 跟贴 0
河南一女孩意外离世，家人不知道发生了什么

九方鱼论 2026-03-06 06:59:47
0 跟贴 0

被15所大学拒收！ 19岁男研发AI辨识食物App获收购年收3千万美元

被15所大学拒收！ 19岁男研发AI辨识食物App获收购年收3千万美元

环球趣闻分享

2026-03-05 18:04:08

伊朗大使馆分享中国儿歌《美国佬是强盗》后，英文版已经上架

伊朗大使馆分享中国儿歌《美国佬是强盗》后，英文版已经上架

映射生活的身影

2026-03-05 13:18:38

青少年“短视频成瘾”怎么治？全国人大代表建议夜间强制未成年人下线｜两会开放麦

青少年“短视频成瘾”怎么治？全国人大代表建议夜间强制未成年人下线｜两会开放麦

封面新闻

2026-03-05 16:40:04

库里自称三分纪录并非不可打破！华子发声：我和克努佩尔能追上他

库里自称三分纪录并非不可打破！华子发声：我和克努佩尔能追上他

罗说NBA

2026-03-06 06:03:03

巴拿马“撕合同”翻车现场：美国点头后才发现21%中国货说跑就跑！

巴拿马“撕合同”翻车现场：美国点头后才发现21%中国货说跑就跑！

阿芒娱乐说

2026-03-06 00:05:14

“温宜公主”北电校考，脸圆肉多没星味，1人打伞3人跟拍排场大

“温宜公主”北电校考，脸圆肉多没星味，1人打伞3人跟拍排场大

可乐谈情感

2026-03-05 13:36:27

9分钟满电、1000公里纯电，比亚迪真能颠覆电动车？

9分钟满电、1000公里纯电，比亚迪真能颠覆电动车？

电动星球News

2026-03-05 23:24:56

美股期指跌幅扩大

财联社

2026-03-05 22:22:08

中方还没批准进口，特朗普先一步下令，对华先进芯片必须“限购”

中方还没批准进口，特朗普先一步下令，对华先进芯片必须“限购”

井普椿的独白

2026-03-05 17:21:08

媒体人：郭艾伦ACL很难打出好状态了，但CBA会有他一席之地

媒体人：郭艾伦ACL很难打出好状态了，但CBA会有他一席之地

懂球帝

2026-03-06 00:38:02

看哭了！伊朗亮出最后底牌，让美国胆寒的出现了！

看哭了！伊朗亮出最后底牌，让美国胆寒的出现了！

大嘴说天下

2026-03-05 20:52:18

400多斤！2024年，海南女子海边摆摊卖贝壳，暗中销售“高档货”

400多斤！2024年，海南女子海边摆摊卖贝壳，暗中销售“高档货”

万象硬核本尊

2026-03-05 17:15:18

马思纯官宣和张曼乐分手！谈分手原因太唏嘘，和欧豪在一起时不同

马思纯官宣和张曼乐分手！谈分手原因太唏嘘，和欧豪在一起时不同

古希腊掌管月桂的神

2026-03-05 10:44:23

中国2000多个县城的生存现状：除了性生活就是打麻将！

中国2000多个县城的生存现状：除了性生活就是打麻将！

谈史论天地

2026-03-03 18:02:29

美以军事打击伊朗，美国三个企图已落空

美以军事打击伊朗，美国三个企图已落空

极目新闻

2026-03-05 08:54:21

中美一家3口一致决定从迪拜回广州；13岁女儿独自从迪拜回国，妈妈仍留当地工作；中国航司重启中东航线

中美一家3口一致决定从迪拜回广州；13岁女儿独自从迪拜回国，妈妈仍留当地工作；中国航司重启中东航线

大象新闻

2026-03-05 17:51:14

巴基斯坦也没有想到，跟着中国混来混去，结果自己也混了一个霸主

巴基斯坦也没有想到，跟着中国混来混去，结果自己也混了一个霸主

老范谈史

2025-12-09 20:00:56

老伴治病欠下30万，济南82岁奶奶为还债摆摊卖鹌鹑蛋！十年没涨价，每天几百元的收入；“咱不是那种人，钱必须要还上”

老伴治病欠下30万，济南82岁奶奶为还债摆摊卖鹌鹑蛋！十年没涨价，每天几百元的收入；“咱不是那种人，钱必须要还上”

大风新闻

2026-03-05 14:28:04

两会｜代表建议：因性侵害未成年人获刑的犯罪分子，出狱后佩戴电子定位装置

两会｜代表建议：因性侵害未成年人获刑的犯罪分子，出狱后佩戴电子定位装置

新欧洲

2026-03-04 19:48:08

做完手术人就废了，这5种手术不需要做，别让无知害了自己

做完手术人就废了，这5种手术不需要做，别让无知害了自己

医学科普汇

2026-01-29 06:25:03

398文章数 49关注度

往期回顾全部

科技要闻

独家|林俊旸辞职我们和认识他的人聊了聊

头条要闻

伊朗：已作好准备应对美国地面行动

头条要闻

伊朗：已作好准备应对美国地面行动

体育要闻

不开玩笑，没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦，张杰前女友爆猛料

财经要闻

“十五五”开局之年，这么干！

汽车要闻

15.98万元起第三代领克03大尾翼版上市

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

房产

亲子

教育

公开课

卖爆了！PS5 Pro一度断货曝索尼紧急提升产能

房产要闻

超猛！又有2800套房源砸出，2026海口安居房，彻底爆发！

亲子要闻

去挖煤了？娃穿一天的衣服能脏到哪种程度？网友：扫地机都多余买

教育要闻

“大学生连鸡都不会切”，家长晒只剩下半身的烤鸡，无法正常交流

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版