网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

MIT捅破AI天花板：不用堆GPU，让模型“返工”就变强

2026-01-06 16:22:01　来源: 烈史

上海举报

0

分享至

哈喽，大家好，杆哥这篇评论，主要来分析MIT捅破AI天花板：不用堆GPU，让模型“返工”就变强

你有没有过这样的经历？让AI处理一篇长文档，结果它越读越迷糊，给出的答案牛头不对马嘴。

这个被学术界称为“上下文腐化”的AI通病，终于被麻省理工学院（MIT）破解。

2025年12月31日，MIT发布重磅论文《Recursive Language Models》，提出的递归语言模型（RLM），用“让AI返工”的简单思路，实现了效果的飞跃。

痛点直击：AI不是不聪明，是记性太差

长期以来，行业默认的AI升级路径是堆参数、加显卡。但这根本解决不了核心问题——大模型的“记性”不行。

这可以用“上下文窗口”来理解。哪怕是最先进的GPT-5，上下文窗口也仅能容纳27万个token（约20万字中文）。更关键的是，即便在这个范围内，模型表现也会随输入变长急剧下降。

给它8000个token时表现优异，8万个token就开始迷糊，到27万个token直接胡说八道。就像让一个人记住整本百科全书再答题，信息太多根本理不清。

天才思路：把资料放进“抽屉”，不用硬记

MIT的解决方案颠覆了传统思路：不把超长资料直接塞进AI“脑子”，而是放在外部“抽屉”里，让AI用代码按需查找。

RLM的核心逻辑是给AI配备Python编程环境，将超长文档存为变量。

AI不再逐字通读，而是通过代码操作文档——用代码查长度、搜关键词，甚至把复杂问题拆分成小任务，召唤“分身”（递归调用自身）同步处理，最后汇总答案。

这就像给学生配了目录和搜索引擎，不用硬啃整本书，只需针对性查找重点，效率和准确率大幅提升。

效果震撼：1000万token稳得住，成本还更低

论文中的实验数据极具说服力。在超长文档理解测试中，GPT-5基座模型准确率仅44%，而RLM达到56.5%；CodeQA任务中，RLM准确率从24%飙升至62%，提升2.7倍。

当文档长度突破1000万token（相当于几十本书），GPT-5直接崩盘，RLM却能稳定输出。

更惊喜的是成本，在BrowseComp-Plus测试中，GPT-5-mini处理600万-1100万token需1.5-2.75美元，RLM平均仅0.99美元。

行业转折：AI升级不用再“拼硬件”

MIT的研究打破了“参数越大越聪明”的固有认知，证明通过优化处理逻辑，不用堆砌GPU也能让AI变强。这种“返工”机制，本质是让AI拥有了类似人类的思考习惯——反复推敲、拆分任务。

目前X平台多位行业大佬已为这项研究点赞。随着RLM技术落地，未来AI处理无限长文档将成为可能，在法律、科研等长文本领域的应用前景广阔。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

鹰和龙：iRobot，被惊醒的美国梦

钛媒体APP 2025-12-19 08:46:13
0 跟贴 0
4个月烧掉30亿Token，这位「菜鸟」程序员做出50多个产品

机器之心Pro 2026-01-04 14:53:09
35 跟贴 35

大模型最难的AI Infra，用Vibe Coding搞定

机器之心Pro 2026-01-07 15:33:06
0 跟贴 0

金鱼损失随机剔除token，让AI不再死记硬背

量子位 2025-09-03 17:37:23
0 跟贴 0
OpenAI前CTO首个创业产品Tinker，全量升级开放了，还有羊毛可薅

机器之心Pro 2026-01-07 14:30:39
0 跟贴 0

陈天桥携MiroThinker 1.5开年登场：跑赢万亿模型，实现小模型大智能

钛媒体APP 2026-01-08 12:39:09
0 跟贴 0

阿里为什么非要打千问这场仗？

钛媒体APP 2026-01-08 12:39:13
0 跟贴 0
UniPercept 统一图像美学、质量与结构纹理感知

机器之心Pro 2026-01-08 11:59:29
0 跟贴 0

当咖啡机器人席卷CES：一场商用具身智能的消费革命

钛媒体APP 2026-01-08 13:21:08
0 跟贴 0
“短缺终将导致过剩”！a16z安德森2026年展望：AI芯片将迎来产能爆发与价格崩塌

华尔街见闻官方 2026-01-08 11:17:59
0 跟贴 0
清华00后揪出AI幻觉元凶：仅0.1%神经元，一按就老实

DeepTech深科技 2026-01-07 21:18:03
0 跟贴 0
模型不用微调，靠上下文就能自我进化？

机器之心Pro 2025-10-11 20:20:59
0 跟贴 0
刚刚，上海GPU龙头上市，开盘涨超31%，市值484亿

智东西 2026-01-08 10:12:29
1 跟贴 1
历史已站在中国GPU这边

华商韬略 2026-01-08 10:28:44
7 跟贴 7
检索做大，生成做轻：CMU团队系统评测RAG的语料与模型权衡

机器之心Pro 2026-01-06 12:42:27
0 跟贴 0
M+框架来了，增加LLM隐空间记忆，不再受上下文窗口限制

机器之心Pro 2025-07-15 17:07:00
0 跟贴 0
乳液放置后为什么会分层、变稀？MIT团队揭开“机械记忆”秘密

DeepTech深科技 2025-09-29 14:13:53
0 跟贴 0
盘点全网那些高能预判天花板，预感来了连自己都吓一跳

青蛙刀圣1993 2026-01-07 14:03:51
0 跟贴 0
英伟达发布纯视觉自动驾驶模型！马斯克回应！一口气看完CES演讲

极客小冷 2026-01-06 17:12:24
927 跟贴 927
这跟数学没多大关系啊，这是思维逻辑

喜蕃影视 2026-01-06 10:38:27
212 跟贴 212
老公玩到凌晨回家，妻子一秒戏精上身，情商天花板实锤了！

心看生活热点 2026-01-04 16:23:28
0 跟贴 0
官方发表喜讯，20岁杨瀚森再破天花板，获得“突破瞬间人物”奖

鋭娱之乐 2026-01-07 20:14:31
40 跟贴 40
楼上漏水损坏天花板，大哥上门理论，看到大爷状态后笑着说“拉倒吧，都是老邻居”

观象视频 2026-01-04 14:55:28
1 跟贴 1
MIT博士生攻关淬火工艺，为核反应堆降温，打造下一代航天器

DeepTech深科技 2025-11-07 13:26:01
0 跟贴 0
空间天花板智能舒适全能旗舰试驾吉利银河V900

车扯 2026-01-08 12:03:05
3 跟贴 3
Bengio团队找到了一种超越Transformer的硬件对齐方案

机器之心Pro 2026-01-07 15:02:29
0 跟贴 0
2nm 来了！英特尔发布第三代 Ultra 处理器，核显也能玩《战地》｜CES 2026

爱范儿 2026-01-08 11:53:10
0 跟贴 0
雷军回应"营销大师"标签:现在听到营销两字都有点恶心

每日经济新闻 2026-01-08 00:48:20
1981 跟贴 1981
创意气球天花板！男子手舞气球龙，造型逼真超震撼，网友：金色的会不会更惊艳

都市观察 2026-01-08 10:38:06
0 跟贴 0
这是地暖爆了？把房子送给楼下吧，这么一整直接变复式了

巴比伦生活 2026-01-05 08:59:47
0 跟贴 0
《荒野大镖客2》玩家挖掘代码揭开多项都市传说之谜

3DM游戏 2026-01-08 10:16:05
1 跟贴 1
国家医保局发文，新版医保目录调入、调出、支付范围变化药品来了

新浪财经 2026-01-07 18:01:24
0 跟贴 0
迟到借口天花板：肚子疼+睁眼说瞎话+忘穿裤子

娱乐小欣 2026-01-08 03:27:31
0 跟贴 0
陕西一路段塌方房屋悬大坑边缘，顶棚摇摇欲坠，官方回应

掌闻视讯 2026-01-07 09:21:58
0 跟贴 0
贴天花顶瓷砖的独特方法贴天花顶瓷砖的独特方法

奇观趣闻 2026-01-03 21:19:34
0 跟贴 0
Cell子刊：龙尔平/万沛星团队发布大模型“圆桌会议”框架，大幅提升医疗AI推理能力

生物世界 2026-01-06 13:11:24
0 跟贴 0
调查显示日本2026年约1.5万种食品将涨价

财联社 2026-01-07 19:58:11
4568 跟贴 4568
大哥车顶躺椅上泡茶，日子太惬意了，松弛的天花板！

笑到地老天荒号 2026-01-07 17:15:53
1 跟贴 1
电焊工耗时3年自制不锈钢航母模型

知肇分子 2026-01-05 23:10:11
4 跟贴 4
这才是心灵手巧的天花板

柳伊 2026-01-08 07:51:53
1 跟贴 1

中日情况有变，高市早苗急电白宫，特朗普发狠，下达了一项总统令

中日情况有变，高市早苗急电白宫，特朗普发狠，下达了一项总统令

趣史微视频

2026-01-08 13:12:16

力压KD，阿夫迪亚24中13砍赛季新高41分&开拓者生涯首次40+

力压KD，阿夫迪亚24中13砍赛季新高41分&开拓者生涯首次40+

懂球帝

2026-01-08 14:04:19

天网恢恢！“电诈之王”陈志被捕并遣返中国

天网恢恢！“电诈之王”陈志被捕并遣返中国

冰川思想库

2026-01-08 00:06:16

被曝有私生女！成人女星携视频实锤锡安，网友：他比哈登还重口

被曝有私生女！成人女星携视频实锤锡安，网友：他比哈登还重口

听我说球

2026-01-08 08:47:49

姜文63岁晒肌肉照引热议！家里书房变健身房，书架上红彤彤全是奖

姜文63岁晒肌肉照引热议！家里书房变健身房，书架上红彤彤全是奖

娱圈小愚

2026-01-07 09:47:24

江苏朱氏家族：一门出12博士，却都为美国效力，最高官居能源部长

江苏朱氏家族：一门出12博士，却都为美国效力，最高官居能源部长

梦史

2025-12-25 16:04:43

不打不相识，张稀哲曾在亚冠联赛中放倒国安新帅蒙哥马利

不打不相识，张稀哲曾在亚冠联赛中放倒国安新帅蒙哥马利

懂球帝

2026-01-08 11:50:35

印尼求中国重组雅万高铁债务：运营两年盈利难暴高铁商业化痛点

印尼求中国重组雅万高铁债务：运营两年盈利难暴高铁商业化痛点

社会日日鲜

2026-01-07 12:07:02

印度大叔：上海贫穷又落后跟孟买没法比，谁知来参观之后不想走了

印度大叔：上海贫穷又落后跟孟买没法比，谁知来参观之后不想走了

天气观察站

2026-01-07 10:21:29

央视怒批，人民日报点名封杀，这5位目无法纪的大网红，彻底凉凉

央视怒批，人民日报点名封杀，这5位目无法纪的大网红，彻底凉凉

一娱三分地

2025-12-04 17:00:33

上海有人雇佣“外籍家政服务员”，吃了大亏：珠宝首饰被盗走，自己也被罚了！

上海有人雇佣“外籍家政服务员”，吃了大亏：珠宝首饰被盗走，自己也被罚了！

上观新闻

2026-01-08 11:56:12

今日金价一夜突变！1月8日调整后，全国珠宝店，黄金最新售价

今日金价一夜突变！1月8日调整后，全国珠宝店，黄金最新售价

别人都叫我阿腈

2026-01-08 06:59:15

勇士复仇雄鹿！库里31+7+7梅尔顿5三分22分新高字母哥空砍34+10

勇士复仇雄鹿！库里31+7+7梅尔顿5三分22分新高字母哥空砍34+10

锅子篮球

2026-01-08 13:31:58

一年卖30万套商品房的成都楼市，也有点扛不住了

一年卖30万套商品房的成都楼市，也有点扛不住了

林子说事

2026-01-08 10:06:46

不到48小时，特朗普或下台，印度多500％关税，美国又抢千万石油

不到48小时，特朗普或下台，印度多500％关税，美国又抢千万石油

蓝色海边

2026-01-08 07:10:37

中国养老负担将越来越重：从4.7个劳动力养一个老人到1.9个劳动力供养1个老人

中国养老负担将越来越重：从4.7个劳动力养一个老人到1.9个劳动力供养1个老人

西虹市闲话

2026-01-08 13:51:18

燕麦立大功！研究发现：早餐常吃燕麦的人，不用太久，或有5好处

燕麦立大功！研究发现：早餐常吃燕麦的人，不用太久，或有5好处

小胡军事爱好

2025-11-28 09:45:23

美俄对峙，俄罗斯怂了，俄油轮被美军扣押

美俄对峙，俄罗斯怂了，俄油轮被美军扣押

山河路口

2026-01-08 12:19:03

华为Mate80突然官降：1月7日，惊喜大反转

华为Mate80突然官降：1月7日，惊喜大反转

科技堡垒

2026-01-07 12:46:59

英国证实参与美国北大西洋扣押油轮行动

英国证实参与美国北大西洋扣押油轮行动

澎湃新闻

2026-01-08 02:02:18

千年中华史，烟尘映古道，岁月如歌，悠悠情未老。

1555文章数 56关注度

往期回顾全部

科技要闻

雷军：现在听到营销这两个字都有点恶心

头条要闻

委内瑞拉外长：感谢中方支持

头条要闻

委内瑞拉外长：感谢中方支持

体育要闻

约基奇倒下后，一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青：未来人类会花钱"戒手机"

汽车要闻

不谈颠覆与奇迹，智驾企业还能聊点什么？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

健康

手机

游戏

公开课

房产要闻

三亚新房，又全国第一了！

这些新疗法，让化疗不再那么痛苦

手机要闻

雷军：小米终端今年有望实现自研芯片、OS、AI大模型“大会师”

《生化4》碍事梨性感雕像：硅胶皮肤丝滑头发

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版