网易首页 > 网易号 > 正文 申请入驻

MIT捅破AI天花板:不用堆GPU,让模型“返工”就变强

0
分享至

哈喽,大家好,杆哥这篇评论,主要来分析MIT捅破AI天花板:不用堆GPU,让模型“返工”就变强

你有没有过这样的经历?让AI处理一篇长文档,结果它越读越迷糊,给出的答案牛头不对马嘴。

这个被学术界称为“上下文腐化”的AI通病,终于被麻省理工学院(MIT)破解。



2025年12月31日,MIT发布重磅论文《Recursive Language Models》,提出的递归语言模型(RLM),用“让AI返工”的简单思路,实现了效果的飞跃。

痛点直击:AI不是不聪明,是记性太差

长期以来,行业默认的AI升级路径是堆参数、加显卡。但这根本解决不了核心问题——大模型的“记性”不行。



这可以用“上下文窗口”来理解。哪怕是最先进的GPT-5,上下文窗口也仅能容纳27万个token(约20万字中文)。更关键的是,即便在这个范围内,模型表现也会随输入变长急剧下降。



给它8000个token时表现优异,8万个token就开始迷糊,到27万个token直接胡说八道。就像让一个人记住整本百科全书再答题,信息太多根本理不清。



天才思路:把资料放进“抽屉”,不用硬记

MIT的解决方案颠覆了传统思路:不把超长资料直接塞进AI“脑子”,而是放在外部“抽屉”里,让AI用代码按需查找。



RLM的核心逻辑是给AI配备Python编程环境,将超长文档存为变量。



AI不再逐字通读,而是通过代码操作文档——用代码查长度、搜关键词,甚至把复杂问题拆分成小任务,召唤“分身”(递归调用自身)同步处理,最后汇总答案。



这就像给学生配了目录和搜索引擎,不用硬啃整本书,只需针对性查找重点,效率和准确率大幅提升。



效果震撼:1000万token稳得住,成本还更低



论文中的实验数据极具说服力。在超长文档理解测试中,GPT-5基座模型准确率仅44%,而RLM达到56.5%;CodeQA任务中,RLM准确率从24%飙升至62%,提升2.7倍。

当文档长度突破1000万token(相当于几十本书),GPT-5直接崩盘,RLM却能稳定输出。



更惊喜的是成本,在BrowseComp-Plus测试中,GPT-5-mini处理600万-1100万token需1.5-2.75美元,RLM平均仅0.99美元。

行业转折:AI升级不用再“拼硬件”



MIT的研究打破了“参数越大越聪明”的固有认知,证明通过优化处理逻辑,不用堆砌GPU也能让AI变强。这种“返工”机制,本质是让AI拥有了类似人类的思考习惯——反复推敲、拆分任务。



目前X平台多位行业大佬已为这项研究点赞。随着RLM技术落地,未来AI处理无限长文档将成为可能,在法律、科研等长文本领域的应用前景广阔。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中日情况有变,高市早苗急电白宫,特朗普发狠,下达了一项总统令

中日情况有变,高市早苗急电白宫,特朗普发狠,下达了一项总统令

趣史微视频
2026-01-08 13:12:16
力压KD,阿夫迪亚24中13砍赛季新高41分&开拓者生涯首次40+

力压KD,阿夫迪亚24中13砍赛季新高41分&开拓者生涯首次40+

懂球帝
2026-01-08 14:04:19
天网恢恢!“电诈之王”陈志被捕并遣返中国

天网恢恢!“电诈之王”陈志被捕并遣返中国

冰川思想库
2026-01-08 00:06:16
被曝有私生女!成人女星携视频实锤锡安,网友:他比哈登还重口

被曝有私生女!成人女星携视频实锤锡安,网友:他比哈登还重口

听我说球
2026-01-08 08:47:49
姜文63岁晒肌肉照引热议!家里书房变健身房,书架上红彤彤全是奖

姜文63岁晒肌肉照引热议!家里书房变健身房,书架上红彤彤全是奖

娱圈小愚
2026-01-07 09:47:24
江苏朱氏家族:一门出12博士,却都为美国效力,最高官居能源部长

江苏朱氏家族:一门出12博士,却都为美国效力,最高官居能源部长

梦史
2025-12-25 16:04:43
不打不相识,张稀哲曾在亚冠联赛中放倒国安新帅蒙哥马利

不打不相识,张稀哲曾在亚冠联赛中放倒国安新帅蒙哥马利

懂球帝
2026-01-08 11:50:35
印尼求中国重组雅万高铁债务:运营两年盈利难 暴高铁商业化痛点

印尼求中国重组雅万高铁债务:运营两年盈利难 暴高铁商业化痛点

社会日日鲜
2026-01-07 12:07:02
印度大叔:上海贫穷又落后跟孟买没法比,谁知来参观之后不想走了

印度大叔:上海贫穷又落后跟孟买没法比,谁知来参观之后不想走了

天气观察站
2026-01-07 10:21:29
央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

一娱三分地
2025-12-04 17:00:33
上海有人雇佣“外籍家政服务员”,吃了大亏:珠宝首饰被盗走,自己也被罚了!

上海有人雇佣“外籍家政服务员”,吃了大亏:珠宝首饰被盗走,自己也被罚了!

上观新闻
2026-01-08 11:56:12
今日金价一夜突变!1月8日调整后,全国珠宝店,黄金最新售价

今日金价一夜突变!1月8日调整后,全国珠宝店,黄金最新售价

别人都叫我阿腈
2026-01-08 06:59:15
勇士复仇雄鹿!库里31+7+7梅尔顿5三分22分新高 字母哥空砍34+10

勇士复仇雄鹿!库里31+7+7梅尔顿5三分22分新高 字母哥空砍34+10

锅子篮球
2026-01-08 13:31:58
一年卖30万套商品房的成都楼市,也有点扛不住了

一年卖30万套商品房的成都楼市,也有点扛不住了

林子说事
2026-01-08 10:06:46
不到48小时,特朗普或下台,印度多500%关税,美国又抢千万石油

不到48小时,特朗普或下台,印度多500%关税,美国又抢千万石油

蓝色海边
2026-01-08 07:10:37
中国养老负担将越来越重:从4.7个劳动力养一个老人到1.9个劳动力供养1个老人

中国养老负担将越来越重:从4.7个劳动力养一个老人到1.9个劳动力供养1个老人

西虹市闲话
2026-01-08 13:51:18
燕麦立大功!研究发现:早餐常吃燕麦的人,不用太久,或有5好处

燕麦立大功!研究发现:早餐常吃燕麦的人,不用太久,或有5好处

小胡军事爱好
2025-11-28 09:45:23
美俄对峙,俄罗斯怂了,俄油轮被美军扣押

美俄对峙,俄罗斯怂了,俄油轮被美军扣押

山河路口
2026-01-08 12:19:03
华为Mate80突然官降:1月7日,惊喜大反转

华为Mate80突然官降:1月7日,惊喜大反转

科技堡垒
2026-01-07 12:46:59
英国证实参与美国北大西洋扣押油轮行动

英国证实参与美国北大西洋扣押油轮行动

澎湃新闻
2026-01-08 02:02:18
2026-01-08 14:23:00
烈史
烈史
千年中华史,烟尘映古道,岁月如歌,悠悠情未老。
1555文章数 56关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

委内瑞拉外长:感谢中方支持

头条要闻

委内瑞拉外长:感谢中方支持

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

房产
健康
手机
游戏
公开课

房产要闻

三亚新房,又全国第一了!

这些新疗法,让化疗不再那么痛苦

手机要闻

雷军:小米终端今年有望实现自研芯片、OS、AI大模型“大会师”

《生化4》碍事梨性感雕像:硅胶皮肤 丝滑头发

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版