网易首页 > 网易号 > 正文 申请入驻

真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本!

MIT CSAIL研究团队提出了一种叫做递归语言模型RLM的长文本处理新方法,来解决上下文腐烂问题。

不修改模型架构、不升级模块设计,但能让GPT-5、Qwen-3这类顶尖模型推理层具备千万级token的超长文本处理能力。



核心思路是不把提示词直接塞进大模型的上下文窗口,而把它“外包”给可交互的Python环境,让模型主动通过自动编程和递归调用拆解任务、按需处理。

啊?大模型读上下文也能递归操作?

上下文窗口不够,仍能推理

先说上下文腐烂这个扎心的问题。

不管大模型宣称自己的上下文窗口有多大,它们处理超长文本时,都会遇到文本越长,模型对早期信息的记忆越模糊,推理性能直线下滑的问题。

这就像我们读百万字小说,读到后半段,早就忘了前半段的关键情节。



现在主流的解决办法有上下文压缩、检索增强生成RAG,或者对模型进行架构级优化

比如,GPT-5.2-Codex采用的就是窗口内的原生上下文压缩技术,在持续数周的大型代码仓库协助任务中保持全上下文信息。

同时,GPT系列、Claude、Qwen等企业级版本原生集成RAG功能也是行业共识。

而架构级优化的例子,有社区普遍猜测的Gemini 3的环形注意力等。

现在的RLM和这些直接在模型上“硬磕”的方法不同,它把上下文处理给“外包”了



RLM给模型搭了一个可交互的Python编程环境REPL

开始处理上下文前,它先启动Python REPL交互式编程环境,将超长提示词作为字符串变量存入环境;

接着模型像程序员一样编写代码,对文本变量进行关键词筛选、局部探查、逻辑拆分等操作,通过「编写代码-观察结果」的交互循环减少无效信息摄入;

随后模型将复杂任务拆解为若干子任务,递归调用自身或轻量化子模型处理拆分后的文本片段,所有子任务输出均存储为新变量回流到REPL环境;

最后主模型编写代码读取并整合所有子任务结果变量,进行逻辑拼接或语义处理,形成最终输出。

全程由模型自主决策,实现按需处理,彻底解耦输入文本长度与模型上下文窗口的绑定。



实验显示,RLM有效处理规模已突破千万级Token,超过GPT-5等前沿模型原生上下文窗口的两个数量级。

在复杂长文本任务中,RLM的优势也比较显著。面对要求聚合成对信息、复杂度呈二次方增长的OOLONG-Pairs任务,基础GPT-5和Qwen3-Coder的 F1分数不足0.1%;

采用RLM方案后,两款模型分别取得58.00%和23.11%的F1分数。

在600万至1100万Token规模的BrowseComp-Plus(1K)多文档推理任务中,RLM(GPT-5)的正确率高达91.33%,大幅超越其他长文本处理方案;

即便在要求线性扫描并处理几乎所有信息的OOLONG任务中,RLM也实现了双位数的性能提升。



从调用成本上看,在50分位数这个指标上,RLM的成本和其他长文本处理方案处于同一水平,甚至更低。

这说明在大多数常规任务场景中,RLM的性价比是很有优势的。

但到了95分位数这类高百分位区间时,RLM的成本会出现明显飙升。

主要是因为RLM的推理过程是动态的,会根据任务复杂度自主决定代码编写、文本拆分和递归调用的次数,额外的步骤会增加API调用次数。



最后再划个小重点,RLM是一种不碰模型架构的通用推理策略,也就是说,理论上任何模型都能直接上车。

论文地址:https://arxiv.org/abs/2512.24601
参考链接:https://x.com/MatthewBerman/status/2012701592756383893


— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别想歪!这幅人体油画靠“光”就能让你呼吸放缓?答案藏在薄纱里

别想歪!这幅人体油画靠“光”就能让你呼吸放缓?答案藏在薄纱里

陈洪标写字说画
2026-01-27 22:31:02
国际奥委会:当年北京奥运的标准太高了!但悉尼靠贿赂抢走主办权

国际奥委会:当年北京奥运的标准太高了!但悉尼靠贿赂抢走主办权

墨兰史书
2026-01-14 13:25:03
农业银行原首席专家兼浙江省分行原党委书记、行长冯建龙被开除党籍

农业银行原首席专家兼浙江省分行原党委书记、行长冯建龙被开除党籍

每日经济新闻
2026-01-28 20:59:07
CCTV5直播!上海VS深圳复仇之战,超级外援强强对决,卢伟拒爆冷

CCTV5直播!上海VS深圳复仇之战,超级外援强强对决,卢伟拒爆冷

老叶评球
2026-01-28 22:39:29
76岁上海知青回江西访友,竟发现当年的女友终生未嫁:我对不住你

76岁上海知青回江西访友,竟发现当年的女友终生未嫁:我对不住你

五元讲堂
2026-01-19 11:13:16
破案了!U23国足王牌王钰栋留洋悬念尘埃落定,没想到东体这样说

破案了!U23国足王牌王钰栋留洋悬念尘埃落定,没想到东体这样说

曹说体育
2026-01-28 15:39:57
刚刚!史上最大IPO,突传大消息!

刚刚!史上最大IPO,突传大消息!

证券时报
2026-01-28 23:15:08
半导体行业并购潮起,这3家被低估的设计公司或成巨头猎物!

半导体行业并购潮起,这3家被低估的设计公司或成巨头猎物!

小白鸽财经
2026-01-27 20:30:03
早已杀青却播出无望的7部剧,部部可惜,尤其是最后一部

早已杀青却播出无望的7部剧,部部可惜,尤其是最后一部

小Q侃电影
2026-01-25 13:16:28
斯诺克比赛结果:周跃龙不敌老将,斯佳辉晋级5-4

斯诺克比赛结果:周跃龙不敌老将,斯佳辉晋级5-4

王稱吃吃喝喝
2026-01-29 01:38:21
特朗普盛气凌人,却突然发现:美国的王牌关税,对中国已不起作用

特朗普盛气凌人,却突然发现:美国的王牌关税,对中国已不起作用

人类的关注
2026-01-28 23:57:00
美军集结,敢打伊朗?特朗普若动手,就是政治生涯的“战略自杀”

美军集结,敢打伊朗?特朗普若动手,就是政治生涯的“战略自杀”

老黯谈娱
2026-01-28 18:08:48
特朗普还是大意了,刚腾出手要干伊朗,回头发现委内瑞拉失控了?

特朗普还是大意了,刚腾出手要干伊朗,回头发现委内瑞拉失控了?

人生何尝不是酒
2026-01-29 04:27:40
征服中年女人,无需套路:两颗真心,一生相守

征服中年女人,无需套路:两颗真心,一生相守

青苹果sht
2025-11-04 06:10:40
市交通委权威发布,上海出租汽车最新测评结果:巡游出租汽车行业乘客满意度指数为83.12,处于满意与较满意之间

市交通委权威发布,上海出租汽车最新测评结果:巡游出租汽车行业乘客满意度指数为83.12,处于满意与较满意之间

纵相新闻
2026-01-28 22:53:14
救救美国的中产吧,他们都快要饿死了!

救救美国的中产吧,他们都快要饿死了!

走读新生
2026-01-27 21:49:52
辽宁男篮拒绝爆冷!全力击败CBA黑马,乌戈渐入佳境,央视直播

辽宁男篮拒绝爆冷!全力击败CBA黑马,乌戈渐入佳境,央视直播

体坛瞎白话
2026-01-28 09:42:10
范子铭拿0分,没想到赛后徐利民的发言让球迷怒了,技战术有问题

范子铭拿0分,没想到赛后徐利民的发言让球迷怒了,技战术有问题

徐扙老表哥
2026-01-29 00:18:10
输掉榜首位置!轰全队最高分也回天乏术,杨力维尽力了

输掉榜首位置!轰全队最高分也回天乏术,杨力维尽力了

德译洋洋
2026-01-28 12:29:43
伊朗已被包围,美军开战在即,哈梅内伊进地堡,中方要做最坏打算

伊朗已被包围,美军开战在即,哈梅内伊进地堡,中方要做最坏打算

舍长阿爷谈事
2026-01-29 04:12:34
2026-01-29 05:52:49
量子位 incentive-icons
量子位
追踪人工智能动态
12078文章数 176367关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

头条要闻

中国代表:支持伊朗国家稳定 武力解决不了问题

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

本地
数码
教育
时尚
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

数码要闻

荣耀平板新春版本今启推送,升级计划公布

教育要闻

2026届志愿填报干货!这些专业公认难学易熬夜,普通考生慎选

想年前用3周“刷新”好状态?做第一点就够

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版