网易首页 > 网易号 > 正文 申请入驻

MIT 新发现 超越上下文限制:长程推理中的潜意识线索

0
分享至

来源:AIGC深一度

❝ Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning 作者: Hongyin Luo, Nathaniel Morgan, Tina Li, Derek Zhao, Ai Vy Ngo, Philip Schroeder, Lijie Yang, Assaf Ben-Kish, Jack O'Brien, James Glass

MIT CSAIL团队提出的Subconscious Threads技术通过树状推理结构和动态KV缓存管理,成功突破了传统Transformer架构的上下文限制,为长时序推理任务提供了全新解决方案这项技术不仅解决了大语言模型(LLM)在处理超长文本时的显存瓶颈问题,更通过子任务剪枝机制实现了近乎无限的工作记忆容量,使模型能够处理复杂多跳推理任务,如百万级token3的文本生成、跨模态长时序分析等。在AIGC领域,ST技术为内容创作提供了更强大的上下文理解能力,使AI能够创作出连贯性更强、逻辑性更复杂的数字内容,推动AIGC技术从"模型为先"向"应用为王"的转变。

Subconscious Threads(ST)技术的核心在于其创新的推理架构——线程推理模型(Threaded Inference Model,TIM)和配套的推理运行时环境(TIMRUN)。与传统Transformer的线性序列处理方式不同,TIM将自然语言建模为具有长度和深度维度的推理树结构,每个树节点代表一个子任务或推理步骤这种树状结构允许模型像人类思考一样,将复杂任务分解为多个并行或串行的子线程(Subconscious Threads),每个子线程仅处理局部上下文,全局信息通过层级路径传递,而非线性存储。

ST技术的实现原理主要包含三个关键模块:

推理树构建模型首先将输入任务分解为多个子任务,形成树状结构。例如,处理一篇百万字的小说时,模型会将故事主线分解为人物发展、情节推进、环境描写等多个子线程,每个子线程独立处理其相关的内容,同时通过层级路径与主任务保持关联。

动态KV缓存管理TIMRUN运行时环境通过动态剪枝和量化技术(如2bit非对称量化)压缩KV缓存,仅保留关键Token的键值状态 。这种管理机制使显存占用从传统Transformer的线性增长(如处理10k tokens需5GB显存)变为与任务复杂度相关,而非序列长度相关,显存占用可降至传统方法的1/3甚至更低。

子任务剪枝机制基于规则或重要性评分,系统会动态剔除低效的推理路径,例如在生成小说时,若某个人物线程长期未被激活,系统会自动剪枝该线程,释放显存资源 。这种机制使模型能够处理近乎无限的工作记忆容量,支持多跳工具调用和复杂递归推理。

二、突破传统上下文限制的技术路径

ST技术之所以能够突破传统上下文限制,主要源于其在以下几个方面的创新:

架构层面的突破传统Transformer架构将文本视为线性序列,导致KV缓存随序列长度线性增长 。例如,处理100k tokens的上下文时,传统模型需要约50GB显存,而ST的树状结构通过层级化节点组织信息,天然适合分解复杂任务为多分支子任务,避免线性序列的长度累积。每个节点仅维护局部上下文,全局信息通过层级路径传递,显存占用显著降低。

KV缓存优化ST采用动态剪枝和量化技术压缩KV缓存 。具体来说,TIMRUN运行时通过基于规则的子任务剪枝机制,动态维护工作记忆,仅保留最相关上下文Token的键-值状态。实验表明,即使在GPU显存中管理高达90%的键-值缓存时,ST系统仍能保持高推理吞吐量 。这种优化策略使ST能够处理超长序列,如百万级token的文本生成,而不会因显存不足而崩溃。

位置编码改进传统Transformer的位置编码(如RoPE)存在外推瓶颈,当处理超过训练序列长度的文本时,位置信息会出现偏移误差 。ST可能采用RoPE的改进方案,通过调整旋转矩阵的基(base)参数或引入分层位置编码,解决长序列外推问题。此外,树状结构的层级路径可替代线性位置编码,动态传递位置关系,避免传统方法的位置偏移误差。

与现有技术的对比

技术

上下文处理方式

显存占用

长序列能力

适用场景

Transformer

线性序列,KV缓存随长度线性增长

高(10k tokens需5GB)

有限(通常<32k tokens)

简单任务,短文本生成

MoE模型

稀疏专家激活,降低计算成本

中(如Hunyuan-A13B支持256K上下文)

较好(依赖专家分配策略)

中等复杂度任务,长文本生成

Subconscious Threads

树状推理结构,动态KV缓存管理

低(与任务复杂度相关)

几乎无限(实测超100k tokens)

复杂多跳推理,超长文本生成

ST技术在实验中的表现令人印象深刻在数学推理任务中,ST模型处理超过100k tokens的上下文时,推理吞吐量仍保持稳定,显存占用仅为传统方法的10% 。此外,在复杂多跳推理任务(如"追踪某专利分类与早期合作者的关系")中,ST模型表现出显著优势,能够像人类一样在网络环境中主动感知、决策和行动,实现自主信息检索和多步推理 。

三、Subconscious Threads在AIGC领域的应用场景

ST技术在AIGC领域具有广泛的应用前景,主要体现在以下几个方面:

超长文本生成传统LLM因上下文窗口限制,难以生成连贯的长篇内容(如百万字小说、剧本或长报告)。ST的树状结构可将叙事分解为多分支子任务(如人物发展、情节推进、环境描写等),动态管理上下文,确保长篇内容的连贯性和逻辑性 。例如,生成百万字小说时,ST模型能够同时维护多个角色线程,确保每个角色的发展轨迹合理且相互关联。

复杂多步创意任务如广告策划、游戏剧情设计等需要多步骤推理的场景,ST模型可通过并行处理多个子线程,动态调整生成路径以优化结果 。例如,广告策划需要分析用户长历史行为、竞品动态和市场趋势,ST可并行处理这些多维度信息,生成更具创意和针对性的广告方案。

跨模态长时序生成ST技术可应用于结合文本、图像、视频等模态的复杂内容创作。例如,生成结合历史数据与实时视频的动态广告,或处理科研文档中的跨模态数据(文本+图表+实验数据) 。这种能力使AIGC内容更加丰富和多元化。

个性化内容定制ST模型能够分析用户长历史交互数据(如20万字对话记录),生成更精准的推荐或定制化内容 。例如,在虚拟数字人应用中,ST模型可长期记忆用户的偏好和习惯,提供更加个性化和连贯的交互体验。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今夏火了一条:“白裤子”,这样搭才高级又洋气,超好看!

今夏火了一条:“白裤子”,这样搭才高级又洋气,超好看!

何有强
2026-05-10 22:13:02
不服就干!杀叛徒,打美军无人机,2架F-35紧急降落,伊朗接着打

不服就干!杀叛徒,打美军无人机,2架F-35紧急降落,伊朗接着打

知法而形
2026-05-11 19:26:45
株洲26岁女士征婚!要求男方独生子、存款200万以上,称有前任9名

株洲26岁女士征婚!要求男方独生子、存款200万以上,称有前任9名

火山詩话
2026-05-11 13:50:23
入狱43天撕破蓝营遮羞布!蔡正元隐忍发声,马英九终酿大错

入狱43天撕破蓝营遮羞布!蔡正元隐忍发声,马英九终酿大错

爱看剧的阿峰
2026-05-10 20:00:34
四年食品学位,毕业后同宿舍四人竟无一人在食品行业!江南大学的真实现状

四年食品学位,毕业后同宿舍四人竟无一人在食品行业!江南大学的真实现状

户外阿毽
2026-04-27 08:31:47
孙颖莎逆转日本名将后,谁注意到日本教练的一个动作,耐人寻味

孙颖莎逆转日本名将后,谁注意到日本教练的一个动作,耐人寻味

丁丁鲤史纪
2026-05-11 16:21:08
特朗普举着孩子照片,对哭泣的母亲承诺:我相信中国会执行死刑的

特朗普举着孩子照片,对哭泣的母亲承诺:我相信中国会执行死刑的

博览历史
2025-07-21 17:59:30
49岁李小冉素颜曝光,皱纹眼袋拒绝打针,白到发光松弛感十足

49岁李小冉素颜曝光,皱纹眼袋拒绝打针,白到发光松弛感十足

喜欢历史的阿繁
2026-05-11 10:45:56
疑遭日本主帅批评!张本智和:不能全怪我 2年后看我在日本咋复仇

疑遭日本主帅批评!张本智和:不能全怪我 2年后看我在日本咋复仇

风过乡
2026-05-11 12:49:51
八路军最惨痛一战,看完牺牲高级将领名单,主席:取消政委决定权

八路军最惨痛一战,看完牺牲高级将领名单,主席:取消政委决定权

马捗在解说
2026-05-08 14:50:30
林诗栋抢王楚钦风头!险被逆转却跳球桌狂欢,把自己演成关键英雄

林诗栋抢王楚钦风头!险被逆转却跳球桌狂欢,把自己演成关键英雄

三十年莱斯特城球迷
2026-05-11 01:58:15
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
奇才会选迪班萨为状元? 从球队需求看2026年选秀前三甲怎么排?

奇才会选迪班萨为状元? 从球队需求看2026年选秀前三甲怎么排?

仰卧撑FTUer
2026-05-11 09:18:06
女足亚洲杯太残酷了:随着日本1-0,2大劲旅已经被送回家

女足亚洲杯太残酷了:随着日本1-0,2大劲旅已经被送回家

俯身冲顶
2026-05-11 17:03:48
脱离实际的报价遭冷遇,世界杯中国转播费从3亿美元腰斩到1.5亿美元;多国转播权的不明朗形势陷入罕见僵局

脱离实际的报价遭冷遇,世界杯中国转播费从3亿美元腰斩到1.5亿美元;多国转播权的不明朗形势陷入罕见僵局

大风新闻
2026-05-10 15:28:26
西红柿被点名!医生:吃得越多,糖尿病患者寿命或越短?真的吗?

西红柿被点名!医生:吃得越多,糖尿病患者寿命或越短?真的吗?

健身狂人
2026-05-11 20:01:48
WNBA:韩旭4+5拼到6犯毕业 自由人加时险胜神秘人获2连胜

WNBA:韩旭4+5拼到6犯毕业 自由人加时险胜神秘人获2连胜

醉卧浮生
2026-05-11 05:50:15
老白干酒董事长突然放弃连任,已掌舵10余年,去年营收创上市以来最大跌幅

老白干酒董事长突然放弃连任,已掌舵10余年,去年营收创上市以来最大跌幅

红星新闻
2026-05-11 20:59:10
蚕豆被点名!医生发现:吃得越多,血糖高患者寿命或越短?真的吗

蚕豆被点名!医生发现:吃得越多,血糖高患者寿命或越短?真的吗

路医生健康科普
2026-05-11 17:37:44
湖南农村学霸高考只考239,班主任不相信查监控,看到真相他哭了

湖南农村学霸高考只考239,班主任不相信查监控,看到真相他哭了

二十一号故事铺
2024-09-28 06:30:02
2026-05-11 22:19:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4727文章数 37463关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

手机
旅游
游戏
本地
公开课

手机要闻

姜超吐槽手机圈果味太重:红魔11S Pro透明机身跑水冷 业内独一份

旅游要闻

枣庄台儿庄千年运河夕照美湿地鹭鸣入暮来

《天国拯救2》编剧、首席关卡设计师跳槽《巫师4》

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版