网易首页 > 网易号 > 正文 申请入驻

突破AI记忆瓶颈,耶鲁博士新成果破解阅读失忆难题

0
分享至

当你阅读《红楼梦》《哈利·波特》《百年孤独》等长篇小说时,读着读着可能就忘记前面讲了什么,有时还会搞混人物关系。AI 在阅读长文章的时候也存在类似问题,当文章太长时它也会卡主,要么读得特别慢,要么记不住前面的内容。

为此,美国耶鲁大学博士生刘栋和合作者打造出一款名为 HSGM(Hierarchical Segment-Graph Memory)框架,它能快速、准确地理解超长文章。


图 | 刘栋(来源:刘栋)

在多个任务上的测试结果显示,HSGM 处理长文章的速度比传统方法快了 2 到 4 倍,原本需要 1 分钟的文章,现在只需 15-30 秒就能分析完。HSGM 需要的记忆空间更小,内存可以节省 60% 以上。

虽然 HSGM 使用了各种简化方法,但是它的准确率几乎没有下降,仍然能够达到最先进方法的 95% 以上。特别值得一提的是,当文章特别长比如有 2 万个词语时,HSGM 的优势反而更加明显,比传统方法快了 59 倍。


(来源:https://arxiv.org/html/2509.18168v1)

据了解,AI 在阅读的时候是把文字转换为它能够理解的数字代码,这个过程叫做编码。编码之后,AI 会尝试找出词语之间的关系,比如在 AI 阅读猫捉老鼠这个故事时,猫是捉的发起者,老鼠是被捉的对象。

这种理解方式叫做语义分析。计算机会把句子变成一张关系图,图中的点代表词语,线代表它们之间的关系。当文章很长时,这张图就会变得超级复杂,就像你把整本书的人物关系图画在一张纸上,密密麻麻的根本看不清楚。

HSGM 的聪明之处在于,不是像人类那样一口气读完整个长文,而是把整个文章切成几个段落块,每个块大约包含 256 个词语。这样,AI 就可以先集中精力理解一个小段落,而不用一下子面对整篇文章。

对于每个小段落,HSGM 都会画一张语义地图,记录这个词和那个词有什么关系,比如在“小明去公园散步”这个句子里,它会画出“小明-去-公园”和“去-散步”这样的关系。HSGM 不会记住每个段落的全部细节,而是为每个段落提取一个摘要节点,就像给每个章节写一段内容提要。

然后,它把这些摘要节点连接起来,形成一张全书概要图。这张图虽然简单,但是包含了整篇文章的精华。当有新内容加入的时候,HSGM 会为新内容画一张“小地图”,然后提取新内容的摘要,再将新摘要加入原来的全书概要图中。

这个过程叫做增量更新,让 HSGM 能够高效处理不断增长的内容,比如聊天记录和新闻推送等。

当你针对某一篇长文章向 HSGM 提问时,它不会在整篇文章中盲目地寻找答案,而是会首先进行快速定位,在全书概要图中寻找与问题最相关的几个摘要节点,就像人类通过图书目录找到相关章节一样。

找到相关段落之后,HSGM 会调出这些段落的详细小地图,在里面仔细寻找确切的答案。这种方法又快又准,就像有一个图书管理员,先帮你找到可能包含答案的书架,再从书中找出确切段落。


(来源:https://arxiv.org/html/2509.18168v1)

HSGM 的应用场景非常多:其一,可被用于智能问答系统。假如你想问 AI《红楼梦》中贾宝玉和林黛玉有多少次对话,它能快速找到答案;其二,可被用于长对话理解。

在客服系统中,HSGM 可以理解长时间的对话记录,根据历史问题准确把握客户的需求;其三,可被用于多跳推理。有些问题需要联系文章的不同部分才能回答。

比如“小明最初在哪里上学?后来转学到了哪里”,HSGM 的层次化记忆让其能够进行这种多跳推理;其四,可被用于生成自动摘要。

它可以在阅读长篇文章之后,自动生成简洁的摘要,帮助你快速了解文章大意;其五,可被用于法律文件分析。律师需要阅读大量的法律文书,HSGM 可以帮助他们快速找到相关案例和条款。


(来源:https://arxiv.org/html/2509.18168v1)

总之,HSGM 把记忆这件事明确拆解成短期上下文、中期工作记忆与长期语义摘要,并将它们对应地存放在 GPU 的高速显存、主机内存到 NVMe 这条层级链路上,按照重要性和时序动态迁移。这样一来,模型不只是“记得多”,而是“记得对、取得快、忘得巧”。

而在学术之外的产业实践方面,刘栋也是 FastLM.ai 的创始人。公司专注于大模型推理的高效基础设施,围绕缓存智能化、层次记忆管理与注意力加速构建产品线,其目前已经把这些思路做成了可交付的能力,正在推动“记忆感知”能力在规模化生产环境中的落地,来达成关于“更快、更省、更聪明”的 idea,把长序列推理从工程痛点变成可靠底座。

在未来,刘栋相信这些组件具备成为推理基础设施新的机器系统的潜力,其希望把长序列从“堆卡与碰运气”的问题,变成“可控、可解释、可扩展”的工程问题。

最后刘栋想补充两点。第一,长序列不是“更大的短序列”,长序列处理有几个主要的问题:注意力的距离衰减、语义的结构重复、信息的选择性保留与遗忘,这些规律决定了其需要做“记忆工程”,而不是简单通过短窗口把上下文无限放大(否则造成存储爆照)。

第二,Diffusion 的崛起让长视频与超高分辨率生成成为下一阶段的常态,没有记忆与注意力的重构,仅靠堆显存与堆带宽不可持续。其愿望是把计算“跑得快”变成“快且省、质量稳定且可解释”。

因此,他希望能够形成一套可落地、可复用、可演化的工程方法论,其目标是把 Memory‑Aware AI Infrastructure 继续打磨到可工业化的水准,提高机器学习系统的长序列处理效率和记忆能力。

参考资料:

https://arxiv.org/html/2509.18168v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
廖锡龙同志生平

廖锡龙同志生平

新京报政事儿
2026-01-30 08:26:37
黄岩岛爆发激烈对峙:轰6k穿行美菲演习区,海警船准星锁定菲船

黄岩岛爆发激烈对峙:轰6k穿行美菲演习区,海警船准星锁定菲船

头条爆料007
2026-01-31 16:00:58
江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

奇思妙想生活家
2026-01-31 14:53:58
国产自研伟哥上市:舌下含服,15分钟起效,不伤血管,中老年适用

国产自研伟哥上市:舌下含服,15分钟起效,不伤血管,中老年适用

番茄健康
2026-01-30 15:46:17
全球为啥没一个国家仿造歼-20,瑞典已破译!

全球为啥没一个国家仿造歼-20,瑞典已破译!

老范谈史
2026-01-30 20:28:17
神秘“华人”爆料,某岛上钱色交易不值一提,深层次的秘密才可怕

神秘“华人”爆料,某岛上钱色交易不值一提,深层次的秘密才可怕

林林故事揭秘
2024-12-25 12:24:41
国家终于出手了!不仅是李梓萌被牵连,就连全红婵宫鲁鸣也没逃过

国家终于出手了!不仅是李梓萌被牵连,就连全红婵宫鲁鸣也没逃过

小熊侃史
2026-02-01 07:20:10
Clawdbot进化速度离谱:突然开口说话,给自己捏脸,还能炒股砍价

Clawdbot进化速度离谱:突然开口说话,给自己捏脸,还能炒股砍价

DeepTech深科技
2026-01-29 18:14:10
四国领导人即将出发访华,中方已正式发送邀请函,三天后专机陆续抵达北京

四国领导人即将出发访华,中方已正式发送邀请函,三天后专机陆续抵达北京

一口娱乐
2026-01-31 16:19:10
走私快艇“大飞”到底有多猛?造价一百多万,拉冻品一周即可回本

走私快艇“大飞”到底有多猛?造价一百多万,拉冻品一周即可回本

介知
2026-01-31 18:05:48
离谱!挪威帝王蟹堆成山,中国人买一只却要花上千,原因太现实

离谱!挪威帝王蟹堆成山,中国人买一只却要花上千,原因太现实

李健政观察
2026-01-25 19:40:23
丈夫把我卡里632万全都转给小叔子,劝我说:一家人不分彼此

丈夫把我卡里632万全都转给小叔子,劝我说:一家人不分彼此

朝暮书屋
2026-01-07 17:33:13
你见过创业失败最惨的结果是什么样?网友评论区没有最惨只有更惨

你见过创业失败最惨的结果是什么样?网友评论区没有最惨只有更惨

夜深爱杂谈
2026-01-25 18:54:03
突发,利好不断!2月,这三个方向或进入超级大周期

突发,利好不断!2月,这三个方向或进入超级大周期

风风顺
2026-02-01 11:23:37
才24岁!女子后悔不已,隐私部位短短一年内长满……医生:早该重视了!

才24岁!女子后悔不已,隐私部位短短一年内长满……医生:早该重视了!

福建卫生报
2026-01-07 12:32:45
周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

春江财富
2026-02-01 09:46:38
日本开始发放补贴!最高可领30000日元,在日外国人别错过!

日本开始发放补贴!最高可领30000日元,在日外国人别错过!

东京在线
2026-01-31 20:58:32
高校事业编,没了

高校事业编,没了

山东教育
2026-01-31 19:34:04
清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

来科点谱
2026-01-29 09:00:27
你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

解读热点事件
2025-11-08 17:33:23
2026-02-01 12:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16205文章数 514574关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

女子退150多元大衣时不慎寄走奔驰钥匙:配一把6000元

头条要闻

女子退150多元大衣时不慎寄走奔驰钥匙:配一把6000元

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

房产
数码
手机
亲子
游戏

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

数码要闻

博西家电重构新年俗,让团圆不再被家务“捆绑”

手机要闻

荣耀扬威欧洲市场,这一成就国产无人能敌

亲子要闻

网友建议,一定不要和孕妇出去吃饭逛街,背后让人细思极恐

《仙剑奇侠传四:重制版》最新消息公布!线下见

无障碍浏览 进入关怀版