网易首页 > 网易号 > 正文 申请入驻

突破AI记忆瓶颈,耶鲁博士新成果破解阅读失忆难题

0
分享至

当你阅读《红楼梦》《哈利·波特》《百年孤独》等长篇小说时,读着读着可能就忘记前面讲了什么,有时还会搞混人物关系。AI 在阅读长文章的时候也存在类似问题,当文章太长时它也会卡主,要么读得特别慢,要么记不住前面的内容。

为此,美国耶鲁大学博士生刘栋和合作者打造出一款名为 HSGM(Hierarchical Segment-Graph Memory)框架,它能快速、准确地理解超长文章。

在多个任务上的测试结果显示,HSGM 处理长文章的速度比传统方法快了 2 到 4 倍,原本需要 1 分钟的文章,现在只需 15-30 秒就能分析完。HSGM 需要的记忆空间更小,内存可以节省 60% 以上。

虽然 HSGM 使用了各种简化方法,但是它的准确率几乎没有下降,仍然能够达到最先进方法的 95% 以上。特别值得一提的是,当文章特别长比如有 2 万个词语时,HSGM 的优势反而更加明显,比传统方法快了 59 倍。

据了解,AI 在阅读的时候是把文字转换为它能够理解的数字代码,这个过程叫做编码。编码之后,AI 会尝试找出词语之间的关系,比如在 AI 阅读猫捉老鼠这个故事时,猫是捉的发起者,老鼠是被捉的对象。

这种理解方式叫做语义分析。计算机会把句子变成一张关系图,图中的点代表词语,线代表它们之间的关系。当文章很长时,这张图就会变得超级复杂,就像你把整本书的人物关系图画在一张纸上,密密麻麻的根本看不清楚。

HSGM 的聪明之处在于,不是像人类那样一口气读完整个长文,而是把整个文章切成几个段落块,每个块大约包含 256 个词语。这样,AI 就可以先集中精力理解一个小段落,而不用一下子面对整篇文章。

对于每个小段落,HSGM 都会画一张语义地图,记录这个词和那个词有什么关系,比如在“小明去公园散步”这个句子里,它会画出“小明-去-公园”和“去-散步”这样的关系。HSGM 不会记住每个段落的全部细节,而是为每个段落提取一个摘要节点,就像给每个章节写一段内容提要。

然后,它把这些摘要节点连接起来,形成一张全书概要图。这张图虽然简单,但是包含了整篇文章的精华。当有新内容加入的时候,HSGM 会为新内容画一张“小地图”,然后提取新内容的摘要,再将新摘要加入原来的全书概要图中。

这个过程叫做增量更新,让 HSGM 能够高效处理不断增长的内容,比如聊天记录和新闻推送等。

当你针对某一篇长文章向 HSGM 提问时,它不会在整篇文章中盲目地寻找答案,而是会首先进行快速定位,在全书概要图中寻找与问题最相关的几个摘要节点,就像人类通过图书目录找到相关章节一样。

找到相关段落之后,HSGM 会调出这些段落的详细小地图,在里面仔细寻找确切的答案。这种方法又快又准,就像有一个图书管理员,先帮你找到可能包含答案的书架,再从书中找出确切段落。

HSGM 的应用场景非常多:其一,可被用于智能问答系统。假如你想问 AI《红楼梦》中贾宝玉和林黛玉有多少次对话,它能快速找到答案;其二,可被用于长对话理解。

在客服系统中,HSGM 可以理解长时间的对话记录,根据历史问题准确把握客户的需求;其三,可被用于多跳推理。有些问题需要联系文章的不同部分才能回答。

比如“小明最初在哪里上学?后来转学到了哪里”,HSGM 的层次化记忆让其能够进行这种多跳推理;其四,可被用于生成自动摘要。

它可以在阅读长篇文章之后,自动生成简洁的摘要,帮助你快速了解文章大意;其五,可被用于法律文件分析。律师需要阅读大量的法律文书,HSGM 可以帮助他们快速找到相关案例和条款。

总之,HSGM 把记忆这件事明确拆解成短期上下文、中期工作记忆与长期语义摘要,并将它们对应地存放在 GPU 的高速显存、主机内存到 NVMe 这条层级链路上,按照重要性和时序动态迁移。这样一来,模型不只是“记得多”,而是“记得对、取得快、忘得巧”。

而在学术之外的产业实践方面,刘栋也是 FastLM.ai 的创始人。公司专注于大模型推理的高效基础设施,围绕缓存智能化、层次记忆管理与注意力加速构建产品线,其目前已经把这些思路做成了可交付的能力,正在推动“记忆感知”能力在规模化生产环境中的落地,来达成关于“更快、更省、更聪明”的 idea,把长序列推理从工程痛点变成可靠底座。

在未来,刘栋相信这些组件具备成为推理基础设施新的机器系统的潜力,其希望把长序列从“堆卡与碰运气”的问题,变成“可控、可解释、可扩展”的工程问题。

最后刘栋想补充两点。第一,长序列不是“更大的短序列”,长序列处理有几个主要的问题:注意力的距离衰减、语义的结构重复、信息的选择性保留与遗忘,这些规律决定了其需要做“记忆工程”,而不是简单通过短窗口把上下文无限放大(否则造成存储爆照)。

第二,Diffusion 的崛起让长视频与超高分辨率生成成为下一阶段的常态,没有记忆与注意力的重构,仅靠堆显存与堆带宽不可持续。其愿望是把计算“跑得快”变成“快且省、质量稳定且可解释”。

因此,他希望能够形成一套可落地、可复用、可演化的工程方法论,其目标是把 Memory‑Aware AI Infrastructure 继续打磨到可工业化的水准,提高机器学习系统的长序列处理效率和记忆能力。

参考资料:

https://arxiv.org/html/2509.18168v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2.6万名中国学生用AI写作业30个月后,成绩单惊现恐怖倒挂:考试分数暴跌24%

2.6万名中国学生用AI写作业30个月后,成绩单惊现恐怖倒挂:考试分数暴跌24%

紫京讲谈
2026-06-24 14:45:29
中国第一美国第二!美国人承认中国领导力超美国

中国第一美国第二!美国人承认中国领导力超美国

看看新闻Knews
2026-06-26 16:31:52
男子20多年前考入大学后不满专业任性辍学,与家人从此断联,近日在山林中被浙江民警发现,家属们驱车千里赶来重逢,民警:好好陪伴亲人

男子20多年前考入大学后不满专业任性辍学,与家人从此断联,近日在山林中被浙江民警发现,家属们驱车千里赶来重逢,民警:好好陪伴亲人

极目新闻
2026-06-26 10:05:21
安徽少女溺亡后续!母亲控诉救援队,当地霸气反击,网友:真活该

安徽少女溺亡后续!母亲控诉救援队,当地霸气反击,网友:真活该

哄动一时啊
2026-06-26 16:42:24
第31届白玉兰奖公布:杨紫凭《生命树》获最佳女主角,于和伟凭《沉默的荣耀》获最佳男主角;迟蓬、董勇分获最佳女配、男配

第31届白玉兰奖公布:杨紫凭《生命树》获最佳女主角,于和伟凭《沉默的荣耀》获最佳男主角;迟蓬、董勇分获最佳女配、男配

大风新闻
2026-06-26 22:39:18
比独行侠送出东契奇更离谱,球迷:见过蠢的,没见过如此蠢的!

比独行侠送出东契奇更离谱,球迷:见过蠢的,没见过如此蠢的!

我就是一个说球的
2026-06-26 21:18:54
《人民日报》罕见发文,对谢娜巡演明确定性:无实力收割流量!

《人民日报》罕见发文,对谢娜巡演明确定性:无实力收割流量!

观察鉴娱
2026-06-26 11:24:40
中国菲律宾在黄岩岛发生武装对峙

中国菲律宾在黄岩岛发生武装对峙

凤眼论
2026-06-25 18:45:27
原来张一山当初没说谎,看了外媒镜头才发现,杨紫的面相早就变了

原来张一山当初没说谎,看了外媒镜头才发现,杨紫的面相早就变了

洲洲影视娱评
2026-06-25 14:44:51
4-0,0-0!世界杯疯狂一夜:14分钟三球18岁小将超越梅西

4-0,0-0!世界杯疯狂一夜:14分钟三球18岁小将超越梅西

星娱叨叨社
2026-06-26 15:27:29
王忠林,新职明确

王忠林,新职明确

新京报
2026-06-26 19:46:14
A股惊现极端一幕!1653只个股创新低,187只创历史新高,钱去哪了

A股惊现极端一幕!1653只个股创新低,187只创历史新高,钱去哪了

近史谈
2026-06-26 17:43:20
世界杯1天6战!韩国祈祷3队帮忙:若全部达成 韩国躺着出线

世界杯1天6战!韩国祈祷3队帮忙:若全部达成 韩国躺着出线

叶青足球世界
2026-06-26 20:20:55
奔驰新车官宣:7月8日,正式上市

奔驰新车官宣:7月8日,正式上市

科技堡垒
2026-06-26 11:27:42
她就是世界杯上走红,五官完美的雅利安(波斯)美女球迷!

她就是世界杯上走红,五官完美的雅利安(波斯)美女球迷!

吃瓜党二号头目
2026-06-26 09:09:48
女子在溪谷中玩水身体被卡石缝不幸身亡,多人下水施救险被急流冲走,应急部门回应

女子在溪谷中玩水身体被卡石缝不幸身亡,多人下水施救险被急流冲走,应急部门回应

极目新闻
2026-06-26 19:07:30
稀土归零5个月,光刻胶暴跌95%:中日互相卡脖子,谁先扛不住?

稀土归零5个月,光刻胶暴跌95%:中日互相卡脖子,谁先扛不住?

小陆搞笑日常
2026-06-26 03:38:03
谷歌干了一件地震局都没干成的事:在地震中救了委内瑞拉几万人的命

谷歌干了一件地震局都没干成的事:在地震中救了委内瑞拉几万人的命

知识圈
2026-06-26 13:15:11
闲着没事,你抓什么特务,吃饱了撑的!

闲着没事,你抓什么特务,吃饱了撑的!

雨秋闲话
2026-06-26 11:28:46
专访扛钢管的单亲妈妈:用肩膀扛出四川历史类前5名,却说“女儿不恨我就好”丨封面头条

专访扛钢管的单亲妈妈:用肩膀扛出四川历史类前5名,却说“女儿不恨我就好”丨封面头条

封面新闻
2026-06-26 21:09:14
2026-06-26 23:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16886文章数 515054关注度
往期回顾 全部

科技要闻

拿了500亿的梁文锋,只挖地基,不信销售

头条要闻

女儿成绩被屏蔽 扛钢管的单亲妈妈却说"她不恨我就好"

头条要闻

女儿成绩被屏蔽 扛钢管的单亲妈妈却说"她不恨我就好"

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

"索具龙头"领大额罚单

汽车要闻

11.99万起 捷途自由者7 PLUS/山海T1四驱版上市

态度原创

亲子
家居
数码
本地
军事航空

亲子要闻

【欧美儿童节】呆眼好久不见...别来无恙

家居要闻

绿意盎然 自然之境

数码要闻

宏碁推出“PE270XT”27英寸显示器,4999元

本地新闻

世界杯球迷节:比球赛更好玩的派对

军事要闻

伊朗:驶离指定航线船舶不享有安全保障

无障碍浏览 进入关怀版