网易首页 > 网易号 > 正文 申请入驻

Google发布新模型融合长短期记忆与注意力机制,突破Token限制

0
分享至

Google研究院发布了一项称为Titans模型架构的突破性研究,集成了短期记忆、长期记忆与注意力机制,突破现有生成式人工智能上下文处理瓶颈,支持超过200万Token的上下文长度,对语言建模与长串行生成任务带来显著改进。 Google计划将Titans的相关技术开源,这将加速长上下文生成技术在学术与产业领域的发展,并推动相关应用的创新。

目前生成式人工智能模型,例如Transformer及其衍生模型,虽然在多数应用领域表现出色,但其上下文窗口(Window)长度的限制,通常仅为几千到几万个Token,这使其在处理长文本、多轮对话或需要大规模上下文记忆的应用中,可能无法保持语义连贯性与资讯准确性。Google的Titans架构通过引入深度神经长期记忆模块(Neural Long-Term Memory Module),有效解决了这个挑战,能在更长的上下文中保持高效且精确的推理能力。

研究团队表示Titans的设计灵感来自于人类记忆系统,结合短期记忆的快速回应与长期记忆的持久特性,并通过注意力机制专注于当前上下文。传统Transformer模型因为需要计算所有Token之间的配对相关性,所以计算成本随上下文长度平方增加,而Titans则借由深层化与非线性化的记忆模块设计,以及遗忘机制等技术,大幅提升记忆管理效率。

Titans具有三种架构设计变体,分别是Memory as a Context(MAC)、Memory as a Gate(MAG)和Memory as a Layer(MAL),针对不同的任务需求来集成短期与长期记忆。MAC将长期记忆作为上下文的一部分,让注意力机制能够动态结合历史资讯与当前数据,适合需要处理详细历史上下文的任务。而MAG则会根据任务需求,调整即时数据与历史资讯的重要性比例,专注于当前最相关的资讯。

MAL则是将记忆模块设计为深度网络的一层,压缩过去与当前上下文,然后交由注意力模块处理,具备较高效率,但整体表现可能略受限制。与传统Transformers相比,Titans结合了多层次记忆模块与动态记忆更新能力,不仅突破了上下文长度的限制,还能在测试阶段持续学习,显著提升推理能力与适应性。

在语言建模、常识推论、时间串行分析及基因数据建模等多个领域,Titans展示远超过现有基准模型的性能,特别是在超长串行处理方面的表现。在实验中,Titans架构在长串行处理任务中的表现,明显优于现有模型。无论是语言建模还是时间串行预测,Titans在准确性与效率都展现了压倒性优势,甚至在部分场景中超越如GPT-4等具有数十倍参数的超大型生成式模型。

除了Google在生成式首席人工智能官上下文的研究突破之外,中国人工智能公司MiniMax推出的MiniMax-01系列模型,也主打其超长上下文处理和多模态理解能力,其最新的MiniMax-Text-01模型支持长达400万Token的上下文处理能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚从日本回来,说点不中听的:日本的真实面目,可能让你很意外

刚从日本回来,说点不中听的:日本的真实面目,可能让你很意外

复转这些年
2026-04-01 09:17:19
尤文花3.3M租来"饮水机管理员",4000万买断条款已自动触发

尤文花3.3M租来"饮水机管理员",4000万买断条款已自动触发

热血体育社
2026-04-13 18:19:08
射程涵盖中国,导弹周边全是学校,美方提醒日本:中方还没动真格

射程涵盖中国,导弹周边全是学校,美方提醒日本:中方还没动真格

杰丝聊古今
2026-04-06 09:39:14
军事 | 巴基斯坦空军经略中东?印度怎么看?

军事 | 巴基斯坦空军经略中东?印度怎么看?

新民周刊
2026-04-13 09:06:40
美军称将对伊朗港口海上交通实施封锁,天然气、原油跳空暴涨

美军称将对伊朗港口海上交通实施封锁,天然气、原油跳空暴涨

东方豪侠
2026-04-13 08:17:42
阿联酋王储刚到中国,特朗普送来神助攻,海湾国家只剩下一个选择

阿联酋王储刚到中国,特朗普送来神助攻,海湾国家只剩下一个选择

动漫里的童话
2026-04-13 20:49:04
40岁李小萌官宣怀三胎,住北京三层豪宅开劳斯莱斯,嫁对人太爽

40岁李小萌官宣怀三胎,住北京三层豪宅开劳斯莱斯,嫁对人太爽

萌姐
2026-04-10 23:38:24
西部3-5名终极博弈:掘金故意输、湖人抢第三,火箭沦为红利本身!

西部3-5名终极博弈:掘金故意输、湖人抢第三,火箭沦为红利本身!

宝哥精彩赛事
2026-04-13 21:28:42
斯诺克世锦赛资格赛:庞俊旭10-9险胜埃莫里,成功晋级48强

斯诺克世锦赛资格赛:庞俊旭10-9险胜埃莫里,成功晋级48强

林子说事
2026-04-13 09:05:11
悉尼妹或加盟重启《X战警》战警!有望出演白皇后!

悉尼妹或加盟重启《X战警》战警!有望出演白皇后!

阿废冷眼观察所
2026-04-13 18:12:52
川崎工程师坦白:整个日本摩托圈,看到张雪俩字,心就咯噔一下

川崎工程师坦白:整个日本摩托圈,看到张雪俩字,心就咯噔一下

嘴角上翘的弧度
2026-04-11 07:02:09
身材是真绝了!令和时代的峰不二子!

身材是真绝了!令和时代的峰不二子!

贵圈真乱
2026-04-13 10:12:43
35岁傅彪儿子,住豪宅生活奢华,单身满头白发,走上了“不归路”

35岁傅彪儿子,住豪宅生活奢华,单身满头白发,走上了“不归路”

林轻吟
2026-04-02 19:51:37
他竟然转型成了个“正能量偶像”?

他竟然转型成了个“正能量偶像”?

BenSir本色说
2026-04-10 22:07:04
数钱数到手软!4月人生一改颓废,横财入宅,敏锐破局的3生肖

数钱数到手软!4月人生一改颓废,横财入宅,敏锐破局的3生肖

毅谈生肖
2026-04-13 10:00:00
盐湖股份:2026年第一季度净利润约29.39亿元,同比增加147.44%

盐湖股份:2026年第一季度净利润约29.39亿元,同比增加147.44%

每日经济新闻
2026-04-13 18:30:04
被皮球误伤的国安球迷:国安通知我去基地领签名球衣

被皮球误伤的国安球迷:国安通知我去基地领签名球衣

懂球帝
2026-04-13 17:41:06
香港演员郑雷去世,享年92岁,曾出演多部金庸剧

香港演员郑雷去世,享年92岁,曾出演多部金庸剧

都市快报橙柿互动
2026-04-12 23:36:36
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
美伊战争刚打一半,中国军工斩获新订单?空警-500又被人看上了

美伊战争刚打一半,中国军工斩获新订单?空警-500又被人看上了

阿龙聊军事
2026-04-13 18:29:22
2026-04-13 23:07:00
十轮网 incentive-icons
十轮网
科技决定上限,资本决定走向。
15220文章数 4178关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

媒体:欧尔班败选不仅是一国之事 牵扯到与中国的关系

头条要闻

媒体:欧尔班败选不仅是一国之事 牵扯到与中国的关系

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

谈判未完全关闭?3国力促美伊重启谈判

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

教育
亲子
本地
公开课
军事航空

教育要闻

【教研帮扶】 广东省教育研究院“走进粤东西北(湛江)教研帮扶活动”初中语文专场活动举行

亲子要闻

丈母娘干啥女婿感动要流泪?龙宝拍手夸姥姥,亲子互动笑的真开心

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:今晚10点封锁伊朗 对北约非常失望

无障碍浏览 进入关怀版