网易首页 > 网易号 > 正文 申请入驻

Google发布新模型融合长短期记忆与注意力机制,突破Token限制

0
分享至

Google研究院发布了一项称为Titans模型架构的突破性研究,集成了短期记忆、长期记忆与注意力机制,突破现有生成式人工智能上下文处理瓶颈,支持超过200万Token的上下文长度,对语言建模与长串行生成任务带来显著改进。 Google计划将Titans的相关技术开源,这将加速长上下文生成技术在学术与产业领域的发展,并推动相关应用的创新。

目前生成式人工智能模型,例如Transformer及其衍生模型,虽然在多数应用领域表现出色,但其上下文窗口(Window)长度的限制,通常仅为几千到几万个Token,这使其在处理长文本、多轮对话或需要大规模上下文记忆的应用中,可能无法保持语义连贯性与资讯准确性。Google的Titans架构通过引入深度神经长期记忆模块(Neural Long-Term Memory Module),有效解决了这个挑战,能在更长的上下文中保持高效且精确的推理能力。

研究团队表示Titans的设计灵感来自于人类记忆系统,结合短期记忆的快速回应与长期记忆的持久特性,并通过注意力机制专注于当前上下文。传统Transformer模型因为需要计算所有Token之间的配对相关性,所以计算成本随上下文长度平方增加,而Titans则借由深层化与非线性化的记忆模块设计,以及遗忘机制等技术,大幅提升记忆管理效率。

Titans具有三种架构设计变体,分别是Memory as a Context(MAC)、Memory as a Gate(MAG)和Memory as a Layer(MAL),针对不同的任务需求来集成短期与长期记忆。MAC将长期记忆作为上下文的一部分,让注意力机制能够动态结合历史资讯与当前数据,适合需要处理详细历史上下文的任务。而MAG则会根据任务需求,调整即时数据与历史资讯的重要性比例,专注于当前最相关的资讯。

MAL则是将记忆模块设计为深度网络的一层,压缩过去与当前上下文,然后交由注意力模块处理,具备较高效率,但整体表现可能略受限制。与传统Transformers相比,Titans结合了多层次记忆模块与动态记忆更新能力,不仅突破了上下文长度的限制,还能在测试阶段持续学习,显著提升推理能力与适应性。

在语言建模、常识推论、时间串行分析及基因数据建模等多个领域,Titans展示远超过现有基准模型的性能,特别是在超长串行处理方面的表现。在实验中,Titans架构在长串行处理任务中的表现,明显优于现有模型。无论是语言建模还是时间串行预测,Titans在准确性与效率都展现了压倒性优势,甚至在部分场景中超越如GPT-4等具有数十倍参数的超大型生成式模型。

除了Google在生成式首席人工智能官上下文的研究突破之外,中国人工智能公司MiniMax推出的MiniMax-01系列模型,也主打其超长上下文处理和多模态理解能力,其最新的MiniMax-Text-01模型支持长达400万Token的上下文处理能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
州长亲自招募詹姆斯:我们生活质量第一

州长亲自招募詹姆斯:我们生活质量第一

林间小温柔
2026-07-02 01:20:39
官方:伊劳拉前助手埃尔菲克、库珀等四人加入利物浦教练组

官方:伊劳拉前助手埃尔菲克、库珀等四人加入利物浦教练组

懂球帝
2026-07-02 20:28:19
唯独中国交五倍签证费?高市不听岸田劝告,中方对日本改了称呼!

唯独中国交五倍签证费?高市不听岸田劝告,中方对日本改了称呼!

清衣渡a
2026-06-30 13:42:14
定居台湾的姑姑回大陆,显摆自己住150平豪宅,我:去我家看看

定居台湾的姑姑回大陆,显摆自己住150平豪宅,我:去我家看看

红豆讲堂
2025-06-27 10:54:06
别怪我没提醒你:2026年还敢让人“挂靠社保”的,趁早收手吧

别怪我没提醒你:2026年还敢让人“挂靠社保”的,趁早收手吧

国曙
2026-06-30 15:30:53
心理学上说:永远要记住,和周围人搞好关系的秘诀就是,不分享喜悦,不炫耀成功,不说三道四,不假装聪明

心理学上说:永远要记住,和周围人搞好关系的秘诀就是,不分享喜悦,不炫耀成功,不说三道四,不假装聪明

心理观察局
2026-07-02 06:26:09
首轮五盘苦战,对照巨头喻示辛纳难卫冕!

首轮五盘苦战,对照巨头喻示辛纳难卫冕!

网球之家
2026-07-02 22:20:19
罕见破例!已故伊朗领袖遗体将送至伊拉克,90国代表将出席国葬

罕见破例!已故伊朗领袖遗体将送至伊拉克,90国代表将出席国葬

新时代精神
2026-07-01 20:15:14
5天一到,解放军准时封海,特朗普没想到,中方拒绝给31国留面子

5天一到,解放军准时封海,特朗普没想到,中方拒绝给31国留面子

万物知识圈
2026-07-02 09:29:05
快讯!立刻停止,中国警告日本!

快讯!立刻停止,中国警告日本!

故事终将光明磊落
2026-07-02 10:54:17
文在寅回青瓦台一对一面谈,他也不想看到李在明出走自立门户

文在寅回青瓦台一对一面谈,他也不想看到李在明出走自立门户

守望东北亚
2026-07-02 06:25:03
中国男篮vs日本男篮!12人终极名单出炉,攻防均衡誓破强敌

中国男篮vs日本男篮!12人终极名单出炉,攻防均衡誓破强敌

江启
2026-07-02 12:15:12
这很科学:89%的人幻想过同时和多人发生性行为,算精神出轨吗?

这很科学:89%的人幻想过同时和多人发生性行为,算精神出轨吗?

宇宙时空
2026-05-26 18:20:10
“四时不开窗,家人才健康”,今天才知道:这4个时间不能开窗!

“四时不开窗,家人才健康”,今天才知道:这4个时间不能开窗!

三农老历
2026-07-01 01:28:08
男子出售前女友送的银镯,剪开发现竟是罕见的“银包金”:40g的手镯,金子占30克,得知“秘密”他险些落下泪

男子出售前女友送的银镯,剪开发现竟是罕见的“银包金”:40g的手镯,金子占30克,得知“秘密”他险些落下泪

二胡的岁月如歌
2026-05-31 18:02:40
万万没想到!即将下台的武契奇突然宣布:塞尔维亚将走西方路线

万万没想到!即将下台的武契奇突然宣布:塞尔维亚将走西方路线

锅锅爱历史
2026-07-01 22:27:58
男篮世青赛八强正式出炉!中国队惨败出局:美国法国澳洲携手晋级

男篮世青赛八强正式出炉!中国队惨败出局:美国法国澳洲携手晋级

篮球快餐车
2026-07-02 06:05:56
搬起石头砸自己的脚!本想帮谢娜,结果任素汐先被扒了个底朝天

搬起石头砸自己的脚!本想帮谢娜,结果任素汐先被扒了个底朝天

眼底星碎
2026-07-02 06:40:45
埃尔多安呼吁摧毁以色列,兵力相差26万,内塔尼亚胡不敢轻举妄动

埃尔多安呼吁摧毁以色列,兵力相差26万,内塔尼亚胡不敢轻举妄动

离离言几许
2026-07-02 02:20:00
马刺签哈里斯+尚帕尼:价廉物美

马刺签哈里斯+尚帕尼:价廉物美

张佳玮写字的地方
2026-07-02 04:41:51
2026-07-02 22:55:00
十轮网 incentive-icons
十轮网
科技决定上限,资本决定走向。
15219文章数 4181关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

兰州甘A88888出租车又成"网红" 官方澄清:非奖励号牌

头条要闻

兰州甘A88888出租车又成"网红" 官方澄清:非奖励号牌

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

手机
亲子
本地
家居
公开课

手机要闻

消息称三星Galaxy S27系列智能手机将标配防窥显示屏

亲子要闻

从新生儿到学龄期全覆盖:儿童被子成长型选型的策略与实用方法

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

家居要闻

传奇筑 日常诗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版