网易首页 > 网易号 > 正文 申请入驻

Adobe联合俄勒冈大学推出超级AI助手Lizard

0
分享至

这项由美国俄勒冈大学的阮文建(Chien Van Nguyen)和阮辉天(Thien Huu Nguyen)教授领导,联合Adobe研究院的张瑞毅(Ruiyi Zhang)等多位科学家共同完成的突破性研究发表于2025年7月,论文标题为《Lizard: An Efficient Linearization Framework for Large Language Models》。有兴趣深入了解技术细节的读者可以通过arXiv:2507.09025v1访问完整论文。

当我们和ChatGPT这样的AI助手聊天时,你有没有注意到一个问题?如果对话内容太长,AI就会"忘记"前面说过的话,就像一个患有短期记忆障碍的人。这个问题的根源在于现有大型语言模型的记忆机制存在致命缺陷——它们的记忆容量有限,而且随着对话变长,处理速度会越来越慢,最终因为"大脑"过载而崩溃。

俄勒冈大学和Adobe的研究团队就像是给AI做了一场"记忆改造手术"。他们开发出了一个名叫Lizard(蜥蜴)的革命性框架,能够让现有的大型语言模型拥有"无限记忆",同时保持极快的反应速度。这个名字很有意思——蜥蜴以其敏捷和适应性著称,正如这项技术让AI变得更加灵活高效。

要理解这项技术的重要性,我们需要先了解目前AI的"记忆危机"。当前的大型语言模型就像一个图书管理员,每次有人问问题时,他都要翻阅所有相关的书籍页面。如果图书馆很小,他能很快找到答案。但如果图书馆变得巨大,他就需要花费大量时间翻阅每一页,最终可能因为工作量过大而崩溃。在技术术语中,这被称为"二次复杂度"问题——处理时间会随着内容长度的平方增长。

Lizard的核心创新在于它重新设计了AI的"记忆机制"。研究团队没有让AI记住每一个细节,而是教会它如何智能地压缩和管理记忆。就像一个经验丰富的秘书,她不会把老板说过的每句话都逐字记录,而是会提取关键信息,并根据重要性进行分类存储。当需要回忆时,她能快速定位到相关信息。

这个"记忆改造"过程分为两个阶段,就像给大脑做手术一样精妙。第一阶段是"学习模仿",研究团队让新的记忆机制通过观察原始AI的行为来学习。这就像让一个学徒通过观察师傅的工作来掌握技能。新的记忆系统需要学会如何在保持信息准确性的同时,大幅减少存储和计算需求。

第二阶段是"实战训练",研究团队让装备了新记忆系统的AI在真实任务中进行训练。这个过程就像让学徒独立完成工作,通过实践来完善技能。通过这种两阶段训练,Lizard能够在几乎不损失性能的情况下,实现"无限记忆"和恒定速度处理。

为了解决传统记忆机制的局限性,研究团队设计了一个混合记忆架构。这个架构包含两个核心组件:门控线性注意力机制和滑动窗口注意力机制。这就像给AI配备了两种不同类型的记忆系统——一个负责长期记忆的全局压缩系统,另一个负责短期记忆的局部精确系统。

门控线性注意力机制就像一个智能的信息过滤器。当新信息进入时,它会自动判断哪些信息重要,哪些可以忘记。这个过程是动态的,会根据上下文自动调整。比如,如果你在和AI讨论某个技术问题,它会重点记住与这个话题相关的信息,而对无关的闲聊内容采用较低的存储优先级。

滑动窗口注意力机制则像一个精确的短期记忆系统。它会保留最近的重要信息,确保AI能够准确理解当前对话的细节。这两个系统协同工作,就像人类的大脑一样,既有长期记忆又有工作记忆。

研究团队还解决了一个关键的工程问题——如何让这个新系统在实际的计算机硬件上高效运行。他们开发了一种硬件感知的算法,能够充分利用现代GPU(图形处理器)的计算能力。这就像为一台跑车配备了专门设计的引擎,让它能够发挥最大性能。

在实验验证阶段,研究团队进行了全面的性能测试。他们使用了两个主流的大型语言模型作为测试对象:Mistral-7B和Llama-3-8B。这就像选择了两个不同品牌的汽车来测试新型引擎的性能。测试结果令人震惊——Lizard不仅能够处理无限长度的文本,而且在标准的语言理解任务中几乎没有性能损失。

在MMLU(大规模多任务语言理解)这个被称为"AI高考"的基准测试中,Lizard的表现尤其出色。与之前的线性化方法相比,Lizard在5-shot MMLU测试中获得了18分的显著提升,这在AI领域是一个巨大的进步。更重要的是,Lizard在各种语言理解任务中都接近原始模型的性能,这意味着它在获得"无限记忆"的同时,并没有牺牲智能水平。

为了测试AI的"记忆"能力,研究团队设计了一个有趣的"大海捞针"实验。他们在长达8000多个词的文本中隐藏了一些关键信息,然后要求AI找出这些信息。这就像在一本厚厚的小说中找到特定的句子。结果显示,Lizard能够准确地找到这些隐藏的信息,而传统方法在文本超过训练长度时就会失败。

在效率测试中,Lizard展现出了惊人的优势。传统的大型语言模型在处理长文本时,内存使用量会快速增长,最终导致系统崩溃。但Lizard维持了恒定的内存使用量和处理速度,就像一个永不疲惫的工人,无论工作量多大都能保持稳定的工作效率。

研究团队还进行了详细的架构分析,探索了不同设计选择对性能的影响。他们发现,轻量级的门控设计比复杂的结构更有效。这个发现很有意思——有时候简单的解决方案反而更强大。这就像在烹饪中,最简单的调料组合往往能做出最美味的菜肴。

值得注意的是,研究团队还解决了一个重要的数值稳定性问题。原始的门控线性注意力机制在计算过程中容易出现数值溢出或下溢,就像一个天平在称量极轻或极重物品时会失去准确性。他们通过巧妙的数学重新表述,将计算过程稳定化,确保系统在长时间运行中不会出现数值问题。

在小型模型上的测试也验证了Lizard的通用性。研究团队在Llama-3.2-1B和Llama-3.2-3B这两个较小的模型上进行了测试,结果表明Lizard的优势不仅限于大型模型,在小型模型上同样有效。这意味着这项技术可能适用于各种规模的AI系统。

从实际应用的角度来看,Lizard的意义重大。它能够让AI助手处理真正的长文档,进行深度的文档分析,或者进行超长对话而不会"失忆"。这对于客服系统、教育辅导、创意写作等应用场景都有巨大价值。

研究团队还提供了一个有趣的生成样例比较。当面对"为什么要线性化大块头"这样的无意义问题时,传统的线性化方法会给出看似合理但实际无关的答案,而Lizard则能够诚实地表示不理解问题的含义,这显示了更好的推理能力。

说到底,Lizard的出现代表了AI技术发展的一个重要里程碑。它不仅解决了长期困扰大型语言模型的记忆限制问题,还为未来的AI系统设计提供了新的思路。这项技术的开源性质意味着整个AI社区都能从中受益,推动相关技术的快速发展。

对于普通用户来说,Lizard技术的应用可能会让AI助手变得更加智能和实用。你可以和AI进行真正的深度对话,处理复杂的长文档,甚至进行需要大量历史信息的创作任务。这不仅提高了AI的实用性,也让人机交互变得更加自然和高效。

当然,这项技术也有其局限性。研究团队坦诚地指出,Lizard仍然依赖于高质量的预训练模型,并且在某些需要精确记忆的任务中可能不如传统的全注意力机制。但考虑到它在效率和实用性方面的巨大优势,这些限制显得相对次要。

随着这项技术的进一步发展和优化,我们有理由相信,未来的AI助手将会变得更加智能、高效和实用。Lizard的出现不仅是技术进步的体现,更是向着真正实用的人工智能迈出的重要一步。有兴趣了解更多技术细节的读者可以通过arXiv:2507.09025v1访问完整的研究论文。

Q&A

Q1:Lizard是什么?它能解决什么问题? A:Lizard是一个AI"记忆改造"框架,能让大型语言模型拥有"无限记忆"。它解决了传统AI记忆容量有限、处理长文本时速度变慢甚至崩溃的问题,让AI能够处理任意长度的文本而保持恒定的处理速度。

Q2:Lizard会不会影响AI的智能水平? A:不会。实验结果显示,Lizard在各种语言理解任务中几乎没有性能损失,在MMLU测试中甚至比之前的方法提升了18分。它在获得"无限记忆"的同时保持了原有的智能水平。

Q3:普通用户什么时候能使用到Lizard技术? A:目前Lizard还是研究阶段的技术,需要进一步工程化才能应用到实际产品中。但由于它是开源的,预计会被AI公司逐步集成到各种AI助手和应用中,让用户享受到更强大的长文本处理能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
多方混战的龙虾赛道,终端厂商凭什么站到C位?

多方混战的龙虾赛道,终端厂商凭什么站到C位?

36氪
2026-04-20 21:36:42
宋仲基带老婆看音乐会!发福油腻尽显老态,凯蒂素颜比宋慧乔惊艳

宋仲基带老婆看音乐会!发福油腻尽显老态,凯蒂素颜比宋慧乔惊艳

金风说
2026-04-20 16:26:03
出手扣下两批军火,又一个欧洲国家,加入制裁以色列的行列中

出手扣下两批军火,又一个欧洲国家,加入制裁以色列的行列中

空天力量
2026-04-20 17:09:18
官方通报小学生拒借车遭群殴:9人被处理

官方通报小学生拒借车遭群殴:9人被处理

界面新闻
2026-04-20 20:26:56
中央层面整治形式主义为基层减负专项工作机制办公室 中央纪委办公厅公开通报4起整治形式主义为基层减负典型问题

中央层面整治形式主义为基层减负专项工作机制办公室 中央纪委办公厅公开通报4起整治形式主义为基层减负典型问题

新华社
2026-04-20 17:44:02
大跌眼镜!“做空闺蜜”登热搜,劝闺蜜不婚不育,自己孩子10岁了

大跌眼镜!“做空闺蜜”登热搜,劝闺蜜不婚不育,自己孩子10岁了

火山詩话
2026-04-20 07:28:33
人民日报联合工信部紧急预警:全体iPhone用户,请立刻升级系统!

人民日报联合工信部紧急预警:全体iPhone用户,请立刻升级系统!

小柱解说游戏
2026-04-19 20:52:59
这五个号码千万不要接,一旦接听,银行卡里的钱都可能秒没

这五个号码千万不要接,一旦接听,银行卡里的钱都可能秒没

笑熬浆糊111
2026-04-20 00:05:15
突发!340亿开源巨头彻底撤离中国,419名顶级工程师被疯抢,18年深耕终落幕…

突发!340亿开源巨头彻底撤离中国,419名顶级工程师被疯抢,18年深耕终落幕…

新浪财经
2026-04-20 04:31:06
比利时男子在云南哈巴雪山失联超25天,搜救仍无发现 知情人称他曾现身进山口被劝返

比利时男子在云南哈巴雪山失联超25天,搜救仍无发现 知情人称他曾现身进山口被劝返

红星新闻
2026-04-20 19:01:11
伟大的10-5!丁俊晖世锦赛开门红,创3大纪录,会师赵心童冲8强!

伟大的10-5!丁俊晖世锦赛开门红,创3大纪录,会师赵心童冲8强!

刘姚尧的文字城堡
2026-04-20 20:00:14
欧尔班下台,这个欧洲国家却可能再次拥抱一位亲俄领导人

欧尔班下台,这个欧洲国家却可能再次拥抱一位亲俄领导人

上观新闻
2026-04-20 15:58:42
将对决赵心童!39岁丁俊晖爆发:10-5淘汰世界第25 连续2年进16强

将对决赵心童!39岁丁俊晖爆发:10-5淘汰世界第25 连续2年进16强

风过乡
2026-04-20 19:41:28
中国高校只剩7年窗口期 学生数量断崖式塌方后一半高校都得死

中国高校只剩7年窗口期 学生数量断崖式塌方后一半高校都得死

六子吃凉粉
2026-04-20 19:10:49
最新:曝俄军败退扎波罗热!丢失几年来占领的全部土地

最新:曝俄军败退扎波罗热!丢失几年来占领的全部土地

项鹏飞
2026-04-20 20:13:15
普京访华行程敲定,特朗普已下命令,中国向全球通告,无惧美国

普京访华行程敲定,特朗普已下命令,中国向全球通告,无惧美国

桑启红原
2026-04-20 20:19:05
卖了80多座万达广场,还欠6000亿!万达的债为啥永远还不完?

卖了80多座万达广场,还欠6000亿!万达的债为啥永远还不完?

科学发掘
2026-04-17 00:52:53
孙宏斌现状:公司负债大幅减少,63岁愁白了头,儿子成了他的骄傲

孙宏斌现状:公司负债大幅减少,63岁愁白了头,儿子成了他的骄傲

洲洲影视娱评
2026-04-20 15:16:52
李亚鹏,官宣了!4月17日晚,嫣然天使儿童医院告别14年租房模式

李亚鹏,官宣了!4月17日晚,嫣然天使儿童医院告别14年租房模式

一盅情怀
2026-04-20 14:38:27
酒店窗帘太透明情侣全然不知! 60秒视频片流出…路人狂拍

酒店窗帘太透明情侣全然不知! 60秒视频片流出…路人狂拍

环球趣闻分享
2026-04-20 14:57:07
2026-04-20 23:08:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17828文章数 49700关注度
往期回顾 全部

科技要闻

HUAWEI Pura X Max发布 售价10999元起

头条要闻

欧洲或再迎一位亲俄领导人 曾与泽连斯基发生公开冲突

头条要闻

欧洲或再迎一位亲俄领导人 曾与泽连斯基发生公开冲突

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

亲子
游戏
家居
旅游
本地

亲子要闻

【孤独症科普】啥是孤独症,哪些孩子易发生,如何应对?

《风启之旅》Steam在线峰值是《碧海黑帆》85倍

家居要闻

自然慢调 慢享时光

旅游要闻

聊城东昌府区旅游攻略大赛颁奖典礼暨惠民旅游巴士发车仪式举行

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版