网易首页 > 网易号 > 正文 申请入驻

美团龙猫技术升级!新注意力机制速度快10倍,还能处理1M超长文本

0
分享至

来源:市场资讯

(来源:量子位)

256K文本预加载提速超50%,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招,发布全新稀疏注意力机制LoZA(LongCat ZigZag Attention)

新技术集中火力,重点解决长文本任务的理解、算力难题。


相比于LongCat系列之前的全注意力MLA机制,LoZA只改了一半的核心模块。

但模型长文本能力从256K扩展到1M,解码速度还快了不少。

甚至比同类型的Qwen-3模型表现还要好。

接下来看具体方案。

全注意力机制的算力瓶颈在于平方级的计算复杂度O (L²),这导致模型在处理长文本任务时对显卡要求高,还会出现推理延迟问题。

LoZA的核心思路是专注于处理重要的内容,不重要的部分少花力气。


作为LongCat系列的核心技术升级,LoZA主要是在原来的MLA机制上做改造。

具体分两步。

首先,给模型里的多头潜在注意力模块MLA做一个全局“筛查”,找出哪些模块可以被改造。

在原来的MLA架构中,每个MLA模块都是处理注意力的核心单元,现在的新方案是给每个模块配一个可学习权重α。

α值越高,说明该模块额全注意力计算越关键,一旦简化就容易丢性能;α值越低就意味着模块的可替代性强,即便换成更轻量的计算方式,对整体的理解能力影响也不大。

在训练过程中,团队冻结模型其他参数,只更新α的梯度,通过这种专门的校准训练让模型自主学习α值,然后按α值从小到大排序,找出那些稀疏化后不影响性能的MLA模块,也就是后续的优化目标。

随后,将找出的50%低性能模块换成更轻巧的流式稀疏注意力SSA

这样就形成了一种交错结构,团队将这种结构称为ZigZag

SSA的计算复杂度是线性的O (L·S)(S为稀疏窗口大小,固定为1024Token),远低于全注意力的O (L²)。

所以这种交错结构让模型既不会因为过度简化而变笨,又能把计算复杂度降到线性级别,省不少算力。


为了让模型在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token稀疏窗口

每个窗口里有1个负责抓整体关联的“全局块”和7个负责盯附近内容的“局部块”,单块大小为128Token。

这样的改造也不需要从头训练,在中期训练阶段就能完成,成本也比较低。

从测试数据来看,LoZA的表现也不错,主要是“更快”的同时“没变笨”

速度上,要是处理128K上下文,解码速度直接比原来快10倍;

256K上下文,模型预加载(读文本过程)速度快了50%,后续解码阶段生成内容时还能省30%的算力,相当于同样的硬件,现在能同时处理两倍多的长文本任务。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。


性能上,LoZA也没因为简化而缩水。

处理回答问题、写代码这类日常任务时,和原版LongCat-Flash持平;处理长文本任务时,表现反而更好。


比如在MRCR测试里,反超了同样能处理1M长文本的Qwen-3模型,还更稳定。


接下来,团队还计划让LoZA支持动态稀疏比例

短文本场景自动多用全注意力保证精度,长文本场景自动增加稀疏模块提升效率,甚至适配多模态模型处理长视频、长图文内容。

好一个新年新气象!

论文地址:https://www.alphaxiv.org/abs/2512.23966

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
67万亿砸向市场!比08年疯狂16倍,房价物价要变天?

67万亿砸向市场!比08年疯狂16倍,房价物价要变天?

现代小青青慕慕
2026-01-16 20:48:45
超20款车光速调价,丰田“自杀式”反击!2026价格战再升级

超20款车光速调价,丰田“自杀式”反击!2026价格战再升级

车东西
2026-01-16 18:28:43
涉中国电动汽车,卡尼宣布大消息

涉中国电动汽车,卡尼宣布大消息

环球时报国际
2026-01-16 18:27:32
网传华为终端BG董事长余承东工作群怒批鸿蒙座舱:各种智能提醒都不具备,不该提醒的瞎提醒!非常非常愚蠢

网传华为终端BG董事长余承东工作群怒批鸿蒙座舱:各种智能提醒都不具备,不该提醒的瞎提醒!非常非常愚蠢

和讯网
2026-01-16 15:50:10
47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

古希腊掌管松饼的神
2026-01-15 11:14:09
牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

春露秋霜
2026-01-16 06:27:20
浙江一城际公交公司所有线路停运,过渡期班线由长途汽运公司负责

浙江一城际公交公司所有线路停运,过渡期班线由长途汽运公司负责

澎湃新闻
2026-01-16 15:28:32
“没一个会算微积分的”,女孩庆祝水硕毕业,评论区一片冷嘲热讽

“没一个会算微积分的”,女孩庆祝水硕毕业,评论区一片冷嘲热讽

妍妍教育日记
2026-01-16 15:42:27
上海大雾大批航班备降杭州?杭州机场核实:共接收23个航班备降

上海大雾大批航班备降杭州?杭州机场核实:共接收23个航班备降

环球网资讯
2026-01-16 11:54:08
罗永浩朋友圈最新发声:好吧,他赢了

罗永浩朋友圈最新发声:好吧,他赢了

扬子晚报
2026-01-16 23:25:32
赵继伟首秀24+7献制胜罚球!辽宁险胜新疆 莫兰德6+14威尔斯14分

赵继伟首秀24+7献制胜罚球!辽宁险胜新疆 莫兰德6+14威尔斯14分

颜小白的篮球梦
2026-01-16 21:23:39
中方禁令下达后,高市早苗终于开口,说了一句话,让西方不寒而栗

中方禁令下达后,高市早苗终于开口,说了一句话,让西方不寒而栗

空天力量
2026-01-16 13:11:47
医生问“自费还是医保”,千万记住这3句话,能省好几千!

医生问“自费还是医保”,千万记住这3句话,能省好几千!

据说说娱乐
2026-01-16 12:20:31
周琦末节神秘消失北京主场输给山西,许利民说的对:球队没希望了

周琦末节神秘消失北京主场输给山西,许利民说的对:球队没希望了

姜大叔侃球
2026-01-16 22:13:40
清空的作品与破碎的公信力:军事专家李莉预测失灵背后的认知迷思

清空的作品与破碎的公信力:军事专家李莉预测失灵背后的认知迷思

老马拉车莫少装
2026-01-16 18:48:04
特朗普折腾了一整年,立下“大功一件”:亲手帮“中国再次伟大”

特朗普折腾了一整年,立下“大功一件”:亲手帮“中国再次伟大”

博览历史
2026-01-16 11:31:40
冷到发紫,今年首场大范围寒潮“时刻表”定了,普降6到10℃,湖南、贵州等地有冻雨

冷到发紫,今年首场大范围寒潮“时刻表”定了,普降6到10℃,湖南、贵州等地有冻雨

潇湘晨报
2026-01-16 10:58:14
美国军火商洛马公司因没缴纳中方开出990亿罚单,后果竟如此严重

美国军火商洛马公司因没缴纳中方开出990亿罚单,后果竟如此严重

百态人间
2025-12-13 16:07:09
曝浙江富豪俞兆洪去世,年仅48岁,心梗导致,每天坚持晨跑五公里

曝浙江富豪俞兆洪去世,年仅48岁,心梗导致,每天坚持晨跑五公里

裕丰娱间说
2026-01-16 17:23:47
索尼正准备 “革命性” 发布,或震撼行业?

索尼正准备 “革命性” 发布,或震撼行业?

相机Beta
2026-01-16 20:29:13
2026-01-17 06:23:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2057588文章数 5281关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

教育
时尚
亲子
数码
游戏

教育要闻

初中三年,最怕“掉队式沉默”

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

亲子要闻

精神科医生:家长的“为你好”也可能对孩子造成创伤

数码要闻

熊猫MX34U7 34英寸带鱼屏显示器发布,售价1299元

十三年后,《逆战:未来》想为所有逆行者们找回青春"/> 主站 商城 论坛 自运营 登录 注册 十三年后,《逆战:未来》想为所有逆行者们找回青春 廉颇 2...

无障碍浏览 进入关怀版