网易首页 > 网易号 > 正文 申请入驻

一文读懂DeepSeek-V3.2核心技术DSA:API疯狂降价性能不减的背后

0
分享至


DeepSeek 刚刚发布的实验模型 DeepSeek V3.2 引入了自研的稀疏注意力机制DSA,虽然是一个小版本的更新,但API价格最高降幅高达75%,这简直太残暴了


据DS官方的公众号发布,DeepSeek-V3.2-Exp 是一个实验性的版本。是一个迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention,说明deepseek还在憋大招,而这个DSA是非常关键的,deepseek也在公众号说了,作为一个实验性的版本,DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试,以排除在某些场景下效果欠佳的可能,诚挚希望广大用户在对比测试中提供宝贵的反馈意见,反馈链接:

https://feedback.deepseek.com/dsa

DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升

那么DSA究竟是如何工作的?

DSA 的两大核心组件

DSA 的设计思想是先筛选,后计算。它将复杂的注意力计算分解为两个协同工作的核心组件:


1.闪电索引器 (Lightning Indexer):一个轻量级的筛选器。它的任务是快速扫描整个上下文,为每个查询(Query)找出最相关的少数关键信息(Key)。为了追求极致的速度,它使用了非常小的键缓存(每个 token 仅 128 维)

2.稀疏多潜在注意力 (Sparse Multi-Latent Attention, MLA):一个重量级的计算器。它只对索引器筛选出的关键信息进行完整维度的注意力计算,从而避免了对海量无关信息的无效计算。它的键缓存更大(每个 token 512 维),以保证计算的精确性

DSA 的四步工作流程

DSA 的整个计算过程可以分解为以下四个步骤:

第一步:查询与键的投影 (Query & Key Projection)

与标准 Transformer 模型类似,输入的隐藏状态(hidden states)首先会被投影到查询(Query)和键(Key)空间,并融入旋转位置编码(rotary embeddings)来保留位置信息

创新之处在于:DSA 在这一步还会从隐藏状态中为每个注意力头(per-head)额外投影出一组权重。这组权重将在后续步骤中用于重新调整注意力得分(logits),让模型可以动态地为不同头分配不同的重要性


第二步:索引器评分 (Indexer Scoring)

闪电索引器开始工作。它使用轻量级的键缓存,快速计算查询(Q)与所有键(K)的点积得分(Q·K),并进行掩码(mask)和缩放(scale)

随后,它会用第一步生成的逐头权重来乘以这些得分。这一步的目的是让模型自主学习并放大那些在当前上下文中更重要的注意力头的信号

为了最大化硬件效率,这个评分过程运行在 DeepSeek 自研的DeepGEMM上,该算子为英伟达的 Hopper 和 Blackwell 架构 GPU 提供了深度优化


第三步:Top-k 选择 (Top-k Selection)

评分完成后,索引器会为每个查询,从整个上下文的所有 token 中,选出得分最高的 2048个 token。这些被选中的 token 被认为是与当前查询最相关的部分

(一个特殊情况:如果上下文的总长度本身就小于或等于 2048,那么索引器会选中所有 token,此时 DSA 的行为等同于全注意力)


第四步:执行稀疏 MLA (Sparse MLA)

最后,轮到重量级的稀疏多潜在注意力(MLA)登场。它会获取第三步筛选出的 2048 个 token 的索引,然后调用高效的 FlashMLA 稀疏计算核(sparse kernel),只在这部分优中选优的数据上执行注意力计算

由于计算范围被大幅缩小,它可以跳过所有不相关的上下文位置,从而极大地提升了计算速度和内存效率


DSA 的设计精髓在于其完美的权衡:

精确性:通过 Top-k 筛选机制,确保了注意力计算集中在最相关的信息上,避免了在无用信息上分散注意力,从而保持了极高的精度

高速度:通过闪电索引器、专门优化的稀疏计算核(FlashMLA)以及更小的缓存设计,极大地降低了计算复杂度和内存占用,实现了闪电般的速度

正如 网友@teortaxesTex所评论的:“AGI 将是稀疏的”。DeepSeek 的 DSA 机制,用一个微型的全注意力索引器作为导航,精准地指导了后续的大规模稀疏计算,这无疑是通往高效通用人工智能的一条极具前景的技术路径。DeepSeek 在注意力机制上的不断探索和果断迭代,也展现了其强大的技术创新能力

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李中华揭秘2015年中泰空战失利细节:装备和人的因素都存在

李中华揭秘2015年中泰空战失利细节:装备和人的因素都存在

谈史论天地
2026-02-10 14:00:07
欧冠奖金曝光 小组赛踢完拜仁就拿1亿欧 倒数第一也超2000万欧

欧冠奖金曝光 小组赛踢完拜仁就拿1亿欧 倒数第一也超2000万欧

智道足球
2026-02-25 20:05:49
官宣!深圳“最大高铁站”要来了!

官宣!深圳“最大高铁站”要来了!

王晓爱体彩
2026-02-25 19:49:24
她因身材发育过猛,无奈退出国家游泳队,被三流导演看中捧成顶流

她因身材发育过猛,无奈退出国家游泳队,被三流导演看中捧成顶流

卿子书
2025-12-31 08:15:41
出轨、净身出户?这次,74岁的梁锦松,终究在伏明霞身上栽了跟头

出轨、净身出户?这次,74岁的梁锦松,终究在伏明霞身上栽了跟头

秋姐居
2026-02-10 09:19:42
百万债务还清了!夫妻俩在杭州开饭店,8年来第一次回老家过年,临行宴请老顾客

百万债务还清了!夫妻俩在杭州开饭店,8年来第一次回老家过年,临行宴请老顾客

环球网资讯
2026-02-25 08:28:39
穆里尼奥近9场欧冠淘汰赛不胜,为欧冠历史最长纪录

穆里尼奥近9场欧冠淘汰赛不胜,为欧冠历史最长纪录

懂球帝
2026-02-25 16:54:22
那尔那茜报复陈丽君!?

那尔那茜报复陈丽君!?

八卦疯叔
2026-02-23 10:54:55
渡边雄太:我根本不关心排名,我只想将中国视为“要击败的对手”

渡边雄太:我根本不关心排名,我只想将中国视为“要击败的对手”

懂球帝
2026-02-25 15:30:08
唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

唐嫣在国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

蓓小西
2026-01-05 09:12:05
规划大改!南京“迪士尼”拆除后续:近14公顷巨无霸宅地释放

规划大改!南京“迪士尼”拆除后续:近14公顷巨无霸宅地释放

林子说事
2026-02-25 10:24:36
广东一网友自驾云南途中爆胎,不到4公里路被收1400元拖车费后续:当事人称涉事公司提出删除视频可退钱,但他不接受,希望依法处罚

广东一网友自驾云南途中爆胎,不到4公里路被收1400元拖车费后续:当事人称涉事公司提出删除视频可退钱,但他不接受,希望依法处罚

极目新闻
2026-02-25 14:18:31
欧冠悲喜夜:国米惨遭黑马双杀2-5出局 马竞7-4晋级 勒沃库森2-0

欧冠悲喜夜:国米惨遭黑马双杀2-5出局 马竞7-4晋级 勒沃库森2-0

狍子歪解体坛
2026-02-25 05:55:00
确认了!是知名演员张嘉益

确认了!是知名演员张嘉益

看尽落尘花q
2026-01-04 11:55:44
澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

澳大利亚惊现封闭乱伦家族:4代人近亲繁衍38名成员全是乱伦产物

第7情感
2026-02-23 20:45:16
晚间公告|2月25日这些公告有看头

晚间公告|2月25日这些公告有看头

牛锅巴小钒
2026-02-25 19:11:26
冯小刚徐帆两口子在美国包饺子的照片,让网友破防了

冯小刚徐帆两口子在美国包饺子的照片,让网友破防了

魔都姐姐杂谈
2026-02-24 14:30:35
41岁独居女子去世,无法定继承人,多位旁系亲属争夺遗产,法院:价值三四百万元的房产归国家所有,银行存款等按帮扶比例进行分配

41岁独居女子去世,无法定继承人,多位旁系亲属争夺遗产,法院:价值三四百万元的房产归国家所有,银行存款等按帮扶比例进行分配

大风新闻
2026-02-25 20:53:04
传魅族将放弃手机业务:团队全裁,补偿“N+1”

传魅族将放弃手机业务:团队全裁,补偿“N+1”

芯智讯
2026-02-24 21:36:43
重大资产重组,终止!明日复牌

重大资产重组,终止!明日复牌

新浪财经
2026-02-25 23:08:00
2026-02-26 02:28:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1033文章数 396关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

女子爬山失联10天后遗体被找到 丈夫:她登顶神情恐惧

头条要闻

女子爬山失联10天后遗体被找到 丈夫:她登顶神情恐惧

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

家居
时尚
旅游
健康
游戏

家居要闻

艺居办公 温度与效率

“复古甜心”穿搭突然大火!春天穿时髦又减龄

旅游要闻

重庆酉阳樱花漫古城,吊脚飞檐藏春归,这才是中式浪漫天花板!

转头就晕的耳石症,能开车上班吗?

《如龙极3》中文配音访谈:中文配音与本地化并非易事

无障碍浏览 进入关怀版