网易首页 > 网易号 > 正文 申请入驻

一文读懂DeepSeek-V3.2核心技术DSA:API疯狂降价性能不减的背后

0
分享至


DeepSeek 刚刚发布的实验模型 DeepSeek V3.2 引入了自研的稀疏注意力机制DSA,虽然是一个小版本的更新,但API价格最高降幅高达75%,这简直太残暴了


据DS官方的公众号发布,DeepSeek-V3.2-Exp 是一个实验性的版本。是一个迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention,说明deepseek还在憋大招,而这个DSA是非常关键的,deepseek也在公众号说了,作为一个实验性的版本,DeepSeek-V3.2-Exp 虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试,以排除在某些场景下效果欠佳的可能,诚挚希望广大用户在对比测试中提供宝贵的反馈意见,反馈链接:

https://feedback.deepseek.com/dsa

DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升

那么DSA究竟是如何工作的?

DSA 的两大核心组件

DSA 的设计思想是先筛选,后计算。它将复杂的注意力计算分解为两个协同工作的核心组件:


1.闪电索引器 (Lightning Indexer):一个轻量级的筛选器。它的任务是快速扫描整个上下文,为每个查询(Query)找出最相关的少数关键信息(Key)。为了追求极致的速度,它使用了非常小的键缓存(每个 token 仅 128 维)

2.稀疏多潜在注意力 (Sparse Multi-Latent Attention, MLA):一个重量级的计算器。它只对索引器筛选出的关键信息进行完整维度的注意力计算,从而避免了对海量无关信息的无效计算。它的键缓存更大(每个 token 512 维),以保证计算的精确性

DSA 的四步工作流程

DSA 的整个计算过程可以分解为以下四个步骤:

第一步:查询与键的投影 (Query & Key Projection)

与标准 Transformer 模型类似,输入的隐藏状态(hidden states)首先会被投影到查询(Query)和键(Key)空间,并融入旋转位置编码(rotary embeddings)来保留位置信息

创新之处在于:DSA 在这一步还会从隐藏状态中为每个注意力头(per-head)额外投影出一组权重。这组权重将在后续步骤中用于重新调整注意力得分(logits),让模型可以动态地为不同头分配不同的重要性


第二步:索引器评分 (Indexer Scoring)

闪电索引器开始工作。它使用轻量级的键缓存,快速计算查询(Q)与所有键(K)的点积得分(Q·K),并进行掩码(mask)和缩放(scale)

随后,它会用第一步生成的逐头权重来乘以这些得分。这一步的目的是让模型自主学习并放大那些在当前上下文中更重要的注意力头的信号

为了最大化硬件效率,这个评分过程运行在 DeepSeek 自研的DeepGEMM上,该算子为英伟达的 Hopper 和 Blackwell 架构 GPU 提供了深度优化


第三步:Top-k 选择 (Top-k Selection)

评分完成后,索引器会为每个查询,从整个上下文的所有 token 中,选出得分最高的 2048个 token。这些被选中的 token 被认为是与当前查询最相关的部分

(一个特殊情况:如果上下文的总长度本身就小于或等于 2048,那么索引器会选中所有 token,此时 DSA 的行为等同于全注意力)


第四步:执行稀疏 MLA (Sparse MLA)

最后,轮到重量级的稀疏多潜在注意力(MLA)登场。它会获取第三步筛选出的 2048 个 token 的索引,然后调用高效的 FlashMLA 稀疏计算核(sparse kernel),只在这部分优中选优的数据上执行注意力计算

由于计算范围被大幅缩小,它可以跳过所有不相关的上下文位置,从而极大地提升了计算速度和内存效率


DSA 的设计精髓在于其完美的权衡:

精确性:通过 Top-k 筛选机制,确保了注意力计算集中在最相关的信息上,避免了在无用信息上分散注意力,从而保持了极高的精度

高速度:通过闪电索引器、专门优化的稀疏计算核(FlashMLA)以及更小的缓存设计,极大地降低了计算复杂度和内存占用,实现了闪电般的速度

正如 网友@teortaxesTex所评论的:“AGI 将是稀疏的”。DeepSeek 的 DSA 机制,用一个微型的全注意力索引器作为导航,精准地指导了后续的大规模稀疏计算,这无疑是通往高效通用人工智能的一条极具前景的技术路径。DeepSeek 在注意力机制上的不断探索和果断迭代,也展现了其强大的技术创新能力

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

后仰大风车
2026-03-26 08:15:08
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
凯特戴6000块的帽子险出洋相!助手说漏嘴,意外爆出威廉的瓜?

凯特戴6000块的帽子险出洋相!助手说漏嘴,意外爆出威廉的瓜?

白露文娱志
2026-03-26 16:41:18
电影《挽救计划》高口碑热映 以跨文明协作诠释守望相助温暖内核

电影《挽救计划》高口碑热映 以跨文明协作诠释守望相助温暖内核

封面新闻
2026-03-26 18:56:02
定了!全票通过!杜兰特又要换队……

定了!全票通过!杜兰特又要换队……

贵圈真乱
2026-03-26 11:35:13
伊朗计划向通过霍尔木兹海峡的船只收取安全通行费

伊朗计划向通过霍尔木兹海峡的船只收取安全通行费

新浪财经
2026-03-26 20:28:52
独家:某运营商2025年营收几乎0增长! 好日子快到头了! 其实三大运营商日子都那样!

独家:某运营商2025年营收几乎0增长! 好日子快到头了! 其实三大运营商日子都那样!

新浪财经
2026-03-24 22:43:29
俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

贱议你读史
2026-03-26 00:07:41
国金证券:长期来看黄金有望开启新一轮大牛市

国金证券:长期来看黄金有望开启新一轮大牛市

财联社
2026-03-26 08:08:04
蒙古总理当众给斯大林一耳光,走出宴会厅3小时后,被扣上间谍帽子枪决

蒙古总理当众给斯大林一耳光,走出宴会厅3小时后,被扣上间谍帽子枪决

老杉说历史
2026-03-23 22:17:08
波兰磨刀:谁将是压垮俄罗斯的最后一根稻草

波兰磨刀:谁将是压垮俄罗斯的最后一根稻草

民间胡扯老哥
2026-03-23 18:56:09
3轮0球0助攻!U23国足天才新星踢中超状态断崖式下滑,恐沦为鸡肋

3轮0球0助攻!U23国足天才新星踢中超状态断崖式下滑,恐沦为鸡肋

零度眼看球
2026-03-26 07:41:28
3月26日下午中国女排!传来朱婷、李盈莹、袁心玥最新消息

3月26日下午中国女排!传来朱婷、李盈莹、袁心玥最新消息

民哥台球解说
2026-03-26 16:17:49
崩了,知名光伏公司大规模停产,大面积待岗!

崩了,知名光伏公司大规模停产,大面积待岗!

黯泉
2026-03-25 21:36:39
随着朝鲜1-1,泰国2-2,西安邀请赛积分榜出炉:中国男足排名第一

随着朝鲜1-1,泰国2-2,西安邀请赛积分榜出炉:中国男足排名第一

侧身凌空斩
2026-03-25 21:41:35
法媒:“伊朗战争的首个受害者是真相”

法媒:“伊朗战争的首个受害者是真相”

参考消息
2026-03-26 13:30:07
国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

零度眼看球
2026-03-26 07:23:48
不能光让特朗普出风头,俄罗斯宣布重大消息:和中国有大事要谈

不能光让特朗普出风头,俄罗斯宣布重大消息:和中国有大事要谈

哎呀哎呀看电影
2026-03-26 19:41:54
站在c位的是谁?张怡宁和郭晶晶两位同框,她在中间看着气场不小

站在c位的是谁?张怡宁和郭晶晶两位同框,她在中间看着气场不小

陈意小可爱
2026-03-26 07:59:48
逐玉爆火后最大的受益者,51岁翻红,涨粉百万!

逐玉爆火后最大的受益者,51岁翻红,涨粉百万!

娱人细品
2026-03-25 20:39:14
2026-03-26 21:00:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
本地
房产
时尚
军事航空

手机要闻

OPPO K15 Pro系列突然官宣:天玑9500s+主动散热,4月1日发布

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

上新|| 她们说,找到了自己的人生裙子!

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版