网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V3.2-Exp官宣发布,API价格下调超50%

0
分享至

《科创板日报》9月29日讯(记者 黄心怡)梁文锋最新动作来了,DeepSeek-V3.2-Exp 今天正式发布并开源。

根据DeepSeek官方介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。V3.2-Exp 在 V3.1-Terminus 的基础上引入了DeepSeek稀疏注意力(Sparse Attention)机制,旨在对长文本的训练和推理效率进行探索性的优化和验证。

对于此次模型更新,中信建投TMT行业首席分析师武超则评价,DeepSeek-V3.2-Exp“易用性再次大幅提升”。

值得一提的是,除了英伟达CUDA版本外,DeepSeek还开源了TileLang版本GPU算子。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

在缓存命中的情况下,输入价格由0.5元/百万token降低为0.2元。在缓存未命中的情况下,输入价格由4元/百万token减低为2元。输出价格则从12元/百万token大幅降低为3元。


在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

据介绍,该实验版本代表了DeepSeek对更高效的transformer架构的研究,特别注重提高处理扩展文本序列时的计算效率。

DeepSeek稀疏注意力架构(DSA)首次实现了细粒度(fine-grained)稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长文本训练和推理效率。


为了评估引入稀疏注意力机制的影响,DeepSeek方面特意将DeepSeek-V3.2-Exp的训练配置与V3.1-Terminus进行了对齐。在各个领域的公开基准测试中,DeepSeek-V3.2-Exp的表现与V3.1-Terminus相当。


DeepSeek方面称,在新模型的研究过程中,需要设计和实现很多新的GPU算子。

“我们使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含TileLang与CUDA两种版本。我们建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。”

《科创板日报》了解到,TileLang编程语言是由北京大学计算机学院副研究员杨智团队主导开发的开源AI算子编程语言。在华为全联接大会上,该团队核心成员董宇骐曾介绍,TileLang实现了FlashAttention算子开发,代码量从500+行减少至80行,并保持了与官方版本持平的性能。

除了DeepSeek外,近期阿里通义千问、智谱也都在推进大模型的迭代升级。

在2025云栖大会现场,阿里云接连发布了七款大模型技术产品,覆盖语言、语音、视觉、多模态、代码等模型领域。其中包括了阿里旗舰模型Qwen3-Max正式发布,预训练数据量达36T,总参数超过万亿,在Coding编程能力和Agent工具调用能力上有较大提升。

智谱新模型GLM-4.6将于近日发布,目前已可通过API接口调用。

月之暗面Kimi则发布Agent模式“OK Computer”并开启灰度测试。据官方介绍,“OK Computer”延续“模型即Agent”理念,通过端到端训练Kimi K2模型,进一步提升智能体及工具调用能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
投资75亿!超大型肿瘤医院要来了

投资75亿!超大型肿瘤医院要来了

医疗器械经销商联盟
2026-02-23 13:11:00
世界第2,中国第1!赵心童单赛季排名创纪录,连超4大世界冠军!

世界第2,中国第1!赵心童单赛季排名创纪录,连超4大世界冠军!

刘姚尧的文字城堡
2026-02-23 09:32:38
追梦格林对勇士队的伤害,似乎比想象中更大!

追梦格林对勇士队的伤害,似乎比想象中更大!

Haviven聊球
2026-02-23 17:17:53
麻烦大了,多国反对武力解决台海问题,我们该怎么样破局?

麻烦大了,多国反对武力解决台海问题,我们该怎么样破局?

混沌录
2026-02-14 16:13:12
正月初六高速堵疯!7100万辆车齐上路,电车车主直接崩溃!

正月初六高速堵疯!7100万辆车齐上路,电车车主直接崩溃!

乐悠悠娱乐
2026-02-23 11:29:02
五台山景区大火持续达7小时:官方回应伤亡情况,一画面信息量大

五台山景区大火持续达7小时:官方回应伤亡情况,一画面信息量大

博士观察
2026-02-22 16:44:15
2-1绝杀夺冠!美国助攻日本:保住奖牌榜前十 中国排名高韩国1位

2-1绝杀夺冠!美国助攻日本:保住奖牌榜前十 中国排名高韩国1位

侃球熊弟
2026-02-23 00:29:36
不是那个年代的,你真看不懂

不是那个年代的,你真看不懂

深度报
2026-02-15 23:01:53
王艺迪发球回抛,早田希娜险胜高桥,陈俊菘惜败张本智和

王艺迪发球回抛,早田希娜险胜高桥,陈俊菘惜败张本智和

子水体娱
2026-02-23 15:51:14
马斯克牵手39岁女下属,3年生4娃终被承认!拿下首富的女人不简单

马斯克牵手39岁女下属,3年生4娃终被承认!拿下首富的女人不简单

商务范
2026-02-05 18:12:38
北京节后气温先升后降,天气趋势→

北京节后气温先升后降,天气趋势→

新浪财经
2026-02-23 11:41:59
特斯拉新车正式下线:无方向盘、无踏板、无后视镜;定价不高于3万美元,“不需要人开,直接输入目的地即可”

特斯拉新车正式下线:无方向盘、无踏板、无后视镜;定价不高于3万美元,“不需要人开,直接输入目的地即可”

中国能源网
2026-02-20 19:18:19
这根骨头上没有赘肉,说明你很健康

这根骨头上没有赘肉,说明你很健康

财经早餐
2026-02-23 06:20:12
五台山大火:官方披露伤亡情况,大量内幕披露,一画面信息量大

五台山大火:官方披露伤亡情况,大量内幕披露,一画面信息量大

博士观察
2026-02-23 11:23:20
水花齐聚?美媒:库里已将球鞋下家缩小至3个品牌,安踏在列

水花齐聚?美媒:库里已将球鞋下家缩小至3个品牌,安踏在列

懂球帝
2026-02-23 10:18:38
女子高铁如厕不慎冲走50克金手链,地勤机械师手掏40分钟集便器寻回

女子高铁如厕不慎冲走50克金手链,地勤机械师手掏40分钟集便器寻回

大风新闻
2026-02-23 14:02:06
不打小仗,只要打大仗!日本这一举动,给所有中国人都提了个醒?

不打小仗,只要打大仗!日本这一举动,给所有中国人都提了个醒?

叹知
2026-02-23 14:50:44
CCTV5直播!中国男篮VS日本男篮退路全无,郭士强或重用两位新人

CCTV5直播!中国男篮VS日本男篮退路全无,郭士强或重用两位新人

老叶评球
2026-02-23 17:14:00
8分钟地狱到天堂!绝杀被吹+读秒反杀,利物浦沦落靠17岁小孩保命

8分钟地狱到天堂!绝杀被吹+读秒反杀,利物浦沦落靠17岁小孩保命

落夜足球
2026-02-23 15:31:09
看完破防了!真是“满载而归”,在G4京港澳高速粤L本田登上热搜

看完破防了!真是“满载而归”,在G4京港澳高速粤L本田登上热搜

火山詩话
2026-02-22 08:29:48
2026-02-23 17:51:00
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
686715文章数 1017735关注度
往期回顾 全部

科技要闻

腾讯字节,“火拼”漫剧

头条要闻

德国总理默茨将访华

头条要闻

德国总理默茨将访华

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

谷爱凌奶奶去世,谷爱凌泪奔

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

时尚
亲子
健康
旅游
本地

今年春天一定要拥有的针织,这样穿减龄又好看!

亲子要闻

印第安纳预报可能有龙卷风,提前去超市屯点物资,这一车得多少钱

转头就晕的耳石症,能开车上班吗?

旅游要闻

返程前必冲!故宫初六热度拉满,每一处都藏着千年韵味

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

无障碍浏览 进入关怀版