网易首页 > 网易号 > 正文 申请入驻

DeepSeek发布新版本模型:优化推理效率,API降价超50%

0
分享至

DeepSeek发布新版本模型,调用API成本降低超50%。

9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。

值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋位于署名之列。

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
京圈隐形富婆曝光:宋丹丹百亿家底,陈丽华550亿,刘嘉玲9亿房产

京圈隐形富婆曝光:宋丹丹百亿家底,陈丽华550亿,刘嘉玲9亿房产

子芫伴你成长
2026-04-23 23:15:49
他今年58岁了,你敢信?!

他今年58岁了,你敢信?!

健身迷
2026-04-13 09:34:17
广东3消息!胡明轩正式发声,徐昕回应直面杜锋,徐杰获MVP候选

广东3消息!胡明轩正式发声,徐昕回应直面杜锋,徐杰获MVP候选

多特体育说
2026-04-25 11:24:28
史上最大规模化债,已经开始!坚持了30年的信仰,进入倒计时

史上最大规模化债,已经开始!坚持了30年的信仰,进入倒计时

律法刑道
2026-04-26 08:44:05
可惜,大s永远不会知道了,到最后,护着她两个孩子的是婆婆张兰

可惜,大s永远不会知道了,到最后,护着她两个孩子的是婆婆张兰

喜欢历史的阿繁
2026-04-25 10:15:34
片酬不少拿,演啥啥不行的“戏混子”明星,求求放过观众眼睛吧!

片酬不少拿,演啥啥不行的“戏混子”明星,求求放过观众眼睛吧!

橙星文娱
2026-04-26 10:32:05
医生1分钟复位收100元被举报,卫健委回怼:应收110,你还少给了!家长拒缴溜走!

医生1分钟复位收100元被举报,卫健委回怼:应收110,你还少给了!家长拒缴溜走!

医客
2026-04-23 12:09:21
为艺术突破边界!艾丽西亚·维坎德的6部大尺度电影,好看又养眼

为艺术突破边界!艾丽西亚·维坎德的6部大尺度电影,好看又养眼

影唠安利社
2026-04-26 10:12:55
“张雪的机车”,账号被封禁!

“张雪的机车”,账号被封禁!

营销报
2026-04-07 13:54:34
比罗伯逊更重要!利物浦若卖走这位 3000 万天才,芬威就是真糊涂

比罗伯逊更重要!利物浦若卖走这位 3000 万天才,芬威就是真糊涂

澜归序
2026-04-26 06:15:08
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
傅首尔暴瘦引全网质疑:自律vs高科技?对比颜如晶,不怪网友怀疑

傅首尔暴瘦引全网质疑:自律vs高科技?对比颜如晶,不怪网友怀疑

老吴教育课堂
2026-04-26 01:55:21
现金行贿真的查不到?纪委不靠流水锁定证据,贪腐者别再痴心妄想

现金行贿真的查不到?纪委不靠流水锁定证据,贪腐者别再痴心妄想

芳姐侃社会
2026-04-24 22:35:09
100 日元兑 4.33 元:日本用三十年,把自己熬成了 “廉价国家”

100 日元兑 4.33 元:日本用三十年,把自己熬成了 “廉价国家”

深析古今
2026-03-31 10:10:57
五指山舰女兵受访“一问三不知”,没被骂反被夸,真实原因太戳人

五指山舰女兵受访“一问三不知”,没被骂反被夸,真实原因太戳人

奇思妙想草叶君
2026-04-24 17:11:11
克莱犯满离场!TMZ:马冬梅亲承已和克莱分手 尊重和信任是底线

克莱犯满离场!TMZ:马冬梅亲承已和克莱分手 尊重和信任是底线

画夕
2026-04-26 07:12:19
中国再破世界第一!化学合成粮食即将量产,不用种地粮食自由了

中国再破世界第一!化学合成粮食即将量产,不用种地粮食自由了

历史甄有趣
2026-04-25 06:00:17
俄朝图们江上第二座桥已建成,将于6月通车

俄朝图们江上第二座桥已建成,将于6月通车

名人苟或
2026-04-26 07:02:25
一天一个价!多款电脑集体涨价,店员透露:27日以后会大幅涨价

一天一个价!多款电脑集体涨价,店员透露:27日以后会大幅涨价

极目新闻
2026-04-24 18:58:46
80岁丧偶独居至104岁,不靠子女养老院独自终老一生

80岁丧偶独居至104岁,不靠子女养老院独自终老一生

君笙的拂兮
2026-04-25 17:14:53
2026-04-26 11:36:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
892093文章数 5090417关注度
往期回顾 全部

科技要闻

涨价浪潮下,DeepSeek推动AI“价格战”

头条要闻

牛弹琴:伊朗放了美国人鸽子 特朗普被气坏了

头条要闻

牛弹琴:伊朗放了美国人鸽子 特朗普被气坏了

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《八千里路云和月》大结局意难平

财经要闻

DeepSeek V4背后,梁文锋的转身

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

教育
亲子
房产
公开课
军事航空

教育要闻

校长领导力三要素:品德为基,思想为核,行动为要

亲子要闻

早上叫孩子起床,记住三说,三不说

房产要闻

新一轮教育大爆发来了!海口,开始疯狂建学校!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗总统:不会在压力、威胁下进行谈判

无障碍浏览 进入关怀版