网易首页 > 网易号 > 正文 申请入驻

DeepSeek发布新版本模型:优化推理效率,API降价超50%

0
分享至


DeepSeek发布新版本模型,调用API成本降低超50%。

9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。

值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。


除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋位于署名之列。

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白宫发布特朗普与企鹅走向格陵兰岛AI图片!丹麦国防部称“北极耐力”军演将持续到2026年底

白宫发布特朗普与企鹅走向格陵兰岛AI图片!丹麦国防部称“北极耐力”军演将持续到2026年底

每日经济新闻
2026-01-24 13:18:06
2-1到0-1!中国队先赢后输,亚足联给出数据对比,日本夺冠稳了?

2-1到0-1!中国队先赢后输,亚足联给出数据对比,日本夺冠稳了?

侃球熊弟
2026-01-24 00:25:03
《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

诗词中国
2026-01-23 18:47:36
陆挺建议逐渐将农民养老金上调至每月千元

陆挺建议逐渐将农民养老金上调至每月千元

经济观察报
2026-01-23 19:21:30
越南球迷在亚足联官媒刷屏:请日本揍中国队10-0 他们只会摆大巴

越南球迷在亚足联官媒刷屏:请日本揍中国队10-0 他们只会摆大巴

风过乡
2026-01-24 17:17:13
出大事了!中国收到“战书”,这次不是美国,中方已经做好准备

出大事了!中国收到“战书”,这次不是美国,中方已经做好准备

爱吃醋的猫咪
2026-01-23 20:27:00
广州交警公布一起典型事故:电动自行车驾驶人违规被撞致死,其承担事故全部责任,小车司机无责

广州交警公布一起典型事故:电动自行车驾驶人违规被撞致死,其承担事故全部责任,小车司机无责

大风新闻
2026-01-24 17:42:04
央视曝光!真别再吃了!头皮发麻!市监局通报40批食品抽检不合格

央视曝光!真别再吃了!头皮发麻!市监局通报40批食品抽检不合格

蜉蝣说
2026-01-24 12:45:07
停车11分钟收费16元,车主抱怨收费太贵不合理;市监部门回应:市场自由定价,有公示不算违规

停车11分钟收费16元,车主抱怨收费太贵不合理;市监部门回应:市场自由定价,有公示不算违规

大风新闻
2026-01-24 17:12:03
特朗普通告全球,不许减持美国国债;中方还剩6830亿,游戏已结束

特朗普通告全球,不许减持美国国债;中方还剩6830亿,游戏已结束

科普100克克
2026-01-23 18:25:17
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
“计划有变,准备夺冠”!决战日本,U23国足主帅表态:想拿冠军!球员们决赛前剪了新发型,称“就是想赢”,此前被列为赛事第四档球队

“计划有变,准备夺冠”!决战日本,U23国足主帅表态:想拿冠军!球员们决赛前剪了新发型,称“就是想赢”,此前被列为赛事第四档球队

每日经济新闻
2026-01-24 15:37:08
李湘王诗龄被曝已经跑路,妄图用外籍身份扯保护旗,逃脱法律制裁

李湘王诗龄被曝已经跑路,妄图用外籍身份扯保护旗,逃脱法律制裁

花哥扒娱乐
2026-01-24 16:06:55
世界正在淘汰「优秀」的孩子

世界正在淘汰「优秀」的孩子

蓝橡树
2026-01-22 14:27:16
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
【汽车人】埃安香港增幅登顶:广汽全球化战略的“超级跳板”

【汽车人】埃安香港增幅登顶:广汽全球化战略的“超级跳板”

汽车人传媒
2026-01-24 10:32:12
U23亚洲杯中日平均身高对比:国足181.96cm,比对手高1.39cm

U23亚洲杯中日平均身高对比:国足181.96cm,比对手高1.39cm

懂球帝
2026-01-24 11:00:08
炸场!杨兰兰澳洲当庭低头,车祸案藏三大反转,特权与法律的博弈

炸场!杨兰兰澳洲当庭低头,车祸案藏三大反转,特权与法律的博弈

戗词夺理
2026-01-24 16:27:37
太丢脸了!一男子武汉理工毕业,当保安月薪3800元,称被学校约谈

太丢脸了!一男子武汉理工毕业,当保安月薪3800元,称被学校约谈

火山诗话
2026-01-24 12:25:19
中央军委副主席张又侠、中央军委联合参谋部参谋长刘振立,涉嫌严重违纪违法被立案审查调查

中央军委副主席张又侠、中央军委联合参谋部参谋长刘振立,涉嫌严重违纪违法被立案审查调查

都市快报橙柿互动
2026-01-24 15:11:09
2026-01-24 20:24:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
872910文章数 5087406关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

胖东来金饰每克便宜200元被抢爆 有人拖着行李箱去买

头条要闻

胖东来金饰每克便宜200元被抢爆 有人拖着行李箱去买

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

李微漪更新:狼王格林去世,3字泪目

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

健康
教育
亲子
游戏
军事航空

耳石脱落为何让人天旋地转+恶心?

教育要闻

父母越唠叨 家里就越旺

亲子要闻

亲爱滴告诉你,我有许多小淘气

《光环2》重制版传闻曝光:无多人模式 新增冲刺机制

军事要闻

俄美乌首次三方会谈在阿联酋举行

无障碍浏览 进入关怀版