网易首页 > 网易号 > 正文 申请入驻

DeepSeek发布新版本模型:优化推理效率,API降价超50%

0
分享至

DeepSeek发布新版本模型,调用API成本降低超50%。

9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。

值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋位于署名之列。

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨玉环陵墓出土,专家打开棺椁后发现,千年前的“传言”或被证实

杨玉环陵墓出土,专家打开棺椁后发现,千年前的“传言”或被证实

浩渺青史
2026-05-02 22:49:18
内娱太上皇,破产了?

内娱太上皇,破产了?

独立鱼
2026-05-05 21:16:47
以为我在“洗白”安禄山,你错了,这才是历史上真实的安禄山

以为我在“洗白”安禄山,你错了,这才是历史上真实的安禄山

抽象派大师
2026-04-25 18:46:59
太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

橙星文娱
2026-04-17 13:19:56
4-0横扫!埃梅里神了:率队成功翻盘,挺进决赛,目标直指冠军

4-0横扫!埃梅里神了:率队成功翻盘,挺进决赛,目标直指冠军

足球狗说
2026-05-08 04:57:35
商业航天概念再度拉升 航天发展等十余股涨停

商业航天概念再度拉升 航天发展等十余股涨停

财联社
2026-05-08 13:57:17
贵州省交通运输厅原一级巡视员章征宇

贵州省交通运输厅原一级巡视员章征宇

汲古知新
2026-05-08 12:47:53
被刻意抹去的二把手——拆解《人民的名义》中最反现实的政治留白

被刻意抹去的二把手——拆解《人民的名义》中最反现实的政治留白

动物奇奇怪怪
2026-05-08 02:27:03
孙铭徽缺阵致命!CBA最惨烈肉搏战,山西准绝杀复仇旧敌

孙铭徽缺阵致命!CBA最惨烈肉搏战,山西准绝杀复仇旧敌

一点点想法
2026-05-08 16:03:48
英国法院裁定两中国公民有罪,外交部:典型的政治闹剧

英国法院裁定两中国公民有罪,外交部:典型的政治闹剧

澎湃新闻
2026-05-08 15:36:34
我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

我敢说,大部分会跟我一样,选择黑色衣服那个女孩!

草莓解说体育
2026-04-12 17:05:01
清朝“大辫子”到底多脏?满头油光,虱子满头,十步之内不能站人

清朝“大辫子”到底多脏?满头油光,虱子满头,十步之内不能站人

云霄纪史观
2026-05-07 20:06:19
男大学生被狗咬了后意外离世,母亲哭诉生前已打5针疫苗

男大学生被狗咬了后意外离世,母亲哭诉生前已打5针疫苗

纸鸢奇谭
2026-02-10 11:13:06
吴石牺牲后,主席很后悔:最大错误就是没集中两个野战军攻打台湾

吴石牺牲后,主席很后悔:最大错误就是没集中两个野战军攻打台湾

兴趣知识
2026-05-05 16:02:25
狂飙至34℃!刚刚确认:明天起,连续五天!大范围影响浙江

狂飙至34℃!刚刚确认:明天起,连续五天!大范围影响浙江

鲁中晨报
2026-05-08 13:34:11
张康阳现状证明,不怕富二代躺平就怕有野心,仅5年千亿身价归零

张康阳现状证明,不怕富二代躺平就怕有野心,仅5年千亿身价归零

青杉依旧啊啊
2026-03-19 22:10:26
4只1035元天价皮皮虾事件反转?官方回复:未超调控价,游客:没收到退款

4只1035元天价皮皮虾事件反转?官方回复:未超调控价,游客:没收到退款

上观新闻
2026-05-07 20:24:15
上海男篮昨日已抵达济南,明日的比赛,可能不会给山东机会的

上海男篮昨日已抵达济南,明日的比赛,可能不会给山东机会的

梅亭谈
2026-05-08 13:18:57
“自由”每一天,枪“劫”美利坚 | 新漫评

“自由”每一天,枪“劫”美利坚 | 新漫评

中国网
2026-05-07 21:10:08
女孩体验“悬崖秋千”坠亡,曾有网友3月预言“一年内准出事”......

女孩体验“悬崖秋千”坠亡,曾有网友3月预言“一年内准出事”......

新民周刊
2026-05-07 17:31:40
2026-05-08 16:56:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
894576文章数 5090755关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

沙特翻脸突然对美军关闭领空 特朗普连忙打电话都没用

头条要闻

沙特翻脸突然对美军关闭领空 特朗普连忙打电话都没用

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

一觉醒来,美伊又打起来了

汽车要闻

智能双舱大五座SUV 乐道L80将于5月15日正式上市

态度原创

本地
教育
艺术
手机
健康

本地新闻

用苏绣的方式,打开江西婺源

教育要闻

高考倒计时一个月,南京航空航天大学校长邀约全国高考学子

艺术要闻

探索施密德的油画,感受无法抵挡的艺术魅力!

手机要闻

某厂骁龙2nm新机配置全曝光:2nm+2亿像素,或为荣耀Magic 9系列

干细胞治烧烫伤能用了么?

无障碍浏览 进入关怀版