网易首页 > 网易号 > 正文 申请入驻

降价!DeepSeek,大消息!

0
分享至

大消息。

9月29日,DeepSeek宣布,正式发布DeepSeek-V3.2-Exp模型。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

据了解,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

近期,DeepSeek动作不断。9月22日,DeepSeek小助手在官方社群中称,DeepSeek线上模型已升级,当前版本号DeepSeek-V3.1-Terminus。8月21日,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。据DeepSeek介绍,V3.1主要包含三大变化:一是采用混合推理架构,一个模型同时支持思考模式与非思考模式;二是具有更高的思考效率,能在更短时间内给出答案;三是具有更强的智能体能力,通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。

此外,9月17日,在最新一期的国际权威期刊Nature(自然)中,DeepSeek-R1推理模型研究论文登上了封面。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者,首次公开了仅靠强化学习就能激发大模型推理能力的重要研究成果。这是中国大模型研究首次登上Nature封面,也是全球首个经过完整同行评审并发表于权威期刊的主流大语言模型研究,标志着中国AI技术在国际科学界获得最高认可。

Nature在其社论中评价道:“几乎所有主流的大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破。”

综合自:DeepSeek、证券时报此前报道

责编:李丹

校对:陶谦

版权声明

" Type="normal"@@-->

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes

" Type="normal"@@-->

END

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳首次以市委、市政府名义表彰企业家和企业

深圳首次以市委、市政府名义表彰企业家和企业

南方都市报
2025-11-01 16:00:13
中央公开通报当天,中国信息协会表态:严肃问责相关负责人

中央公开通报当天,中国信息协会表态:严肃问责相关负责人

新京报
2025-11-01 17:00:07
“教授8万副教授7万博士6万”:部分高校职称晋升现“金钱游戏”,教师横向课题考核催生造假产业链

“教授8万副教授7万博士6万”:部分高校职称晋升现“金钱游戏”,教师横向课题考核催生造假产业链

红星新闻
2025-10-31 21:35:21
不到2天卷走129亿!又一平台暴雷,200万人被坑惨,主使逃往国外

不到2天卷走129亿!又一平台暴雷,200万人被坑惨,主使逃往国外

史行途
2025-11-01 18:05:07
打胎小生被大佬玩到脱G!墨镜导演让女明星陪大佬!

打胎小生被大佬玩到脱G!墨镜导演让女明星陪大佬!

八卦疯叔
2025-11-01 14:20:03
确实廉颇老矣了!保罗在回归快船后并没有起到很好的效果?

确实廉颇老矣了!保罗在回归快船后并没有起到很好的效果?

稻谷与小麦
2025-11-02 00:02:24
外国妹子从中国电商平台买了盏“可颂灯”,收到后总觉得哪里不对…...咬了一口后惊呆了!

外国妹子从中国电商平台买了盏“可颂灯”,收到后总觉得哪里不对…...咬了一口后惊呆了!

最英国
2025-11-01 17:13:32
王思聪近况有点惨:香港平价餐厅吃饭,一个人好落寞下巴后缩严重

王思聪近况有点惨:香港平价餐厅吃饭,一个人好落寞下巴后缩严重

小娱乐悠悠
2025-10-03 14:13:04
58岁女星自曝曾三度流产,膀胱撕裂致不孕不育,不介意老公出轨

58岁女星自曝曾三度流产,膀胱撕裂致不孕不育,不介意老公出轨

仙味少女心
2025-11-01 00:04:22
活久见!山东一宝马汽车“穿棉袄”,网友:天冷,别冻着我的活爹

活久见!山东一宝马汽车“穿棉袄”,网友:天冷,别冻着我的活爹

火山诗话
2025-11-01 13:41:41
与周迅离婚4年,那个独自跑去美国的前夫高圣远,如今怎么样了?

与周迅离婚4年,那个独自跑去美国的前夫高圣远,如今怎么样了?

暖心萌阿菇凉
2025-10-31 23:42:45
布达诺夫指挥特种部队突袭波克罗夫斯克的俄军,结果失败了

布达诺夫指挥特种部队突袭波克罗夫斯克的俄军,结果失败了

山河路口
2025-11-01 19:56:56
川普宣布重启核试验,俄赶紧澄清:我们不是真的,您别当真

川普宣布重启核试验,俄赶紧澄清:我们不是真的,您别当真

移光幻影
2025-11-01 09:16:35
西班牙足坛传噩耗!38岁队长撞碎书店玻璃身亡,全队取消比赛守灵

西班牙足坛传噩耗!38岁队长撞碎书店玻璃身亡,全队取消比赛守灵

丁丁鲤史纪
2025-11-01 17:44:47
人民日报发声!物业改革多地落地:物业费真降了,这4笔费可拒交

人民日报发声!物业改革多地落地:物业费真降了,这4笔费可拒交

振华观史
2025-10-30 08:27:30
乌克兰摧毁俄罗斯规模最大的变电站!距离莫斯科仅180公里

乌克兰摧毁俄罗斯规模最大的变电站!距离莫斯科仅180公里

项鹏飞
2025-10-31 19:26:03
唐嫣罗晋被曝离婚传闻后,恶心的一幕出现了,答案早已一目了然

唐嫣罗晋被曝离婚传闻后,恶心的一幕出现了,答案早已一目了然

老吴教育课堂
2025-11-01 14:50:25
全球最安全城市排名出炉:旧金山第15,中国未上榜!

全球最安全城市排名出炉:旧金山第15,中国未上榜!

凑近看世界
2025-10-31 14:53:52
见识过令人拍案叫绝的临场反应吗?评论区:我等凡人只有五体投地

见识过令人拍案叫绝的临场反应吗?评论区:我等凡人只有五体投地

夜深爱杂谈
2025-10-31 19:29:00
入睡时间缩短10倍!北大研究揭示:3亿人失眠或是肠道里缺了它

入睡时间缩短10倍!北大研究揭示:3亿人失眠或是肠道里缺了它

思思夜话
2025-10-31 11:52:53
2025-11-02 00:56:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
818989文章数 238337关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

郑丽文:台湾正处于最困难、最危险的时刻

头条要闻

郑丽文:台湾正处于最困难、最危险的时刻

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

前CTO索赔42.87亿 158亿股权归属成谜?

汽车要闻

M3旅行版上市售94.39万元 告别平行进口

态度原创

艺术
亲子
旅游
本地
公开课

艺术要闻

美貌与艺术的碰撞!9位摄影师,哪一位是你的菜?

亲子要闻

后续!新生儿在医院坠床摔成重伤,护工已被停职,孩子状况已好转

旅游要闻

运河明珠,千年守望:杭州拱宸桥的前世今生与文化密码!

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版