网易首页 > 网易号 > 正文 申请入驻

迈向智能体时代的第一步!DeepSeek V3.1发布,上下文扩展至128K,影响有多大?

0
分享至

国产大模型公司深度求索旗下DeepSeek低调上新,多领域能力提升。

8月21日下午,DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。8月20日晚间,DeepSeek低调上线DeepSeek V3.1,此次升级推出的新功能引发广泛关注,V3.1已在HuggingFace趋势榜排名第三。

据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

在技术架构层面,V3.1继承了DeepSeekV3系列的关键技术,包括MLA、MoE等,参数量与V3版本相同。

DeepSeekV3.1最引人注目的升级之一是将上下文窗口从原有的64k扩展至128k,意味着其可以处理更长篇幅的文档和代码,并在回答内容上进一步增加信息,提供更多细节,语气更为活泼。

从官方APP和网页端的显示来看,DeepSeek去掉了“深度思考(R1)”中的“R1”标识。同时,与V3-base相比,DeepSeekV3.1新增了四个特殊Token。虽然目前DeepSeek官方尚未发布任何关于这一改动的消息,有推测认为,这可能暗示着推理模型R系列与非推理模型V系列的融合,以此实现GPU资源复用。

同时,V3.1在编程任务中表现突出。根据社区使用Aider测试数据,V3.1在AiderPolyglot多语言编程测试中,拿下了71.6%的高分,超越了Claude4Opus和DeepSeekR1等模型。在SVGBench基准测试中,其实力仅次于GPT-4.1-mini,远超DeepSeekR1。

DeepSeek方面表示,V3.1在多项搜索评测指标上也取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。

在多语言支持方面,V3.1也进行了明显的能力优化,目前能处理超过100种语言,尤其优化了亚洲语言和资源较少语种的运用。

此外,V3.1在Token使用量方面较0324版本下降约13%,每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一,具有节约成本的优势。

值得注意的是,DeepSeek也宣布,9月6日凌晨起,对DeepSeek开放平台 API 接口调用价格进行调整并取消夜间时段优惠。输入:0.5元/百万tokens(缓存命中),4元/百万tokens(缓存未命中);输出:12元/百万tokens。今年2月,DeepSeek曾经宣布,北京时间每日 00:30 至 08:30 的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API 调用价格大幅下调:DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更低至 25%。V3标准时间段收费为:输入:0.5元/百万tokens(缓存命中),2元/百万tokens(缓存未命中);输出:8元/百万tokens。

DeepSeek新模型一经推出,便在技术社区拥有超高人气和受关注度,一举冲到HuggingFace趋势榜第三。

不过,虽然V3.1在多个方面有进步,但部分功能体验也受到网友诟病。多名测试者反馈,V3.1在数学推理、逻辑分析等综合推理任务中无明显进步,甚至在部分场景下表现不及旧版,也未看到“幻觉”问题的改善迹象,还出现了“中英文混杂”的新问题。在一些特定领域,如研究生级基准问答、软件工程的某些复杂场景中,与顶尖模型如GPT-5相比仍有一定差距。

在其他大模型方面,市场竞争依然激烈,动作频出。OpenAI筹划万亿级AI基建、Meta计划再次重组其AI业务、智谱发布手机AgentAutoGLM2.0……根据ArtificialAnalysis最新大模型排名榜单,DeepSeek已从昔日“领跑”变为“中游”水平,OpenAI、Google、阿里巴巴等竞争对手跃至前位。

虽然自DeepSeek-R1推理大模型发布后,圈内始终对DeepSeek保持高度关注,期待其继续成为国产“黑马”,但其长期的“沉默”,也确实带来了用户的流失,QuestMobile在《2025年二季度AI应用价值榜》中提到,DeepSeek月均下载量从第一季度的8111.3万猛降至2258.9万,下滑超过70%。活跃用户规模方面,从2025年3月的1936.1万降至6月的1629.5万,下滑趋势明显。

近日,有市场传言称,DeepSeek R2有望在8月15日至30日期间发布。8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。

尽管官方流量下滑,但DeepSeek仍有市场潜力,其开源模型被腾讯、字节跳动、阿里、百度等众多第三方平台广泛接入,据估算有超过70%的DeepSeek模型调用量发生在这些第三方平台。Token消耗量上,DeepSeek系列7月31日单日总Token用量达到70.5B,6月29日单日总Token用量达到54B,环比增长接近31%。

第三方机构onelittleweb分析显示,就其全球市场表现而言,DeepSeek模型以3.96%的市场份额在全球AI聊天机器人中综合评分排名第五,年度访问量达27.4亿次。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊媒:伊朗若遭美国地面入侵将打击曼德海峡

伊媒:伊朗若遭美国地面入侵将打击曼德海峡

参考消息
2026-03-26 11:02:08
丞相是丞相,宰相是宰相,两者一字之差却天壤之别,可别分不清楚

丞相是丞相,宰相是宰相,两者一字之差却天壤之别,可别分不清楚

观史搜寻着
2026-03-26 01:10:50
理解城市 | 开封文旅原来这样“火”

理解城市 | 开封文旅原来这样“火”

澎湃新闻
2026-03-26 12:58:34
美伊谈崩内幕:伊万卡是“肉票”,特朗普女婿是“以色列内线”?

美伊谈崩内幕:伊万卡是“肉票”,特朗普女婿是“以色列内线”?

瞩望云霄
2026-03-25 18:20:59
揭开美国粮价低的真面目!他们骗人的鬼把戏终于被揭穿了!

揭开美国粮价低的真面目!他们骗人的鬼把戏终于被揭穿了!

老范谈史
2026-03-25 22:45:51
出大事了,以色列新计划曝光,联合国急呼停火,第一个反抗者出现

出大事了,以色列新计划曝光,联合国急呼停火,第一个反抗者出现

李健政观察
2026-03-26 17:00:52
国际油价涨幅扩大 布伦特原油期货站上105美元/桶

国际油价涨幅扩大 布伦特原油期货站上105美元/桶

每日经济新闻
2026-03-26 15:11:37
国内航线燃油费4月5日上涨

国内航线燃油费4月5日上涨

21世纪经济报道
2026-03-26 19:23:14
新加坡预测:印度将赶中超美!美印争世界老大,中国将成新阿三

新加坡预测:印度将赶中超美!美印争世界老大,中国将成新阿三

荷兰豆爱健康
2026-03-26 08:26:08
省长刘捷在台州专题调研开发区高质量发展工作

省长刘捷在台州专题调研开发区高质量发展工作

台州发布
2026-03-26 20:57:28
韩媒臆想:中国队欢呼吧,国际足联同意他们替补世界杯

韩媒臆想:中国队欢呼吧,国际足联同意他们替补世界杯

体坛风之子
2026-03-26 07:00:06
金智媛现身宝格丽米兰大秀站C位,刘亦菲惨沦配角,尴尬表情曝光

金智媛现身宝格丽米兰大秀站C位,刘亦菲惨沦配角,尴尬表情曝光

流云随风去远方
2026-03-26 18:36:05
伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

老马拉车莫少装
2026-03-26 00:02:39
美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

霁寒飘雪
2026-03-26 09:54:09
终于知道广东人为啥不抑郁了!网友:西医叫抑郁,中医叫郁结

终于知道广东人为啥不抑郁了!网友:西医叫抑郁,中医叫郁结

另子维爱读史
2026-03-25 22:34:08
长期静养与每天锻炼的人,谁更长寿?调查36383名老人,给出答案

长期静养与每天锻炼的人,谁更长寿?调查36383名老人,给出答案

39健康网
2026-03-11 20:11:03
2025年演唱会票房最高的10位歌手排行榜,这些歌手太赚钱了!

2025年演唱会票房最高的10位歌手排行榜,这些歌手太赚钱了!

小椰的奶奶
2026-03-26 08:40:13
乌克兰摧毁俄罗斯最大的基里希炼油厂!俄最大港口持续燃烧

乌克兰摧毁俄罗斯最大的基里希炼油厂!俄最大港口持续燃烧

项鹏飞
2026-03-26 21:13:57
萨巴伦卡赢郑钦文后吃100美元汉堡 顶奢!鱼子酱+金箔碎她说超好吃

萨巴伦卡赢郑钦文后吃100美元汉堡 顶奢!鱼子酱+金箔碎她说超好吃

劲爆体坛
2026-03-26 08:10:23
因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

混沌录
2026-03-24 23:03:10
2026-03-26 22:51:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
885217文章数 5089155关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
数码
教育
艺术
军事航空

旅游要闻

探访资中文旅新地标 邂逅千年古城的诗与远方

数码要闻

Intel IBOT加速技术揭秘!硬件不变 白嫖22%游戏性能

教育要闻

骂人没有杀伤力?那不是白忙活吗?

艺术要闻

哪一座桥不是风景?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版