网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

0
分享至


新智元报道

编辑:桃子 定慧

【新智元导读】DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。

就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。


本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。

综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:

  • 编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。

  • 性能突破:V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。

  • 原生搜索:新增了原生「search token」的支持,这意味着搜索的支持更好。

  • 架构创新:线上模型去除「R1」标识,分析称DeepSeek未来有望采用「混合架构」。

  • 成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。

值得一提的是,官方群中强调拓展至128K上下文,此前V3版本就已经支持。


对于这波更新,大家的热情可谓是相当高涨。

即便还未公布模型卡,DeepSeek V3.1就已经在Hugging Face的趋势榜上排到了第四。



DeepSeek粉丝数已破8万

看到这里,网友们更期待R2的发布了!


混合推理,编程击败Claude 4

这次最明显的变化是,DeepSeek在官方APP和网页端上,把深度思考(R1)中的「R1」去掉了。


同时,与V3-base相比,DeepSeek V3.1新增了四个特殊Token:

  • <|search▁begin|> (id: 128796)

  • <|search▁end|> (id: 128797)

  • (id: 128798)

  • (id: 128799)


对此,有推测认为,这可能暗示推理模型与非推理模型的融合。


在编程方面,根据网友曝出的结果,DeepSeek V3.1在Aider Polyglot多语言编程测试中拿下了71.6%高分,一举击败了Claude 4 Opus、DeepSeek R1。


而且,它的成本仅1美元,成为非推理模型中的SOTA。


最鲜明的对比,V3.1编程性能比Claude 4高1%,成本要低68倍。


在SVGBench基准上,V3.1实力仅次于GPT-4.1-mini,远超DeepSeek R1的实力。


在MMLU多任务语言理解方面,DeepSeek V3.1毫不逊色于GPT-5。不过在,编程、研究生级基准问答、软件工程上,V3.1与之有一定的差距。


一位网友实测,模拟六边形中小球自由落体的物理测试,DeepSeek V3.1理解力明显提升。


一手实测

第一时间,我们对V3.1进行了实测,首先是此次模型更新的重点:上下文长度。

假设对于中文而言,1个token ≈ 1–1.3个汉字,那么这128K tokens ≈ 100,000–160,000汉字。

相当于整本《红楼梦》正文(约80–100万字)的1/6–1/8,或者一篇超长博士论文/大部头学术专著

实际测试也很准确,DeepSeek告诉我们它只能阅读差不多9%,也就是大约十分之一。


由于总结内容太长,我们截取了前三回,你觉得这个总结的怎么样?


在128K上下文测试中,DeepSeek-V3.1输出速度相比以往获得较大提升,并且在工程上做了一些优化。


此次更新,DeepSeek重点强调了对上下文的支持。

整个活,给DeepSeek-V3.1上点压力,让它根据「梦」这个字,输出尽可能多的内容,尽量达到上下文极限。


不过最后,差不多只输出了3000字左右,模型就停止了输出。


再来看下推理能力。

经典的9.11和9.9比大小问题,两种询问方式都能正确做答。

这次更新的一大体感还是速度变快了很多。


最后再来看看编程能力。

DeepSeek的上一个模型是R1-0528,主打的是编程能力。

看看这次V3.1是否有更大的提升。


最终结果只能说,打个80分吧,基本要求都满足了,但是画面风格和颜色变换功能并没有完美实现。


并且和R1-0528的结果相比,两者之间还是有些差距的,但孰好孰坏还需看个人偏好。

以下是开启思考模式后的结果,你觉得哪个更好?


接下来,看看DeepSeek V3.1能否复刻出GPT-5发布会上的法语学习小程序。

我们再来让V3.1画一个自己的SVG自画像,两种效果着实有些抽象。




参考资料:HYX

https://weibo.com/2169039837/Q0FC4lmeo

https://x.com/karminski3/status/1957928641884766314

https://github.com/johnbean393/SVGBench/

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1949年,解放军首长怒扇“警察”耳光,拉着3车炮弹硬闯香山,结果营长坐牢,教导员撤职

1949年,解放军首长怒扇“警察”耳光,拉着3车炮弹硬闯香山,结果营长坐牢,教导员撤职

历史回忆室
2026-01-13 21:53:15
欧篮联警告NBA不得继续接触欧洲俱乐部,否则将采取法律行动

欧篮联警告NBA不得继续接触欧洲俱乐部,否则将采取法律行动

懂球帝
2026-01-14 00:25:08
军事专家李莉并没有清空作品

军事专家李莉并没有清空作品

难得君
2026-01-13 11:46:20
韦东奕没想到,2026刚开始,官媒高调官宣王虹喜讯,终于等到这天

韦东奕没想到,2026刚开始,官媒高调官宣王虹喜讯,终于等到这天

蜉蝣说
2026-01-11 17:50:23
雷军:小米SU7目前二手车保值率为80.1%,居行业头部水平

雷军:小米SU7目前二手车保值率为80.1%,居行业头部水平

鞭牛士
2026-01-13 19:07:05
我国004型航母将是世界上最大的核动力航母

我国004型航母将是世界上最大的核动力航母

起喜电影
2026-01-14 08:15:59
3人很致命!火箭57-60公牛:史密斯5中2得6分1篮板!

3人很致命!火箭57-60公牛:史密斯5中2得6分1篮板!

运筹帷幄的篮球
2026-01-14 10:13:56
成都天亿大厦268户购房人遥遥无期的办证之路

成都天亿大厦268户购房人遥遥无期的办证之路

微宜宾
2026-01-12 20:10:27
美最怕中俄驰援伊朗,不惜得罪100多国!若被判非法,或赔数万亿

美最怕中俄驰援伊朗,不惜得罪100多国!若被判非法,或赔数万亿

知法而形
2026-01-14 10:51:49
许利民奇葩单外援,主场以89:85险胜倒数第二江苏队

许利民奇葩单外援,主场以89:85险胜倒数第二江苏队

大眼瞄世界
2026-01-14 10:55:42
比大帝出勤率还低!拿着360万在76人养老,还深受爱戴,羡煞保罗

比大帝出勤率还低!拿着360万在76人养老,还深受爱戴,羡煞保罗

你的篮球频道
2026-01-13 15:26:37
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

丞丞故事汇
2025-12-28 00:13:54
郑丽文罕见爆粗口,为声援蔡正元!各方撑腰到了,马英九团队表态

郑丽文罕见爆粗口,为声援蔡正元!各方撑腰到了,马英九团队表态

来科点谱
2026-01-08 09:03:36
女人染上“性瘾”是一种怎样的体验?可能和你想象得不同

女人染上“性瘾”是一种怎样的体验?可能和你想象得不同

纸上的心语
2025-11-23 11:36:00
朱雨玲夺冠24小时内现丑闻,孙颖莎王曼昱被波及

朱雨玲夺冠24小时内现丑闻,孙颖莎王曼昱被波及

琨玉秋霜
2026-01-14 01:05:00
电影《马腾你别走》在京首映

电影《马腾你别走》在京首映

中国青年报
2026-01-11 21:39:31
德国也没想到,樊振东留洋夺冠不到10天,就又在德国掀起了新高潮

德国也没想到,樊振东留洋夺冠不到10天,就又在德国掀起了新高潮

阿讯说天下
2026-01-13 16:56:42
仗打了1000多天,世界各国才反应过来:中俄不结盟才是最优选择

仗打了1000多天,世界各国才反应过来:中俄不结盟才是最优选择

知法而形
2026-01-14 10:00:49
老太太退休金2.2万,每月给儿子2万,饭桌上儿媳突然说:妈,以后给8千就行。儿子却掀翻了桌子!

老太太退休金2.2万,每月给儿子2万,饭桌上儿媳突然说:妈,以后给8千就行。儿子却掀翻了桌子!

诗词世界
2026-01-14 06:04:07
合川刨猪宴后续:捣乱女子恶行曝光,全网社死,文旅酒厂双封杀

合川刨猪宴后续:捣乱女子恶行曝光,全网社死,文旅酒厂双封杀

观察鉴娱
2026-01-13 10:47:17
2026-01-14 11:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14327文章数 66456关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

李在明谈中日韩三国合作重要性 高市早苗一句不提中国

头条要闻

李在明谈中日韩三国合作重要性 高市早苗一句不提中国

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

"死了么"App爆火:流量来了 困境未解

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

房产
手机
本地
公开课
军事航空

房产要闻

又一新校开建!海口这一片区,迎来教育重磅升级!

手机要闻

网易年度数码榜解读,苹果、vivo、OPPO等机型全上榜

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美再发安全警告 敦促美公民立即离开伊朗

无障碍浏览 进入关怀版