网易首页 > 网易号 > 正文 申请入驻

DeepSeek 更新了,我更期待量化版

0
分享至

大家好,我是 Ai 学习的老章

昨天大模型世界很热闹,其实最近新模型一直不断,尤其是 Qwen,中间我也有测试,时间紧张没有发文

DeepSeek-V3.1-Terminus

这是 V3.1 的一次小升级,核心应该是解决之前爆出的“极”bug 还有多语言混在问题

DeepSeek-V3.1 上线后,有用户反馈在用 API 调用模型时,会偶尔出现一个严重 Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一 Bug 的代码,很可能导致编译失败。

基准

DeepSeek-V3.1

DeepSeek-V3.1-Terminus

无工具使用推理模式

MMLU-Pro

84.8

85.0

GPQA-Diamond

80.1

80.7

huanity's last test

15.9

21.7

LiveCodeBench

74.8

74.9

Codeforces

2091

2046

Aider-Polyglot

76.3

76.1

代理工具使用

BrowseComp

30.0

38.5

BrowseComp-zh

49.2

45.0

SimpleQA

93.4

96.8

SWE Verified

66.0

68.4

SWE-bench 多语言

54.5

57.8

Terminal-bench

31.3

36.7

Terminius 最突出的表现是Agent 能力,Code Agent 与 Search Agent 的表现都有提高。

不过,眼见的网友应该发现了,升级后的模型在 Codeforces 和 Aider-Polyglot 这两个编程相关的竞技场上的表现居然都有小幅下降。不过无伤大雅,最起码修复“极”bug 后可用性大幅增加。

目前访问https://chat.deepseek.com/就是最新的 Terminius 模型了

模型也已开源:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus


模型文件 689 GB!

这玩意太大,本地部署我是玩不转,我有一台 500GB 内存的超级电脑准备 llama.cpp 纯内存模型启动一下量化模型试试。

不过这要等到 unsloth 放出 Terminius 量化版模型之后了,我还是蛮强期待的。 unsloth 之前的V3.1量化版号称:

  • 1 位 Dynamic 量化 DeepSeek-V3.1 从671GB 压缩至 192GB(体积减少 75%),其无思考模式性能超越 GPT-4.1(2025 年 4 月版)、GPT-4.5 和 DeepSeek-V3-0324。

  • 3 位Unsloth DeepSeek-V3.1(思考模式)GGUF:性能超越 Claude-4-Opus(思考模式)。

最后,V4 国庆节会来吗?以往惯例,每逢佳节,DeepSeek必发新模型。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
和原配斗了5年拿5亿分手费退场,向太:她是我见过最强悍的小三

和原配斗了5年拿5亿分手费退场,向太:她是我见过最强悍的小三

上官晚安
2025-11-20 01:39:51
走路出现这7种迹象,寿命可能长不了!第5个尤其凶险

走路出现这7种迹象,寿命可能长不了!第5个尤其凶险

资说
2025-11-14 10:47:02
细说郭伟学术造假骗局始末

细说郭伟学术造假骗局始末

智慧生活笔记
2025-11-20 05:59:39
国民党二号人物,毛主席唯独不接受他投降,老蒋坦言也想干掉他

国民党二号人物,毛主席唯独不接受他投降,老蒋坦言也想干掉他

云霄纪史观
2025-11-19 16:48:47
大阪府前知事:派官员赴华解释的瞬间,日本已经“输了”

大阪府前知事:派官员赴华解释的瞬间,日本已经“输了”

中国青年报
2025-11-19 16:07:30
日经225指数涨幅扩大至4%

日经225指数涨幅扩大至4%

证券时报
2025-11-20 09:05:03
曾医生有两个很大的优点:一是主动,二是温柔。

曾医生有两个很大的优点:一是主动,二是温柔。

柏林观察
2025-11-08 13:41:35
俄罗斯什么时候会停止战争?没钱打仗的时候

俄罗斯什么时候会停止战争?没钱打仗的时候

山河路口
2025-11-16 12:44:41
广东模特大赛冠军诞生后,我笑死在评论区

广东模特大赛冠军诞生后,我笑死在评论区

清书先生
2025-11-19 16:02:32
王成兼任宁波市委书记,哪些城市“一把手”目前由省委副书记高配兼任?

王成兼任宁波市委书记,哪些城市“一把手”目前由省委副书记高配兼任?

极目新闻
2025-11-20 19:57:05
427:1!美国会通过重大决定,特朗普的大丑闻,这次可能兜不住了

427:1!美国会通过重大决定,特朗普的大丑闻,这次可能兜不住了

博览历史
2025-11-19 18:39:18
雷军真的急了,恨不得把心挖出来给大家看

雷军真的急了,恨不得把心挖出来给大家看

科技头版Pro
2025-11-18 15:04:34
联合国聚齐193成员,美国支持日本入常,中俄反对,韩国让人意外

联合国聚齐193成员,美国支持日本入常,中俄反对,韩国让人意外

史料布籍
2025-11-19 22:48:46
真猛!20日上午,山东又摘2金2银1铜,领先第2名10枚:蝉联稳了?

真猛!20日上午,山东又摘2金2银1铜,领先第2名10枚:蝉联稳了?

萌兰聊个球
2025-11-20 12:05:22
女子登山背包和滑雪服挂吊牌被网友质疑“吊牌姐”,当事人:系商品自带牌子和失联儿童寻亲卡

女子登山背包和滑雪服挂吊牌被网友质疑“吊牌姐”,当事人:系商品自带牌子和失联儿童寻亲卡

极目新闻
2025-11-20 12:31:02
佳木斯市委书记丛丽已任黑龙江省政府党组成员

佳木斯市委书记丛丽已任黑龙江省政府党组成员

澎湃新闻
2025-11-20 17:58:26
胡彦斌与易梦玲无直接商业关联

胡彦斌与易梦玲无直接商业关联

雷达财经
2025-11-20 17:52:48
跑到全国第4!22岁跨栏女神:绝不会去当网红 放弃清北是担心毕业

跑到全国第4!22岁跨栏女神:绝不会去当网红 放弃清北是担心毕业

风过乡
2025-11-20 06:30:04
糖尿病离世的人越来越多!医生多次苦劝:少吃西红柿,多吃这6物

糖尿病离世的人越来越多!医生多次苦劝:少吃西红柿,多吃这6物

健身狂人
2025-11-12 14:10:12
再这样下去,中国孩子就完了?央媒发文痛批这一现象

再这样下去,中国孩子就完了?央媒发文痛批这一现象

新东方
2025-11-19 15:27:54
2025-11-20 21:28:49
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3202文章数 11070关注度
往期回顾 全部

科技要闻

马云发话了:冲第一

头条要闻

天合光能:与霸王茶姬尚未有任何关联交易或商业合作

头条要闻

天合光能:与霸王茶姬尚未有任何关联交易或商业合作

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

中央要求增加地方自主财力 有哪些动作

汽车要闻

AI驱动内容营销新纪元 2026网易年度新车总评榜揭晓

态度原创

数码
手机
旅游
健康
本地

数码要闻

路由器卖1299元还能爆,华为「日照金山」出圈全靠长得好看?

手机要闻

魅族科技确认不搬新总部:魅族科技大楼租期还很长,会一直陪大家

旅游要闻

佳木斯游客集散中心设计方案斩获大奖

警惕超声报告这六大"坑"

本地新闻

卖力整活儿的大湾鸡,靠疯癫成了新顶流

无障碍浏览 进入关怀版