网易首页 > 网易号 > 正文 申请入驻

刚刚,DeepSeek发了“终极版”!

0
分享至


智东西
作者 陈骏达
编辑 李水青

DeepSeek又更新了!

智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。

官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。


DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。

DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。


而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。

DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。

开源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了

今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。


▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)

智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。

不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。


▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug

也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。


▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)

智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”

DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。


二、小球弹跳效果惊艳,还能快速交叉搜索信息

除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。

编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。


这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:


在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。

可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。


结语:DeepSeek-V3.1,迎来终极版?

DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。


也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。

此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
朝鲜代表联大发言炮轰日本:日本没有资格和理由觊觎安理会常任理事国席位;此前高市早苗在日本侵略战争、参拜靖国神社等问题上屡触碰红线

朝鲜代表联大发言炮轰日本:日本没有资格和理由觊觎安理会常任理事国席位;此前高市早苗在日本侵略战争、参拜靖国神社等问题上屡触碰红线

极目新闻
2025-11-19 13:18:23
随着山东3-2爆冷河北,全运会女团金牌诞生,孙颖莎2届获四枚银牌

随着山东3-2爆冷河北,全运会女团金牌诞生,孙颖莎2届获四枚银牌

侃球熊弟
2025-11-19 20:03:19
荷兰政府:已暂停对安世半导体的干预

荷兰政府:已暂停对安世半导体的干预

半导体产业纵横
2025-11-19 18:27:31
俄罗斯领空已禁止日本航空飞行,如果中国也禁飞,看它怎么去欧洲

俄罗斯领空已禁止日本航空飞行,如果中国也禁飞,看它怎么去欧洲

我心纵横天地间
2025-11-18 20:07:05
辣眼睛!又是出轨,响水47秒成关键词,某金店女店长登上热搜…

辣眼睛!又是出轨,响水47秒成关键词,某金店女店长登上热搜…

火山诗话
2025-11-19 20:30:15
广东模特冠军的事,后续更加劲爆!

广东模特冠军的事,后续更加劲爆!

麦杰逊
2025-11-19 15:31:05
山东女团夺冠!范思琦仰天怒吼,何卓佳场下自闭,陈梦落泪!

山东女团夺冠!范思琦仰天怒吼,何卓佳场下自闭,陈梦落泪!

篮球资讯达人
2025-11-19 21:49:04
加入CPTPP:关乎未来的“高难度闯关”搏杀

加入CPTPP:关乎未来的“高难度闯关”搏杀

墨心人
2025-11-19 19:42:48
前日军退将曾扬言:若不考虑弹道导弹,日本海自一周全歼中国舰队

前日军退将曾扬言:若不考虑弹道导弹,日本海自一周全歼中国舰队

不掉线电波
2025-11-19 16:31:08
喻恩泰和妻子婚内双出轨,聊天记录不堪入目,妻子约P喜欢大的

喻恩泰和妻子婚内双出轨,聊天记录不堪入目,妻子约P喜欢大的

社会酱
2025-11-19 17:42:35
10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

可达鸭面面观
2025-11-19 08:59:19
中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

新浪财经
2025-11-18 12:46:38
“内部信”风波后,疯狂英语创始人李阳喊话俞敏洪:灌鸡汤不如“一句鸡汤给员工100块钱”

“内部信”风波后,疯狂英语创始人李阳喊话俞敏洪:灌鸡汤不如“一句鸡汤给员工100块钱”

极目新闻
2025-11-19 12:57:02
深圳一模特大赛冠军因突破大众审美认知引发争议,有评委发文称“连评分表都没看到”,一联合主办单位回应只赞助了几千块

深圳一模特大赛冠军因突破大众审美认知引发争议,有评委发文称“连评分表都没看到”,一联合主办单位回应只赞助了几千块

极目新闻
2025-11-19 10:38:42
曝唐嫣罗晋婚变!两人已分居一年半,无商业关联,85花全军覆没

曝唐嫣罗晋婚变!两人已分居一年半,无商业关联,85花全军覆没

叶公子
2025-11-19 16:01:43
陈梦冲看台做闭嘴动作!夺冠后让现场粉丝鸦雀无声,太不给面子了

陈梦冲看台做闭嘴动作!夺冠后让现场粉丝鸦雀无声,太不给面子了

嘴炮体坛
2025-11-19 23:00:25
施一公:这是中国潜伏的最大危机!(发人深省)

施一公:这是中国潜伏的最大危机!(发人深省)

霹雳炮
2025-11-18 20:38:34
中方暂停进口日本水产品 外交部:即使日本水产品向中国出口也不会有市场

中方暂停进口日本水产品 外交部:即使日本水产品向中国出口也不会有市场

每日经济新闻
2025-11-19 17:41:46
日本片突然叫停,切香肠战术来了

日本片突然叫停,切香肠战术来了

贩财局
2025-11-17 17:20:34
又一百年巨头塌了!从技术神话到贴牌代工,网友:买了个牌子壳!

又一百年巨头塌了!从技术神话到贴牌代工,网友:买了个牌子壳!

青眼财经
2025-11-18 23:16:47
2025-11-20 05:27:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10762文章数 116905关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

教育
家居
时尚
数码
本地

教育要闻

lsa伦敦占星学院是什么

家居要闻

水岸美学 书香人文生活

辛芷蕾的炸裂10分钟,让人大受震撼

数码要闻

猫头鹰黑化版散热器风扇来袭

本地新闻

第十二届影展携手重庆来福士丨两江交汇,光影共生

无障碍浏览 进入关怀版