网易首页 > 网易号 > 正文 申请入驻

刚刚,DeepSeek发了“终极版”!

0
分享至


智东西
作者 陈骏达
编辑 李水青

DeepSeek又更新了!

智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。

官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。


DeepSeek官方在微信公众号放出了新旧DeepSeek-V3.1的基准测试对比。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现了0.2%-36.5%不等的表现提升,不过也有些测试成绩出现小幅度下滑。

DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。


而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。

DeepSeek官方App、网页端、小程序与DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现此前的多个Bug,并体验模型的最新性能。

开源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

一、两大神秘Bug消失,DeepSeek-V3.1终于不犯糊涂了

今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。


▲DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)

智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。

不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。


▲DeepSeek-V3-Terminus没有因“高危”提示词而产生Bug

也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。


▲网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)

智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”

DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。


二、小球弹跳效果惊艳,还能快速交叉搜索信息

除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。

编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。


这一模型打造的动画效果也不错,轨迹和碰撞都比较自然:


在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。

可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。


结语:DeepSeek-V3.1,迎来终极版?

DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。


也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确。

此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发特讯!卫星图揭示美军舰载机南海坠毁真相,引爆国际舆论

突发特讯!卫星图揭示美军舰载机南海坠毁真相,引爆国际舆论

青风点评
2025-11-04 01:08:08
老蒋到死都没有想到,最大的卧底不是吴石,而是天天陪他开会的他

老蒋到死都没有想到,最大的卧底不是吴石,而是天天陪他开会的他

凡人侃史
2025-11-03 20:44:59
没悬念?哈兰德只需在16轮进2球,即可打破英超百球最快纪录

没悬念?哈兰德只需在16轮进2球,即可打破英超百球最快纪录

懂球帝
2025-11-04 01:36:06
美交通部长称或因政府“停摆”关闭空域

美交通部长称或因政府“停摆”关闭空域

界面新闻
2025-11-03 22:37:43
贵州黔东南州沉船事故致8死调查报告公布  多人被追责问责

贵州黔东南州沉船事故致8死调查报告公布  多人被追责问责

新京报
2025-11-04 15:45:05
处决吴石,是蒋介石最后悔的决定,也是蒋家王朝走向没落的开始!

处决吴石,是蒋介石最后悔的决定,也是蒋家王朝走向没落的开始!

流云青史
2025-10-28 16:24:50
周末男子带小三去游玩,父亲安慰儿媳:我收拾他,男子回来后傻眼了

周末男子带小三去游玩,父亲安慰儿媳:我收拾他,男子回来后傻眼了

温情邮局
2025-09-08 14:23:26
三战三捷!安世CEO张学政是个狠人,每次转型决策都踏对了

三战三捷!安世CEO张学政是个狠人,每次转型决策都踏对了

白浅娱乐聊
2025-10-29 12:45:30
斯诺克2席16强出炉!斯佳辉轰6-0,吴宜泽德比逆转,火箭救赛点!

斯诺克2席16强出炉!斯佳辉轰6-0,吴宜泽德比逆转,火箭救赛点!

刘姚尧的文字城堡
2025-11-04 17:25:30
跌幅近50%,佛山禅城房价下跌停不下来!网友:这或是保守幅度…

跌幅近50%,佛山禅城房价下跌停不下来!网友:这或是保守幅度…

火山诗话
2025-11-03 12:15:27
最高涨幅13%!税收新政落地首周黄金饰品普遍涨价,板料经营商暂停报价观望市场

最高涨幅13%!税收新政落地首周黄金饰品普遍涨价,板料经营商暂停报价观望市场

财联社
2025-11-04 15:20:16
65岁妇人帮儿子带娃一个月,突遭楼上男邻居持刀杀害;死者亲属:警方说嫌犯有精神病史

65岁妇人帮儿子带娃一个月,突遭楼上男邻居持刀杀害;死者亲属:警方说嫌犯有精神病史

大风新闻
2025-11-04 12:25:06
一鸣惊人!中超12场7球神锋走红,收多家豪门报价,月薪56万嫌少

一鸣惊人!中超12场7球神锋走红,收多家豪门报价,月薪56万嫌少

国足风云
2025-11-04 10:41:23
马洛塔谈出售阿什拉夫:决定很艰难,但为了俱乐部不得不这样

马洛塔谈出售阿什拉夫:决定很艰难,但为了俱乐部不得不这样

懂球帝
2025-11-04 13:15:07
上海地铁大爷强坐女乘客大腿后续:处理结果引争议,网友:别再惯着

上海地铁大爷强坐女乘客大腿后续:处理结果引争议,网友:别再惯着

观察鉴娱
2025-11-03 09:59:43
江苏男孩订婚,未婚妻一脸稚嫩,网友:全家没一个有文凭

江苏男孩订婚,未婚妻一脸稚嫩,网友:全家没一个有文凭

农村情感故事
2025-11-04 14:57:05
官二代高速上殴打宝马车主,一小时后被十几辆装甲车包围

官二代高速上殴打宝马车主,一小时后被十几辆装甲车包围

历史八卦社
2024-09-14 16:48:46
694年一天夜晚,武则天以肚子疼为由,将御医沈南璆叫到宫中诊脉

694年一天夜晚,武则天以肚子疼为由,将御医沈南璆叫到宫中诊脉

百态人间
2025-11-04 05:05:03
是否还像往常一样快乐?莫兰特:没有了

是否还像往常一样快乐?莫兰特:没有了

北青网-北京青年报
2025-11-04 19:19:07
恭喜!杨瀚森翻译已进入开拓者教练组 侧面印证球队对小杨的重视

恭喜!杨瀚森翻译已进入开拓者教练组 侧面印证球队对小杨的重视

醉卧浮生
2025-11-04 17:16:31
2025-11-04 19:36:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10694文章数 116892关注度
往期回顾 全部

科技要闻

硅谷甄嬛传:奥特曼优雅挑衅马斯克狠狠回击

头条要闻

上海一老小区居民因加装电梯引争执 调解时一老人猝死

头条要闻

上海一老小区居民因加装电梯引争执 调解时一老人猝死

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

爸爸去哪儿6孩子现状,个个不同

财经要闻

作价40亿美元!星巴克中国易主

汽车要闻

把海岸诗意织进日常 法拉利Amalfi重塑超跑生活方式

态度原创

房产
艺术
家居
公开课
军事航空

房产要闻

信达·繁花里 | 老照片征集活动 温情启幕

艺术要闻

何镜堂院士出手!广州再添150米新地标

家居要闻

年轻态度 功能舒适兼备

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄最新核潜艇下水 可搭载“末日鱼雷”

无障碍浏览 进入关怀版