网易首页 > 网易号 > 正文 申请入驻

实测DeepSeek新模型“翻车”:能一次性处理百万字的《三体》,却回答不好洗车问题?

0
分享至



出品|搜狐科技

作者|郑松毅

编辑|杨 锦

DeepSeek 新版模型进入灰度测试阶段,或为V4正式版上线前的收官测试。

近日,不少DeepSeek用户反馈,打开App后收到了1.7.4版本更新提示,更新后可体验到一款全新测试版模型。一时间,相关实测反馈在社交平台、技术社区刷屏,网友们争相晒出体验感受,这场未发公告的灰度测试,迅速点燃了行业对DeepSeek新一代模型的期待。


新模型是V4吗?

当搜狐科技向DeepSeek模型确认时,模型坦言自己不是大家期待的V4,也没有V3.2这也的特定子名称,更像是一个持续进化的“最新版”。


据网友及媒体实测,此次测试版模型的升级堪称“跨越式”,核心亮点集中在长上下文处理、知识时效性、和推理效率。

最值得一提的莫过于上下文窗口的扩容,从原有128K Token直接跃升至1M Token,接近10倍的提升,意味着模型可一次性完整处理《三体》三部曲这类超长文本,解决了老版本长文档分段处理的繁琐问题。

知识时效性的更新同样值得关注。实测显示,新模型的知识库已更新至2025年5月,相较于老版本2024年8月的截止日期,新增了近一年的静态知识,在回答相关事件时,无需联网便可给出准确细节。

有实测用户反馈,新模型的编程和推理能力亦有提高,“用其开发个人博客网站,代码完成度、美观性均高于老版本,甚至表现优于Claude 4.5等同代竞品。”数学推理方面,复杂题目推理的稳定性显著提升。



犯了一个其他AI都会犯的错

尽管升级亮点拉满,但在最近爆火的为难AI测试题上,搜狐科技实测DeepSeek新模型还是有点“翻车”——“ 想洗车,我家距离洗车店只有50米,你建议我开车去还是走路去?”


嗯?绕了一圈不还是得把车开去?小有遗憾,期待更新后的更优解法。

对于大家都在期待的V4旗舰版模型,DeepSeek新模型指出,V4规划为万亿参数级别的下一代模型,因训练复杂度高、体量巨大,发布已较原计划推迟,仍在研发后期。

结合野村证券最新发布的报告来看,V4预计于2026年2月中旬推出,核心价值在于通过架构创新推动商业化落地,将引入更完整的mHC与Engram架构,在编程、推理等能力上实现更大突破,甚至有望超越Anthropic Claude及OpenAI GPT系列同代模型。

行业人士分析,DeepSeek此时推出测试版模型,一方面是为了收集用户反馈,优化架构与功能,为V4的正式发布铺路;另一方面也是为了在市场中巩固优势——随着更多玩家入局,DeepSeek V3系列的市场份额已较去年有所下滑,此次升级可进一步强化其在长上下文、中文理解、成本控制上的优势。

值得注意的是,就在上周,DeepSeek在多个平台放出大规模招聘信息,进一步为新模型迭代及V4旗舰版的猜测增添了佐证。

据公开招聘信息显示,该公司当前有22个在招职位,覆盖北京、杭州两大核心城市,岗位布局聚焦于大模型研发与商业化落地,涵盖深度产品经理、客户端研发工程师、全栈开发工程师、深度学习研究员等核心技术岗。


从招聘规格来看,此次招聘诚意十足,实行14薪制度,多数岗位起薪超3万元,其中深度学习研究员(AGI方向)月薪高达8万元,年薪最高可达112万元,就连AGI大模型实习生的日薪也在500元至1000元之间,月薪可过万。

行业人士推测,DeepSeek此次大规模高薪招兵买马,一方面是为了补齐当前测试版模型优化迭代的人才缺口,另一方面是为V4的研发与商业落地储备力量。这场招聘与新模型灰度测试的时间高度重叠,很难说是偶然,反而从侧面印证了DeepSeek正加速推进大模型布局,V4的亮相或许已箭在弦上。



运营编辑 |曹倩




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
开评:沪指跌0.44% 有色金属板块跌幅居前

开评:沪指跌0.44% 有色金属板块跌幅居前

证券时报
2026-02-13 09:51:07
赶在春节前,中国加速增兵!高市急着发话,1亿多日本人面临选择

赶在春节前,中国加速增兵!高市急着发话,1亿多日本人面临选择

贾文彬的史书
2026-02-13 11:25:28
iPhone 17e下周正式登场:3999元起+A19芯片,苹果史上最狠入门机

iPhone 17e下周正式登场:3999元起+A19芯片,苹果史上最狠入门机

小柱解说游戏
2026-02-12 15:18:50
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
5年连换9位教练!“自毁型”马赛,谈何挑战大巴黎?

5年连换9位教练!“自毁型”马赛,谈何挑战大巴黎?

足球报
2026-02-13 11:51:42
汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

长星寄明月
2026-01-20 21:00:46
陈玉珍谢龙介等人被起诉, 罗智强揭赖清德的恶毒算计:让你选不了

陈玉珍谢龙介等人被起诉, 罗智强揭赖清德的恶毒算计:让你选不了

海峡导报社
2026-02-13 11:22:02
平台喊冤:10%抽成恐难覆盖成本!代表回怼:不能总让司机买单!

平台喊冤:10%抽成恐难覆盖成本!代表回怼:不能总让司机买单!

夕阳渡史人
2026-02-11 09:55:09
14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

14亿人都不会忘却!揭开核酸大王张核子的真面具:权力变现大公

大鱼简科
2026-02-07 09:52:29
辽宁盘锦一鞭炮摊失火,目击者:看了半小时烟花爆竹

辽宁盘锦一鞭炮摊失火,目击者:看了半小时烟花爆竹

极目新闻
2026-02-12 13:07:43
42岁陈妍希离婚后“美貌升级”!意外带火“红衣搭白裙”让人心动

42岁陈妍希离婚后“美貌升级”!意外带火“红衣搭白裙”让人心动

明星私服穿搭daily
2026-02-13 11:09:34
朝鲜战争表面上是中国赢得的,但实际上是一个巨大的损失

朝鲜战争表面上是中国赢得的,但实际上是一个巨大的损失

安安说
2026-02-02 12:18:03
难难难,公司宣布全员降薪!

难难难,公司宣布全员降薪!

黯泉
2026-02-11 23:13:51
现货白银直线跳水跌超10%

现货白银直线跳水跌超10%

财联社
2026-02-13 00:29:14
遗憾!林孝埈小组倒1出局+无缘1000米决赛:成绩在其他组可排第1

遗憾!林孝埈小组倒1出局+无缘1000米决赛:成绩在其他组可排第1

风过乡
2026-02-13 07:58:40
马斯克谈Seedance 2.0:发展速度太快

马斯克谈Seedance 2.0:发展速度太快

财联社
2026-02-12 13:40:07
谷爱凌:我不赢还变成不正常了,那多难,怎么可能?

谷爱凌:我不赢还变成不正常了,那多难,怎么可能?

懂球帝
2026-02-12 23:07:06
花旗集团中国区总裁及花旗银行(中国)有限公司行长、执行董事张文杰发表新春畅想

花旗集团中国区总裁及花旗银行(中国)有限公司行长、执行董事张文杰发表新春畅想

新浪财经
2026-02-12 19:31:54
明明是“戏混子”,却被捧成实力派,这3位演员看来真的被高估了

明明是“戏混子”,却被捧成实力派,这3位演员看来真的被高估了

別甾虛僞
2026-02-13 10:23:35
以为改名就能红,结果是越改越糊,这5位多次改名的明星好心酸

以为改名就能红,结果是越改越糊,这5位多次改名的明星好心酸

上官晚安
2026-02-12 11:33:26
2026-02-13 12:08:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4690文章数 9178关注度
往期回顾 全部

科技要闻

DeepSeek更新后被吐槽变冷变傻?

头条要闻

中戏院长落马不足两个月 两任表演系主任主动投案

头条要闻

中戏院长落马不足两个月 两任表演系主任主动投案

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

米兰冬奥摘银 谷爱凌再遭美国网友网暴

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

最大续航703km!全新奔驰纯电GLC 350 L即将国产

态度原创

房产
亲子
教育
公开课
军事航空

房产要闻

999元开线上免税店?海南爆出免税大骗局,多人已被抓!

亲子要闻

国家卫健委:今年全国计划新增15万个普惠托位

教育要闻

直角隐圆模型,一个视频学明白!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国新交付F35隐身战机没雷达

无障碍浏览 进入关怀版