网易首页 > 网易号 > 正文 申请入驻

实测DeepSeek新模型“翻车”:能一次性处理百万字的《三体》,却回答不好洗车问题?

0
分享至



出品|搜狐科技

作者|郑松毅

编辑|杨 锦

DeepSeek 新版模型进入灰度测试阶段,或为V4正式版上线前的收官测试。

近日,不少DeepSeek用户反馈,打开App后收到了1.7.4版本更新提示,更新后可体验到一款全新测试版模型。一时间,相关实测反馈在社交平台、技术社区刷屏,网友们争相晒出体验感受,这场未发公告的灰度测试,迅速点燃了行业对DeepSeek新一代模型的期待。


新模型是V4吗?

当搜狐科技向DeepSeek模型确认时,模型坦言自己不是大家期待的V4,也没有V3.2这也的特定子名称,更像是一个持续进化的“最新版”。


据网友及媒体实测,此次测试版模型的升级堪称“跨越式”,核心亮点集中在长上下文处理、知识时效性、和推理效率。

最值得一提的莫过于上下文窗口的扩容,从原有128K Token直接跃升至1M Token,接近10倍的提升,意味着模型可一次性完整处理《三体》三部曲这类超长文本,解决了老版本长文档分段处理的繁琐问题。

知识时效性的更新同样值得关注。实测显示,新模型的知识库已更新至2025年5月,相较于老版本2024年8月的截止日期,新增了近一年的静态知识,在回答相关事件时,无需联网便可给出准确细节。

有实测用户反馈,新模型的编程和推理能力亦有提高,“用其开发个人博客网站,代码完成度、美观性均高于老版本,甚至表现优于Claude 4.5等同代竞品。”数学推理方面,复杂题目推理的稳定性显著提升。



犯了一个其他AI都会犯的错

尽管升级亮点拉满,但在最近爆火的为难AI测试题上,搜狐科技实测DeepSeek新模型还是有点“翻车”——“ 想洗车,我家距离洗车店只有50米,你建议我开车去还是走路去?”


嗯?绕了一圈不还是得把车开去?小有遗憾,期待更新后的更优解法。

对于大家都在期待的V4旗舰版模型,DeepSeek新模型指出,V4规划为万亿参数级别的下一代模型,因训练复杂度高、体量巨大,发布已较原计划推迟,仍在研发后期。

结合野村证券最新发布的报告来看,V4预计于2026年2月中旬推出,核心价值在于通过架构创新推动商业化落地,将引入更完整的mHC与Engram架构,在编程、推理等能力上实现更大突破,甚至有望超越Anthropic Claude及OpenAI GPT系列同代模型。

行业人士分析,DeepSeek此时推出测试版模型,一方面是为了收集用户反馈,优化架构与功能,为V4的正式发布铺路;另一方面也是为了在市场中巩固优势——随着更多玩家入局,DeepSeek V3系列的市场份额已较去年有所下滑,此次升级可进一步强化其在长上下文、中文理解、成本控制上的优势。

值得注意的是,就在上周,DeepSeek在多个平台放出大规模招聘信息,进一步为新模型迭代及V4旗舰版的猜测增添了佐证。

据公开招聘信息显示,该公司当前有22个在招职位,覆盖北京、杭州两大核心城市,岗位布局聚焦于大模型研发与商业化落地,涵盖深度产品经理、客户端研发工程师、全栈开发工程师、深度学习研究员等核心技术岗。


从招聘规格来看,此次招聘诚意十足,实行14薪制度,多数岗位起薪超3万元,其中深度学习研究员(AGI方向)月薪高达8万元,年薪最高可达112万元,就连AGI大模型实习生的日薪也在500元至1000元之间,月薪可过万。

行业人士推测,DeepSeek此次大规模高薪招兵买马,一方面是为了补齐当前测试版模型优化迭代的人才缺口,另一方面是为V4的研发与商业落地储备力量。这场招聘与新模型灰度测试的时间高度重叠,很难说是偶然,反而从侧面印证了DeepSeek正加速推进大模型布局,V4的亮相或许已箭在弦上。



运营编辑 |曹倩




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
京沪厦一个都躲不掉!广东队惨遭王博“做局”,杜锋总决赛没戏了

京沪厦一个都躲不掉!广东队惨遭王博“做局”,杜锋总决赛没戏了

绯雨儿
2026-04-03 12:39:24
朝鲜宣布停用中国卫星,改用俄罗斯卫星,无形中帮了中国一个忙

朝鲜宣布停用中国卫星,改用俄罗斯卫星,无形中帮了中国一个忙

花寒弦絮
2026-04-04 00:48:59
一夜变天!日本可造5500枚核弹,导弹覆盖中国,人民日报一针见血

一夜变天!日本可造5500枚核弹,导弹覆盖中国,人民日报一针见血

纪中百大事
2026-04-04 10:11:17
成都一母婴店突然闭店,涉400余人约百万元充值款

成都一母婴店突然闭店,涉400余人约百万元充值款

黄河新闻网吕梁
2026-04-03 17:05:27
秦慧珠:国民党即便不与大陆交流仍会被“抹红”,不能因怕被攻击就不交流

秦慧珠:国民党即便不与大陆交流仍会被“抹红”,不能因怕被攻击就不交流

海峡导报社
2026-04-03 10:21:12
张曼玉,在农村养鸡!

张曼玉,在农村养鸡!

宛沐
2026-04-03 09:30:08
女人开窍的三个步骤:无情、无相、无我

女人开窍的三个步骤:无情、无相、无我

洞见
2026-04-03 09:24:47
杜兰特轰25+6胜爵士!火箭成功转型,全队30助+三分47%,迎5连胜

杜兰特轰25+6胜爵士!火箭成功转型,全队30助+三分47%,迎5连胜

你的篮球频道
2026-04-04 10:22:02
想撤都晚了!伊朗亮万枚家底,美军吓得光身逃跑,三面死围以色列

想撤都晚了!伊朗亮万枚家底,美军吓得光身逃跑,三面死围以色列

通鉴史智
2026-04-04 10:18:01
可能又阵亡一个中将!前线俄军的困惑:乌克兰军工业怎么越炸越强

可能又阵亡一个中将!前线俄军的困惑:乌克兰军工业怎么越炸越强

鹰眼Defence
2026-04-03 16:03:52
公安部“点名”张雪,释放三个强烈信号,字字说到中年人心坎里

公安部“点名”张雪,释放三个强烈信号,字字说到中年人心坎里

趣味八卦
2026-04-03 07:40:18
烟火伴锋芒,深情渡余生!张雪峰的爱情故事很浪漫

烟火伴锋芒,深情渡余生!张雪峰的爱情故事很浪漫

史海流年号
2026-04-03 08:25:33
没想到,李荣浩心中这口恶气竟让人民日报给出了,网友:就该封杀

没想到,李荣浩心中这口恶气竟让人民日报给出了,网友:就该封杀

乐天闲聊
2026-04-03 05:35:52
吴伯雄坦言现在台海局势比2005年还严峻,期许郑丽文大陆行一定要成功

吴伯雄坦言现在台海局势比2005年还严峻,期许郑丽文大陆行一定要成功

海峡导报社
2026-04-04 07:33:01
既没有胜利,也没有繁荣,更没有联邦

既没有胜利,也没有繁荣,更没有联邦

寰宇大观察
2026-04-03 15:07:02
突发!天津“史上最严”新政落地,4月2日起实施!

突发!天津“史上最严”新政落地,4月2日起实施!

天津族
2026-04-04 07:34:25
炸锅了!恩佐因逆天采访被切尔西禁赛两场,库库发牢骚却幸免

炸锅了!恩佐因逆天采访被切尔西禁赛两场,库库发牢骚却幸免

仰卧撑FTUer
2026-04-03 20:50:02
中国铁建8位高管被带走调查

中国铁建8位高管被带走调查

地产微资讯
2026-04-03 10:27:32
上海市中心这幢楼,深陷“群租困局”!物业称“管不了”,相关部门回应

上海市中心这幢楼,深陷“群租困局”!物业称“管不了”,相关部门回应

新民晚报
2026-04-03 19:45:55
赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

芳芳历史烩
2026-03-23 03:53:23
2026-04-04 11:20:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4760文章数 9185关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

美军两架战机被击落又有两架直升机被击中 特朗普发声

头条要闻

美军两架战机被击落又有两架直升机被击中 特朗普发声

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

阚清子口碑赢了!全开麦跑调拒绝重唱

财经要闻

刘纪鹏:只盼长慢牛,巩固4000点是关键

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

艺术
时尚
手机
亲子
军事航空

艺术要闻

宋楚瑜题字引争议,“丑书风”到底有多火?你怎么看!

Softfit穿搭火了,穿出春日松弛感和氛围美

手机要闻

扛不住了!小米官宣涨价,小米:我们尽力了!

亲子要闻

高吸收锌硒片哪家强?2026 十大硒片深度测评,成分含量全解析

军事要闻

俄国防部:一架苏-30战机在克里米亚坠毁

无障碍浏览 进入关怀版