网易首页 > 网易号 > 正文 申请入驻

编程表现超越Claude和GPT?DeepSeek准备第二次震惊全世界

0
分享至



去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。

但据多位知情人士透露,DeepSeek即将重登王座。他们计划在二月中旬发布新一代模型DeepSeek-V4。

也就是农历2026年新年期间,距离上一代模型DeepSeek-R1的发布正好一年。

这次发布的重点是代码生成和处理能力。

根据DeepSeek内部的基准测试,V4在编程任务上的表现超过了目前市场上的主流竞品,包括Anthropic的Claude和OpenAI的GPT系列。

根据报道,在即将发布的新模型中,DeepSeek团队解决了许多长期困扰AI发展的技术难题。很可能会彻底改变Vibe Coding产业。

01

报道中提到一件事,“DeepSeek-V4模型在整个训练过程中理解数据模式的能力也有所改进,且性能未出现衰减。”

这句话有些难以理解,我们不妨拆开来解读。

首先是前半句,它指的是模型不再只是死记硬背数据,而是能看透数据背后的规律和逻辑。

DeepSeek-R1有个具代表性的例子,就是让模型数strawberry里有几个r。

由于当时的DeepSeek模型并不能理解“数”(count)这个概念,只能根据训练时的数据来输出答案。可这个数据恰好又是错的,所以无论DeepSeek怎么思考,它给出的答案大多数情况都是2,而不是正确的3。



而DeepSeek-V4则会彻底杜绝这个情况,前提是在训练过程中,让模型彻底理解某一件事情。

后半句的性能退化,指的是在AI训练中,随着模型不断学习新东西或训练时间加长,往往会出现“学了新的忘了旧的”或者模型变得不稳定的情况。

这种现象在业内被称为“灾难性遗忘”(Catastrophic Forgetting)或“模型坍塌”(Model Collapse)。

因此,V4在不断变聪明、变复杂的过程中,依然保持了极高的稳定性和原有能力的完整性,没有出现任何“副作用”或能力倒退。

这恰恰是构建编程Agent的前置条件。

在现代软件工程中,一个微小的修改可能波及数个文件、数千行代码的依赖关系。

但是以往的模型往往受限于上下文窗口或注意力机制的衰减,从而没办法对于庞大的项目进行修改。

V4极有可能是一个为“Agent时代”量身定制的模型。

一年前,DeepSeek-R1 的发布确实在行业内引起了不小的波动。那款主打推理能力的模型证明了低成本研发路径的可行性。

然而一年后的今天,人工智能行业的关注焦点已经发生了显著转移。单纯的文本生成或逻辑推理已不再是唯一的竞争高地,代码生成正在演变为大模型能力的“试金石”。

在当前的开发环境中,“Vibe Coding”成为新趋势,要求AI不仅能补全代码,更能理解开发者的意图流(Flow),实现从自然语言到复杂工程逻辑的无缝转化。

DeepSeek似乎已经准备好在新赛道上狂飙了。

02

如果深入梳理DeepSeek团队以及核心人物梁文锋在R1发布之后这一年里的学术轨迹,我们会发现一条清晰且扎实的技术演进路线。

这些公开发表的论文与技术报告,不仅是对过去成果的总结,更是V4强大能力的注脚与预演。

2025年9月,DeepSeek-R1的相关论文成功登上了顶级学术期刊《Nature》的封面,梁文锋署名通讯作者。

面对审稿人关于是否使用了OpenAI模型输出进行蒸馏训练的尖锐质疑,DeepSeek团队在回应中给出了明确的否认,并首次公开了令人咋舌的低成本数据:从V3-Base训练到R1,仅花费了29.4万美元。

当然,这个成本仅指R1的后训练阶段成本,不包含V3-Base基础模型本身约600万美元的训练投入。

数据公开后,以及《Nature》为此专门撰写的社论,标志着DeepSeek在学术严谨性和技术原创性上获得了国际最高认可,彻底洗刷了外界对于中国大模型“套壳”或“跟随”的刻板印象。

不过,真正能佐证DeepSeek-V4在代码方面有大幅突破的证据,是2025年最后一天,DeepSeek团队发表的论文《mHC:流形约束超连接》。

代码生成任务对模型的逻辑深度和上下文跨度有着极高的要求,这通常需要更大规模的模型参数和更深的网络结构。

然而,传统的超连接(Hyper-Connections)架构在模型规模扩大时,会面临严重的信号增益问题,最终导致训练过程极不稳定甚至崩溃。

为了解决这一阻碍模型扩容的根本性物理难题,DeepSeek团队在这篇论文中提出了一种全新的架构mHC。

简单来说,它给狂奔的信号加了一道精密的阀门,将信号增益严格控制在1.6倍左右。

论文数据显示,在3B、9B乃至18B参数规模的模型测试中,应用了mHC架构的模型在BIG-BenchHard推理基准上提升了2.1%。

这项由梁文锋联合署名的研究成果,实际上解决了大模型在“做大”和“做复杂”过程中的稳定性难题。

这意味着V4模型极有可能采用了这种全新的架构,从而在拥有更庞大参数量和更深层推理能力的同时,依然保持了高效的训练效率和极高的稳定性。



不仅如此,在2026年1月初,DeepSeek悄无声息地将arXiV上的R1论文从原本的22页大幅扩充至86页。

这多出来的60多页内容,详尽地披露了R1的完整训练管线,包括冷启动、推理导向的强化学习(RL)、拒绝采样与再微调、以及对齐导向的强化学习这四个关键步骤。

业界普遍推测,这种在春节前夕“清库存”式的技术披露,往往预示着下一代更强大的技术已经成熟。

既然R1的技术细节已经不再是核心壁垒,那么即将到来的V4必然拥有了更高维度的护城河。

03

就在2026年的元旦,另一股来自量化界的力量也加入了战局。

由九坤投资创始团队发起成立的至知创新研究院(IQuestResearch),发布了名为IQuest-Coder-V1的开源代码大模型。我们曾在文章《又是量化基金,第二个DeepSeek时刻到来了?》中对其进行了报道。

这支同样出身于量化背景的团队,他们仅有40B参数的模型,在SWE-benchVerified测试中斩获了81.4%的高分,一举达到了Claude和ChatGPT的水平。

而在Vibe Coding的战场上,国内互联网大厂的动作同样不容小觑。

字节跳动的豆包在2025年初就推出了Trae编程工具,并在AI编程功能上实现了HTML预览、Python运行和完整项目生成等能力,让开发者可以在一个界面内完成从构思到部署的全流程。

阿里的通义千问则在12月26日更新到了Qwen Code v0.5.0版本。

此次更新的最大亮点就是支持在终端窗口中同时运行四个Qwen Code实例,可并行处理智能问答、实时翻译、原型设计、创意绘图等不同任务,实现了AI编程“跳出命令行”的突破。

不过,真正引发行业震动的,是豆包在硬件终端上的突破性尝试。

2025年12月1日,字节跳动与中兴通讯合作推出了搭载豆包手机助手的努比亚M153工程样机,售价3499元,首批约3万台在当天迅速售罄,甚至在二手市场炒出了高价。

这款手机助手的核心能力在于跨应用操作。用户只需用自然语言下达指令,AI就能自动跳转多个应用完成点外卖、订机票、比价购物等复杂任务。

这一系列动作背后,折射出的是AI大模型从云端走向终端、从工具走向入口的战略转型。

说不定DeepSeek手机也不远了。



与此同时,资本市场也迎来了大模型行业的收获季。

曾经历过“百模大战”喧嚣的中国AI行业,正在加速向头部收敛。智谱AI和MiniMax这两家公司均已成功上市。

智谱是1月8日在港交所敲的钟,发行价定在116.2港元/股,上市第一天就给了市场一个惊喜 —— 开盘120港元,收盘131.5港元,第一天就涨了13.17%,市值一下子冲到578.9亿港元,成了 “全球大模型第一股”。

第二天开盘直接137.2港元起,收盘158.6港元,较首日收盘价又涨了20.6%,市值也跟着涨到698.21亿港元,两天下来从发行价算已经涨了快37%,完全没给空头机会。

MiniMax比智谱晚一天,但风头更劲。发行价165港元/股,而且是顶格定价,上市前一天的暗盘就已经涨了25%-29%,报205.60-212.60港元。

上市当天开盘235.4港元,涨了42.7%,之后一路飙升,盘中最高到351.8港元,最终收盘345港元,较发行价暴涨 109.09%,市值来到1054亿港元,成了千亿市值俱乐部新成员。

虽然高额的研发投入使得两家公司目前仍处于亏损状态,但强劲的增长曲线证明了市场对于高质量AI模型的付费意愿正在形成。

中国AI方兴未艾,但当全球目光已经再次聚焦到DeepSeek身上。一年前那个用低成本路径颠覆行业认知的团队,即将在春节期间交出新的答卷。

DeepSeek能否第二次“震惊全世界”,只要再等几天就会知晓。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
死了白死?俄方绝口不提贝加尔湖惨剧赔偿 中日美此类案例都有赔款

死了白死?俄方绝口不提贝加尔湖惨剧赔偿 中日美此类案例都有赔款

劲爆体坛
2026-02-28 18:30:13
中国男篮vs中国台北时间已定!CCTV5直播,省队球员赛前放出狠话

中国男篮vs中国台北时间已定!CCTV5直播,省队球员赛前放出狠话

篮球专区
2026-02-28 20:36:42
杉杉集团破产,事实证明:美女主持人只会排节目,对管理无能为力

杉杉集团破产,事实证明:美女主持人只会排节目,对管理无能为力

晨光苏醒a
2026-02-27 06:33:24
1秒3亿、单日突破10亿!老铺黄金创下天猫大促最快销售纪录

1秒3亿、单日突破10亿!老铺黄金创下天猫大促最快销售纪录

财闻
2026-02-27 15:05:28
重庆高速公路集团,穆军任上被查,曾任两江新区最大国企董事长

重庆高速公路集团,穆军任上被查,曾任两江新区最大国企董事长

新浪财经
2026-02-28 20:20:04
美伊开战,却被中国卫星盯死!“天眼”24小时扫描,美军零秘密

美伊开战,却被中国卫星盯死!“天眼”24小时扫描,美军零秘密

书纪文谭
2026-02-28 19:28:21
大S一对子女去医院探望马筱梅,11岁玥儿抱小弟弟的画面好温馨!

大S一对子女去医院探望马筱梅,11岁玥儿抱小弟弟的画面好温馨!

娱乐团长
2026-02-27 12:27:55
美军上尉回忆:志愿军冲入阵地后,拿刺刀捅死看到的每一个美国兵

美军上尉回忆:志愿军冲入阵地后,拿刺刀捅死看到的每一个美国兵

阿器谈史
2026-02-26 17:42:09
太扎心!过了40岁已经死了,只是没人埋,80后发千字肺腑之言…

太扎心!过了40岁已经死了,只是没人埋,80后发千字肺腑之言…

慧翔百科
2026-02-28 08:52:23
美国以色列偷袭伊朗,意图斩首哈梅内伊!

美国以色列偷袭伊朗,意图斩首哈梅内伊!

胜研集
2026-02-28 15:36:36
新加坡大满贯赛:大捷报!林昀儒4:1淘汰世界亚军,晋级男单4强

新加坡大满贯赛:大捷报!林昀儒4:1淘汰世界亚军,晋级男单4强

国乒二三事
2026-02-28 19:55:46
吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

吃兰州拉面的人为什么越来越少了?网友:进店小心翼翼的怕说错话

另子维爱读史
2026-02-27 20:31:34
忍无可忍无需再忍!台海发生激烈对峙中方出动军机澳舰狼狈窜逃

忍无可忍无需再忍!台海发生激烈对峙中方出动军机澳舰狼狈窜逃

通鉴史智
2026-02-28 09:38:48
澳门的赌台,大面积关停!不是没人去,而是被“算法”割废的?

澳门的赌台,大面积关停!不是没人去,而是被“算法”割废的?

水泥土的搞笑
2026-02-27 17:09:36
卡塔尔受导弹攻击,暂时关闭领空!卡塔尔航空暂停全部航班,飞机纷纷返航备降!去年一幕要重演了

卡塔尔受导弹攻击,暂时关闭领空!卡塔尔航空暂停全部航班,飞机纷纷返航备降!去年一幕要重演了

新浪财经
2026-02-28 19:11:54
新加坡大满贯赛:太遗憾!世界冠军陈幸同0:4被淘汰,无缘女单4强

新加坡大满贯赛:太遗憾!世界冠军陈幸同0:4被淘汰,无缘女单4强

国乒二三事
2026-02-28 18:52:21
以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

以色列已经告诉世界:日本若敢拥有核武器,美国并不会第一个翻脸

八斗小先生
2025-12-26 09:33:27
伊朗军队最高指挥官被击毙

伊朗军队最高指挥官被击毙

桂系007
2026-02-28 18:25:45
小米上架米家燃气灶3猛火版,到手价899元

小米上架米家燃气灶3猛火版,到手价899元

ZAEKE知客
2026-02-27 12:41:13
水利部长傅作义无实际职权,副部长代替签字,周总理:一律无效

水利部长傅作义无实际职权,副部长代替签字,周总理:一律无效

兴趣知识
2026-02-27 22:03:38
2026-02-28 22:24:49
字母榜 incentive-icons
字母榜
让未来不止于大。
2254文章数 8044关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

87岁哈梅内伊对拉里贾尼委以重任 还建立完整继承体系

头条要闻

87岁哈梅内伊对拉里贾尼委以重任 还建立完整继承体系

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

疑似王一博被爆私密聊天记录

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

艺术
本地
时尚
公开课
军事航空

艺术要闻

就是这个画风,美的我有点儿接受不了!

本地新闻

津南好·四时总相宜

发现4种春季很衬肤色的办法,照着穿

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国以色列联合袭击伊朗 实时战况

无障碍浏览 进入关怀版