过去一年,全球 AI 行业几乎没有真正的“静默期”。
OpenAI 连续发布多代 GPT,Anthropic 的 Claude 快速跻身第一梯队,Google Gemini 高速迭代。硅谷用百亿、千亿美金级别的投入,把大模型竞赛推向白热化。
而就在这样的背景下,一家中国公司显得异常“安静”。
据金融时报报道,DeepSeek V4 预计将于本周正式发布。距离 DeepSeek 上一次发布具有里程碑意义的模型 R1,已经过去了一年多。
这一年里,DeepSeek 没有发布会、没有路演,也很少出现在聚光灯下。但从目前披露的信息来看,V4 并不只是一次常规升级,而更像一次方向性的转向。
不只是升级:V4 是一次多模态与架构选择的合流
从目前流出的信息判断,DeepSeek V4 将是一款原生多模态大模型,支持文本、图片与视频的统一理解与生成。
这意味着,DeepSeek 终于补齐了此前长期被认为是短板的图像与视频能力。在过去,DeepSeek 更像是一位“文字型选手”:推理、代码和数学能力极强,但多模态并非主战场。V4 的出现,显然意在完成这块拼图。
更值得注意的是另一点——芯片适配策略的变化。
多家外媒提到,DeepSeek V4 并未选择在发布前与 英伟达 做深度优化适配,而是优先针对国产 AI 芯片进行调优。这一选择打破了行业惯例。
在过去,几乎所有顶级大模型都会围绕英伟达 GPU 进行性能优化。但 V4 释放出的信号是:即便不以最顶级的 GPU 作为前提,也能跑出一流模型。
客观来说,在预训练阶段,高端 GPU 依然占据主导地位;但如果 V4 在推理阶段实现了对国产芯片的成熟适配,其商业化意义将远超一次模型能力提升。
回看 R1:为什么 DeepSeek 会被反复提起?
要理解 V4 的分量,绕不开去年的 R1。
2025 年 1 月,DeepSeek 几乎“无声”地上线了 R1 推理模型,只附带了一份技术报告。随后发生的事情,至今仍被频繁回顾。
R1 在多项推理基准上达到了与 OpenAI 顶级模型相当甚至更优的水平,而 DeepSeek 公布的训练成本,仅为数百万美元量级。同时,R1 选择了开源。
一周后,DeepSeek App 一度登顶苹果 App Store 免费榜。同一天,美股 AI 板块出现剧烈波动,英伟达单日市值蒸发创下纪录。
那一刻,市场第一次被迫直面一个问题:
★ 如果一家中国公司,能用显著更低的成本,做出同等级别的模型,那巨额基础设施投入的逻辑,还是否成立?静默的一年,其实是系统性铺垫
R1 之后,DeepSeek 并未急于发布“下一代旗舰”,但这一年并非空转。
从 V3 的持续演进、R1 的多次强化,到稀疏注意力、自验证、条件记忆等研究论文的公开,DeepSeek 在做的,是将推理能力、多模态、长上下文与系统架构逐步融合。
从目前披露的研究成果来看,V4 很可能基于:
- 更高效的信息流动结构
- 面向百万级上下文的条件记忆机制
- 推理与工具调用的深度整合
这些能力并不直接体现在“榜单名次”上,却直接决定模型能否进入真实生产环境。
发布前的争议与舆论噪声
在 V4 即将发布的节点上,海外舆论场也出现了一些紧张信号。
Anthropic 曾公开指控多家中国团队存在“蒸馏”行为,引发争议。与此同时,社区用户也发现 Claude 在多语言环境下出现模型身份混淆的现象——有用户用中文提问,Claude 竟自称“我是 DeepSeek”,引发大量讨论与调侃。
更具戏剧性的是,就在 Anthropic 高调指控的同一天,美国联邦政府宣布所有机构立即停用 Anthropic 技术,五角大楼将其列为“供应链风险”。马斯克在 X 平台直言:“他们怎么敢偷 Anthropic 从人类程序员那里偷来的东西?”
这些事件本身,或许并不足以构成技术判断,但它们反映了一个现实:当竞争进入深水区,技术之外的叙事博弈正在升温。
从“蛮力”到“结构”:一条逐渐清晰的路径
回看 DeepSeek 的发展轨迹,其实非常清晰:
- 不依赖发布会制造声量
- 更关注工程效率与系统结构
- 把资源优先投向“如何跑得更好”,而不是“跑得更大”
在外部环境受限的情况下,这条路径并非权宜之计,而是一种长期选择。
当顶级芯片不再是唯一变量,架构设计、训练策略、推理效率和系统工程能力,开始成为决定性因素。
DeepSeek V4 的发布,很可能不会是一个平静的事件。
但比“登不登顶榜单”更重要的问题是:它是否再次证明了一件事——世界级模型,不只有一条通往未来的路。
如果说过去几年,中国 AI 更多是在追赶能力上限,那么从 R1 到 V4,DeepSeek 展示的,是另一种可能性:
在资源受限的前提下,通过结构创新和工程效率,走出一条可持续、可落地的技术路径。
真正值得关注的,或许正是这一点。
关于霍格沃兹测试开发学社
霍格沃兹测试开发学社,隶属于测吧(北京)科技有限公司,是一个面向软件测试爱好者的技术交流社区,聚焦软件测试、软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及人工智能测试(AI 测试)等方向。 学社内容覆盖 Python 自动化测试、Java 自动化测试、Web 自动化(Selenium、Playwright、App 自动化(Appium)、JMeter、LoadRunner、Jenkins 等测试技术与工具,同时关注 AI 在测试设计、用例生成、自动化执行、质量分析与测试平台建设中的应用,以及开源测试相关实践。 在人才培养方面,学社建设并运营高校测试实训平台,组织“火焰杯” 软件测试相关技术赛事,探索面向高校学员的实践型培养模式,包括先学习、就业后付款等能力导向路径。 此外,学社还提供面向测试工程师的能力提升支持,包括名企大厂 1v1 私教服务,用于结合个人背景的定向指导与工程能力提升。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.