网易首页 > 网易号 > 正文 申请入驻

DeepSeek不必是救世主 | 以Agent为马

0
分享至

去年,DeepSeek在春节前夕发布了R1模型,让硅谷震撼,让华尔街不安。它为中国大模型厂商重新埋头研究与训练验证了路径,也开启了中国开源模型阵营狂飙突进的一年。

春节已经成为新的一年的前哨战。近期,Kimi、智谱、MiniMax与豆包,都先后赶在春节前,发布自己的旗舰模型。外界不免揣测,它们都担心一旦迟到,在品牌形象与市场竞争中都落后一程。

前沿模型智能水平排名


(按照ArtificialAnalysis,目前美国最强模型来自Anthropic,中国来自智谱)

如今,压力给到了DeepSeek。市场期待它继续成为春节的英雄,以及承担中国AI生态的“救世主”角色。它该如何回应市场对它的期待,又或者,它必须回应吗?

DeepSeek确实正在酝酿些什么。全新长文本模型结构测试正在中,支持最高100万token上下文。它会是市场等待了DeepSeek-V4吗?事实上,去年5月、8月、10月与12月,市场就这么期待过。最终,DeepSeek交付了DeepSeek-R1-0528、DeepSeek-V3.1、DeepSeek-V3.2-Exp与DeepSeek-V3.2。

期间,DeepSeek还尝试了UE8M0 FP8、DSA、上下文光学压缩、mHC与Engram等方向的探索。它们的核心思路之一就是“稀疏化”,让“专家”、“精度”、“注意力”与“记忆”变得更为稀疏。人们相信在即将到来的V4上,能够继续找到这些改良的技术的影子。

然而,市场的聚光灯已经转向智能体(AI Agent),更确切地说,是智能体化(Agentic AI)。后者开始追求自主决策、长期任务规划、智能体间交互,以及端到端执行的新范式。Anthropic称,AI已经能写出90%的代码,再往前一步,就是完成90%端到端的软件工程(SWE)。火爆的OpenClaw让人相信,在获得足够权限后,Agentic应用会变得多么强大与危险。

2026年的旗舰大模型,将主要是原生Agentic大模型。在美国,Anthropic的Claude Opus 4.6与OpenAI的GPT-5.3-Codex相继上线,尤其是OpenAI推出1000token/秒的Codex-Spark,将编码竞争推向白热化。在国内,月之暗面的Kimi-K2.5、智谱的GLM-5、稀宇科技的MiniMax-M2.5,以及今天字节跳动的Doubao-Seed-2.0,都在宣传自己的智能体能力。

其中,Kimi-K2.5引入了智能体集群(Agent Swarm)技术,并提出并行智能体强化学习(PARL),准确率更高,用时更少;GLM-5在编程能力上实现了与Claude Opus 4.5对齐,又提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,以极少的人工干预自主完成 Agentic 长程规划与执行。MiniMax-M2.5则号称是第一个不需要考虑使用成本可以无限使用的前沿模型,“1万美元可以让4个Agent连续工作一年”。

DeepSeek-V3.1早已宣告迈向Agent时代,但又会如何定义扑面而来的Agentic时代。它能否凭借推理效率、工具集成、记忆机制与极致经济性,在落地体验中再度确立新的标杆?

也许,DeepSeek未必还需要一个单独的“R系列”。R象征推理与认知,对标OpenAI的o系列模型;而Agentic时代,更强调执行与工程,更需要对标OpenAI的Codex。DeepSeek原本就拥有Coder与Math系列模型,编码与数理证明,都是通往AGI(通用人工智能)的“元能力”,它们二者共同构成模型的自我改进系统,加速递归式进化。

市场同样期待DeepSeek继续验证国产算力生态协同的潜力。长期以来,它对此的探索主线,一直都是如何在有限的资源下通过架构创新,最大程度上地提升训练与推理的效率。去年年底,DeepSeek-V3.2用新架构DSA,在长上下文场景中实现了端到端的显著加速;今年年初,Engram的条件记忆有望“成为下一代稀疏大模型中不可或缺的基础建模范式”。

OpenAI的Codex-Spark证明,响应速度至关重要,是创造价值的关键。它运行在Cerebras晶圆级引擎上,这又正是国内推理生态所缺乏的。DeepSeek能否用“算法”换“算力”,抹平这种硬件级别的差距?

而且,从算法上着手,精简步骤,不仅能够提升响应速度,尤其是部分必须高速精准响应的场景,还能够减轻上下文的压力。此前,中国开源模型常被诟病,“冗长思考”不受制约,消耗token过高,将逐步侵蚀成本优势。此前,DeepSeek提到,会在未来的工作中,聚焦于提升模型推理链的智能密度,以改善效率。

比推理更重要的是训练,预训练仍然是后训练的起点。英伟达的Blackwell架构正在成为美国AI基础设施中的训练主力,谷歌的TPUv7也将在Gemini 4的训练中发挥关键作用。即使H200能尽快在国内部署,短期内中国大模型训练的算力来源,也仍处于Hopper时代。目前,国内AI芯片厂商的性能叙事仍主要围绕Hopper架构展开,而在大规模集群场景下的稳定性与综合效率表现,尚未形成充分的实践数据支持。

DeepSeek在论文中承认,由于训练算力不足,DeepSeek-V3.2在世界知识的覆盖广度上,仍落后于领先的专有闭源模型。该团队计划在后续迭代中,通过扩大预训练算力规模,来弥补这一知识差距。不必怀疑,当DeepSeek-V4发布的时候,国产AI芯片会Day0深度全栈适配;但市场更期待它的预训练会基于国产AI芯片,并再一次改写市场对英伟达叙事的定价。

人们欣赏DeepSeek精致的研究,市场也期待原生多模态的DeepSeek-V4。Gemini 3已经是原生支持文本、图像、音频和视频输入的大模型,Kimi-2.5也强调文本与视觉的联合优化。要继续对标谷歌、OpenAI,似乎DeepSeek必须有所动作。

但是,技术创新必须站在可验证的物理边界上,而不是情绪边界上。芯片、能源、网络,以及算法等整套生态,决定了算力的上限。而算力正在限制中国开源模型进一步追赶的后劲,在预训练和后训练方面已经表现出来。任何“算法乐观主义”,在特定时间内,都只能在这个边界内优化。而AGI更是一项系统工程,远超单一大模型的参数规模或版本更新。

DeepSeek的使命是探索AGI。只做大模型是无法实现AGI的,尤其是只做语言大模型,它的局限性也越来越明显。现在更接近现实的AGI形态,是知行合一的,它有认知能力、执行能力、长期约束、现实反馈闭环,等等。Claude大模型经常被中国的开源模型集体刷榜碾压,但它的收入以每年十倍的速度增长,在编程这一通用功能领域的突破,为通往AGI开辟了一条蹊径。

或许,真正长期主义的期待,是允许DeepSeek继续深度求索,而不是让市场的所有焦虑与愿望,都在某一个时刻集中投射到同一个名字之上。在公司创始人梁文锋看来,创新就是昂贵且低效的,有时候伴随着浪费,它需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
300344,拟终止上市!连续3年财务造假

300344,拟终止上市!连续3年财务造假

每日经济新闻
2026-02-14 22:37:06
王毅在慕尼黑会见鲁比奥,谈了整整1小时!

王毅在慕尼黑会见鲁比奥,谈了整整1小时!

阿龙聊军事
2026-02-14 21:07:20
美国兵推曝光:中国击沉4艘美航母后,美国或将对京沪进行核打击

美国兵推曝光:中国击沉4艘美航母后,美国或将对京沪进行核打击

纪中百大事
2026-02-14 16:40:09
中戏主任被抓扯出“太子爷”塌房?易烊千玺背后大佬捂不住了!

中戏主任被抓扯出“太子爷”塌房?易烊千玺背后大佬捂不住了!

毒舌八卦
2026-02-15 00:41:43
穆霍娃首夺1000赛冠军!WTA排名:郑钦文升3位 最新比赛时间确定

穆霍娃首夺1000赛冠军!WTA排名:郑钦文升3位 最新比赛时间确定

侃球熊弟
2026-02-15 07:44:42
全都“叛变”了,台积电、三星接连宣布,外媒:中国不买了?

全都“叛变”了,台积电、三星接连宣布,外媒:中国不买了?

古史青云啊
2026-02-12 22:05:36
全明星合影出炉!詹姆斯缺席库里坐C位 世界队东契奇C位文班抢镜

全明星合影出炉!詹姆斯缺席库里坐C位 世界队东契奇C位文班抢镜

追球者
2026-02-15 06:04:43
待宰大鹅流泪引网友喊话求放过,市民只好把鹅送人,鹅真会被“吓哭”吗?专家解答来了

待宰大鹅流泪引网友喊话求放过,市民只好把鹅送人,鹅真会被“吓哭”吗?专家解答来了

大风新闻
2026-02-13 22:20:04
闺蜜大婚我随了5000,她回礼雨伞,看见伞柄刻着地址和6个数字

闺蜜大婚我随了5000,她回礼雨伞,看见伞柄刻着地址和6个数字

磊子讲史
2026-01-23 16:54:49
豆包+Momenta赋能,上汽奥迪“中国定制”反哺“全球标准”

豆包+Momenta赋能,上汽奥迪“中国定制”反哺“全球标准”

车壹圈
2026-02-14 17:23:05
王菲李健王一博易烊千玺等亮相,总台春晚完成全部五次彩排

王菲李健王一博易烊千玺等亮相,总台春晚完成全部五次彩排

上观新闻
2026-02-15 01:33:05
除夕晚上拜年,别只会说“新年快乐”,送您几句祝福语,高级走心

除夕晚上拜年,别只会说“新年快乐”,送您几句祝福语,高级走心

神牛
2026-02-14 15:57:41
情人节遇冷!票房勉强过亿,网友:时代变了,舔狗没落遇返程高峰

情人节遇冷!票房勉强过亿,网友:时代变了,舔狗没落遇返程高峰

火山詩话
2026-02-15 07:06:00
前勇士、湖人冠军中锋麦基:我将加入北京首钢

前勇士、湖人冠军中锋麦基:我将加入北京首钢

懂球帝
2026-02-15 09:17:17
1947年,毛泽东游白云山,想见见当地道士,县长推脱道士成分复杂

1947年,毛泽东游白云山,想见见当地道士,县长推脱道士成分复杂

明月清风阁
2026-02-13 07:00:10
闫学晶被曝偷税漏税大结局!博主通报最新进展,终于真相大白了

闫学晶被曝偷税漏税大结局!博主通报最新进展,终于真相大白了

奇思妙想草叶君
2026-02-15 03:14:15
韩媒:中国或0金收官创最差纪录!离开主场原形毕露 只能靠谷爱凌

韩媒:中国或0金收官创最差纪录!离开主场原形毕露 只能靠谷爱凌

念洲
2026-02-14 16:28:58
穿破的外套仅退款后续:女子身份被扒,真容曝光社死,单位被牵连

穿破的外套仅退款后续:女子身份被扒,真容曝光社死,单位被牵连

离离言几许
2026-02-14 15:56:41
太震撼!14日深夜潮州某服务区全是车,网友:一帮穷鬼等高速免费

太震撼!14日深夜潮州某服务区全是车,网友:一帮穷鬼等高速免费

火山詩话
2026-02-15 06:20:14
中国商界传奇毛冬声辞世,曾多次感谢时代给予机会

中国商界传奇毛冬声辞世,曾多次感谢时代给予机会

极目新闻
2026-02-15 08:24:18
2026-02-15 10:11:00
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
304文章数 62关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

本地
教育
时尚
数码
手机

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

教育要闻

5747是哪个学校?揭秘成都文理学院代码

推广中奖名单-更新至2026年2月3日推广

数码要闻

AirTag太贵?小米Tag来了:更薄更强,还支持苹果查找

手机要闻

W6数据出炉,华为重回榜首,苹果排名第二

无障碍浏览 进入关怀版