网易首页 > 网易号 > 正文 申请入驻

梁文峰和姚顺雨,四月交卷

0
分享至


撰文|画画

2026年4月,中国AI圈将迎来一次罕见的同台竞技。

DeepSeek V4,梁文锋打磨已久的多模态大模型,计划正式上线。

几乎同一时间,腾讯混元新模型也将发布,负责人是姚顺雨,2025年底刚刚回国,顶着腾讯总办首席AI科学家的Title走马上任。

两家公司,一南一北,一个初创,一个巨头。

一个是用量化私募思路颠覆了AI行业的理工男,一个是被腾讯用最高规格从海外请回来的学术派。

他们几乎不可能在同一张牌桌上出现,但4月,他们都要交卷。

这不是巧合,这是一个节点。

1、腾讯的那个决定

要理解4月意味着什么,必须回到2025年初腾讯做的那个决定。

彼时国内大模型市场,百度有文心,阿里有通义,字节有豆包,各家都在跑马圈地。腾讯混元排不进第一梯队,产品端的元宝几乎没有存在感。

就在这个时候,腾讯选择在元宝里接入DeepSeek。

这个决定在当时被很多人解读为务实之举,与其死撑自研,不如先用最好的模型把用户留住。

但它同时也是一个承认:在大模型能力这件事上,我们现在不如一家创业公司。

元宝的数据验证了这个决定的正确性。

接入DeepSeek之后,用户和活跃度明显回升。这是腾讯用流量换了时间,用元宝已有的产品生态和微信QQ的导流能力,换来了姚顺雨团队自研模型的窗口期。

但时间窗口终究有限。一旦混元最新的版本上线,腾讯面临的第一个真实问题是:留在元宝里的用户,到底认的是哪个名字?

这不是能靠市场调研回答的问题,它只能靠4月之后的留存数据来回答。

2、DeepSeek的另一道难题

DeepSeek这边,面对的是一种完全不同性质的压力。

V3发布之后,DeepSeek的数字是这样的:上线至2025年2月9日,累计下载超过1.1亿次,周活跃用户最高接近9700万。

这个量级,已经接近Twitter在鼎盛期的日活水平,对于一个发布不到半年的AI应用,当时几乎没有先例。

更大的影响发生在行业层面。V3发布后,英伟达单日市值蒸发约6000亿美元,美国科技圈开始重新讨论算力军备竞赛的逻辑是否成立。

DeepSeek用一个开源模型,在成本和效率上同时挑战了大模型必须靠暴力堆算力的行业共识。

但这组数字和这段叙事,也同时变成了V4必须背负的重量。

市场对V4的预期,不是比V3更好,而是能不能再次重新定义。这是一个很难完成的任务,因为V3已经把天花板拉得很高。

梁文锋选择的应对方式,是让V4的迭代方向足够具体,而不是继续打效率革命的旗号。

从论文节奏看,这个准备早就开始了。

2025年12月,署名包含梁文锋团队的《mHC: Manifold-Constrained Hyper-Connections》发表,方向是底层架构的连接方式优化;

2026年1月,梁文锋署名的《Conditional Memory via Scalable Lookup》提出条件记忆机制,在推理过程中,模型可以根据条件动态检索和激活相关记忆,而不是把所有历史上下文都塞进一个固定窗口里。

这两篇论文,距离V4发布只有几个月。它们不是学术展示,更像是产品路线图的技术背书。

V4还有一条线被单独提出,深度适配国产芯片,并有望成为首个完全运行在国产算力生态上的顶级大模型。

在此之前,所有顶级大模型的训练和推理都高度依赖英伟达的GPU。华为昇腾、寒武纪等国产芯片在性能和软件生态上与英伟达仍有差距,适配工作远比听起来复杂。

如果V4真的跑通了,意味着中国大模型产业链上最关键的一环,算力依赖第一次出现了可被验证的替代路径。

3、两条路,同一个终点

有意思的是,DeepSeek和腾讯在技术路线上正在往同一个方向收拢:长上下文、长期记忆、Agent可用性。

这不是巧合,这是整个行业正在形成的共识。下一代AI竞争的核心,不再是谁的参数更多,而是谁能真正记住用户、理解上下文、在复杂任务中持续工作。

但两家公司走向这个终点的路径截然不同。

DeepSeek的做法是从底层架构动刀,条件记忆机制是要在模型本身的记忆方式上做根本性改变。

腾讯的做法是先定义评测标准,CL-bench提出了一套衡量上下文学习能力的新基准。

如果这套标准被学术圈和行业接受,腾讯就获得了一个叙事上的主动权:你的模型好不好,要按我定的标准。

两种路径,代表了两种不同的竞争策略。做出更好的产品,和定义什么叫更好的产品,是两件事。

历史上,后者有时候比前者活得更久。但前提是,你定的标准得被别人接受。如果DeepSeek V4的能力直接碾压了CL-bench设定的评测维度,那套标准就只是腾讯的自我评分。

4、四月之后

4月会到来,两张考卷会被打开,市场会给出它的判断。

但真正值得追问的问题,比谁的模型更好要复杂得多。

第一个问题:腾讯能不能接住用户的切换?

从接入DeepSeek到推出自研混元,这条路如果走通,腾讯的体量、数据、场景接入,微信、QQ、腾讯视频、游戏、企业微信,一旦有了够用的底座,这些场景的价值才能被真正释放出来。

但如果切换之后用户留存下滑,腾讯可能需要重新评估自己在这场竞争里的位置。

第二个问题:DeepSeek能不能守住国产第一的位置?

V3之后,DeepSeek已经不只是一个产品,它是一个标准、一种叙事。

V4需要证明,这不是偶然,而是一种可持续的能力。

尤其是在国产芯片这条线上,如果跑通了,DeepSeek将拥有一个其他顶级大模型都没有的叙事,而这个叙事的价值,可能比模型本身还要大。

第三个问题,也是最大的问题:谁在争定义权?

大模型的下半场,不只是谁的能力更强,更是谁来定义下一代AI应该是什么样的。

梁文锋的答案是:开源、高效、记忆力强、跑在自己的芯片上。

姚顺雨和腾讯的答案是:深度融合场景、长上下文、Agent友好。这两个答案并不互斥,但代表了两种不同的路径,一个是从模型出发往应用走,一个是从应用出发往模型走。

4月,只是一个节点。真正的答案,可能需要整个2026年来慢慢揭晓。

但有一件事是确定的,2025年初,元宝接入DeepSeek的那一刻,是中国AI格局的一次重组,大公司第一次公开承认,创业公司在核心技术上跑到了前面。

2026年4月,如果混元和V4同时亮相,将是另一次重组的开始,不再是谁领先的问题,而是各自走哪条路的问题。

中国AI的故事,正在从赛跑变成分道。

而分道,往往比赛跑,更有意思。

【版面之外】的话:

两家公司,两种路径,一个时间点。

真正有意思的,不是分数。是在这两张答卷里,会看到两种完全不同的安全感。

DeepSeek的安全感,来自把东西做出来,开源、高效、跑在自己的芯片上,这套打法能持续。

腾讯的安全感,来自把东西放进去,放进微信里,放进QQ里,放进游戏里。

4 月的交卷,对于腾讯来说,不是为了向外界证明什么,本质上是为了把元宝的大脑,从 DeepSeek 那里赎回来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
iPhone用户为什么突然集体装VPN

iPhone用户为什么突然集体装VPN

我是一个养虾人
2026-05-01 07:00:40
全网吵炸!北京女大学生青海自驾游,幸存女孩一审被判4年,冤吗

全网吵炸!北京女大学生青海自驾游,幸存女孩一审被判4年,冤吗

一盅情怀
2026-05-08 09:07:58
关于“阴道”,有4个正经冷知识,女人别羞于查看

关于“阴道”,有4个正经冷知识,女人别羞于查看

皓皓情感说
2026-04-18 11:19:16
三分球42中24!历史第1!湖人神射手亿元大合同稳了

三分球42中24!历史第1!湖人神射手亿元大合同稳了

世界体育圈
2026-05-08 16:49:00
“牛鼻子”校友有了新身份,就职衡水泰华中学科技校长

“牛鼻子”校友有了新身份,就职衡水泰华中学科技校长

趣笔谈
2026-05-06 11:30:03
“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

“见过最廉价的兜底”,一份山姆烧鸡,让低认知母子沦为全网笑柄

妍妍教育日记
2026-04-15 09:30:09
王楚钦握拳怒吼太燃了!2-0领先被拖入抢五过关 王皓场下手舞足蹈

王楚钦握拳怒吼太燃了!2-0领先被拖入抢五过关 王皓场下手舞足蹈

颜小白的篮球梦
2026-05-08 20:42:20
外交部:中国驻俄罗斯使馆代表将应邀出席胜利日阅兵仪式

外交部:中国驻俄罗斯使馆代表将应邀出席胜利日阅兵仪式

新京报
2026-05-08 15:57:15
不能说的秘密

不能说的秘密

贵圈真乱
2026-05-02 12:20:52
酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

笑谈历史阿晡
2026-05-04 12:02:08
全线上涨!中东,突发!美军在霍尔木兹海峡对伊朗油轮发动空袭!

全线上涨!中东,突发!美军在霍尔木兹海峡对伊朗油轮发动空袭!

证券时报e公司
2026-05-08 22:49:44
知名打假人王海举报胖东来涉嫌“国补前提价”套取国补资金 胖东来发文否认

知名打假人王海举报胖东来涉嫌“国补前提价”套取国补资金 胖东来发文否认

闪电新闻
2026-05-08 14:51:06
巴尔韦德:楚阿梅尼没有打我,是我不小心撞到了桌子

巴尔韦德:楚阿梅尼没有打我,是我不小心撞到了桌子

懂球帝
2026-05-08 04:25:06
韩旭成为自由人队正式球员,时隔三年重返WNBA

韩旭成为自由人队正式球员,时隔三年重返WNBA

北青网-北京青年报
2026-05-08 13:23:07
深度长文:食草动物明明能反抗,为何面对食肉动物总选择逃跑?

深度长文:食草动物明明能反抗,为何面对食肉动物总选择逃跑?

宇宙时空
2026-05-08 12:03:57
雅马哈悔青了,老臣带二十年经验投奔张雪,砸1.3亿自研夺冠

雅马哈悔青了,老臣带二十年经验投奔张雪,砸1.3亿自研夺冠

Thurman在昆明
2026-05-08 07:34:40
我在中东教汉语,娶了三个本地女孩,虽然年入百万,却并不幸福

我在中东教汉语,娶了三个本地女孩,虽然年入百万,却并不幸福

千秋文化
2026-04-20 19:55:30
让人寒心!比亚迪“兴旗系”爆雷,谁在为车企的献祭式扩张买单?

让人寒心!比亚迪“兴旗系”爆雷,谁在为车企的献祭式扩张买单?

小莜读史
2026-05-08 07:23:38
演员接连喊话:立即停止!爱奇艺回应

演员接连喊话:立即停止!爱奇艺回应

南方都市报
2026-05-08 19:54:19
国内切尔西球迷会发藏头诗讽清湖,官博没看出转发后又删除

国内切尔西球迷会发藏头诗讽清湖,官博没看出转发后又删除

懂球帝
2026-05-08 12:35:39
2026-05-08 23:31:00
版面之外
版面之外
版面之外,才是真相。
107文章数 36关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

"4只皮皮虾1035元"消费者再次发声 否认"想吃白食"

头条要闻

"4只皮皮虾1035元"消费者再次发声 否认"想吃白食"

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

亲子
教育
本地
健康
公开课

亲子要闻

男人带娃,为什么如此轻松?网友: 放下你的控制欲你也能轻松

教育要闻

快接住今天高考的专属好运!祝考生金榜题名

本地新闻

用苏绣的方式,打开江西婺源

干细胞能让人“返老还童”吗

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版