网易首页 > 网易号 > 正文 申请入驻

DeepSeek 反思潮:AGI 既被重新审视,又被持续低估

0
分享至

不断的攻守异位,要么是实力相当,要么是高度不确定性。

作者丨陈彩娴

2 月很有意思。

1

DeepSeek 反思潮

在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:

首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级

据近日与张予彤接触过的 VC 反馈,DeepSeek 不花一分钱投流的崛起启示了 AGI 的技术高度,也让 Moonshot 反思了过去一年类互联网打法、过度重视产品投流的策略局限性。在未来的一年,Moonshot 要将基础模型的突破作为重点,将更多资源投到技术而非研发上。

事实上,这不仅仅是月之暗面的结论,也是这波 AGI 创业潮中卡技术生态位的大模型公司的普遍转变。与此相对应的,是产品团队的资源比重下降,因为 DeepSeek 的成功已经侧面证明了:AGI 时代可能不需要产品经理,也不需要投流,只要技术实力提升后就会有用户增长。

2024 年的投流大战,以 DeepSeek 不花一分钱、DAU 最高时达 4000 万落下帷幕,而受创最重的自然是投流团队,因为钱相当于白花了。投流越多、伤害越大,如 Moonshot;投流越少,伤害越小,如 MiniMax。

据 AI 科技评论获悉,MiniMax 前产品一号位离职的原因之一,就是曾与创始人在投流上发生分歧。MiniMax 的组织架构之前是互联网打法,按照不同产品进行分组,产品团队一度达到 200 人,但 2024 年年中开始就一直在调整产品团队,接下来可能会进一步裁减产品人员。

其次,是字节与腾讯的攻守异位,以及字节大模型技术团队的架构调整。

过去一周,腾讯元宝接入 DeepSeek 后在中国区苹果免费 APP 下载排行榜上超过豆包,排名第二、仅次于 DeepSeek。在“DeepSeek+”的风潮下,相比百度、阿里、字节等有技术包袱的大厂来说,腾讯的元宝与微信等应用迅速抓住了机会,毫无负担地接入了 DeepSeek,一下子由过去两年的被动防守转为主动出击,变守为攻,扭转了局势。

业内周知,在过去的两年,腾讯在大模型、AIGC 相关技术与产品上虽然努力追赶,但始终不温不火。又由于将算力与人才等资源更多投入基础模型,文生视频等方向的研究资源被影响,团队核心骨干从腾讯流向快手、字节等团队。可以说,DeepSeek 救了腾讯大模型一把。

也因此,有业内人士认为:基础模型的研究最终只需要 DeepSeek 一家即可。随之引发的,是近日传出的大模型公司有老股东开始张罗退股的声音,认为“智谱、阶跃甚至字节、阿里等公司的大模型都没戏了”。——对于这种声音,笔者不敢苟同,认为应该持续观望。

有一个比喻能很好地形容当前中国大模型创业潮的格局:

一个富二代学霸做了一份接近满分的卷子,并把答案公布了出来。但这份答案的学习有一定的资源成本与面子成本,另一个能承担起这两种成本的富二代学渣直接拿来抄了、也考了接近满分的成绩。现在留下一群从农村通过赞助入学、平时考七八十分的学生,以及同是富二代但努力方向错了的学生,不知所措。

他们终将认识到,开放社会的竞争不一定公平,但一定残酷。打破这种结构性困境很难,或许需要“一命二运三风水四积阴德五读书”,但他们没有其他选择。

回到现实,字节的大模型团队进行调整,也是因为 AGI 的竞争格局发生了变化——DeepSeek 冲出来之前,业内几乎所有人都在夸字节的豆包,豆包也上升十分迅猛,给 kimi 造成极大的围剿;但 DeepSeek 霸屏整个春节后,字节意识到,AGI 仍是一个高度的果实,必须换一个更能打的将领。

据 AI 科技评论验证,此前字节的基础模型技术研究由朱文佳带领,春节后进行了一次大的人员调整,基础模型技术研发的一号位换成了由吴永辉,黄文灏等在 2024 年新加入的大模型骨干都向吴永辉汇报,而朱文佳则转向了模型应用一号位,吴永辉与朱文佳都向梁汝波汇报。

经 AI 科技评论梳理,2023 年字节刚组建大模型团队时,团队人员主要来自字节内部,包括搜索、抖音、西瓜、TikTok 等等多条知名业务线,在字节过往产品上有过大大小小的胜仗,朱文佳下面各个小组中一号位人选从外面招入的人才并不多。

从 2024 年年中开始,越来越多 AGI 方向的知名人才被招入字节,团队开始换血。据知情人士分析,这背后的原因是:朱文佳等人来自搜推广技术背景,而大模型是新的范式,两者不一定适合。字节、MiniMax 等公司此前低估 RL 技术路线就是一个例证。吴永辉代替朱文佳成为基础模型研究一号位,意味着字节换血的决心更彻底。

吴永辉此前在谷歌的职级仅次于 Jeff Dean,是谷歌 Gemini 的核心贡献者之一。而据几位硅谷华人的信源,吴永辉擅长模型工程。谷歌自 2017 年发布 Transformer 后一直在大模型赛道上持续创新,且谷歌研究大模型一直是从底层框架、算力到上层算法的系统性推进,从知识面上吴永辉确更适合大模型技术一号位的角色。(谷歌 Gemini 是否被低估?欢迎感兴趣的读者添加作者微信 Fiona190913 交流)

据知情人士透露,朱文佳此前在带领字节大模型技术研发时,在人才任用上更重用以往一起打过仗的亲信乔木等人,同时在大模型基础研究的创新 idea 采用上不够开放。这背后的逻辑不难理解:AGI 的技术有极高不确定性、用熟悉的队友能减少沟通成本。如果 AGI 是一个很低的桃子,“钱多人傻”的打法也许可以,但事实或许并非如此。

据了解,新加入字节的技术人员曾向朱文佳提过诸如 SPPO 等强化学习方向、火星优化器等高效训练方向的技术方案,“一些方案明明自己验证了 work、但被朱文佳移交给身边的人验证后被反馈不 work 而弃掉”。此前字节内部赛马文生视频,其他团队赛赢,但后续成果被朱文佳划到了 Seed 团队。(更多字节大模型内部的研究细节,欢迎天街作者微信 Fiona190913 交流)

大模型是一项有门槛的创新技术,无论在大厂还是创业公司,实际上都需要创业者的心态。第一批低估 AGI 的人已经被摁倒,但并非所有人都吸取了教训。

2

AGI 的壁垒在哪?

“算法是没有壁垒的。”一位大模型 VC 这样评论道。与此同时,还有相似的声音:“DeepSeek 现象只是昙花一现,过 6 个月就会被追上”,以及“大模型创业公司必然会死,最后赢家只有 DeepSeek 与大厂,你看腾讯元宝”。

笔者认为,在下论断之前,首先要回答一个问题:DeepSeek 已经实现终极 AGI 了吗?答案显然是否定的,即使是 DeepSeek 官方都承认,R1 模型仍有一些致命缺陷,比如通用能力不足、语言混淆、提示词敏感以及软件工程能力不足。

如果这个问题达成了共识,那么我们就要思考下一层:

第一,DeepSeek 是不是一定能解决 AGI 的所有技术问题

第二,DeepSeek 是不是只需一家之力就能实现终极 AGI

第三,中国是不是只有 DeepSeek 一家有实力解决 AGI 的各个技术问题?

同样以腾讯元宝为例。虽然元宝接入 DeepSeek 后可以赢得一时的胜利,但没有人能保证 DeepSeek 永远满分。如果有一天 DeepSeek 不开卷、竞争的规则被改写,又将攻守异位。

对于上述问题,笔者均持怀疑态度,原因很简单:DeepSeek 并非聚集了中国乃至全球所有的 AGI 技术人才。即使曾经明星如云的 OpenAI,也因为2023、2024 年经历了大批核心人才出走,发展受阻。

关于 AGI,如果不将其当成只是 DeepSeek 一家的责任,而是作为整个 AI 行业的必然终局,那么就不难有一种朴素的感觉:AGI 的大航海,需要的不只是一个“DeepSeek”,也不会只有一个“DeepSeek”。AGI 是一个行业,而不是一个产品。

在 2 月的交流中,笔者总结,造成 AGI 从业者这种“既重视又低估”的矛盾心理的一个重要原因,或许是互联网思维的惯性

经历过互联网大战的从业者向 AI 科技评论举例,“互联网产品就是竞争到最后往往就是只有一家胜出,比如出行大战、3Q 大战等等。”但笔者认为,这种类比不太恰当,因为互联网产品的技术如搜推广从谷歌开始、再到国内时,大体的技术天花板已经确定,而 DeepSeek 证明了 AGI 的天花板比 OpenAI 所取得的成绩还高。

与 AGI 或大模型能在同一个层面类比的技术分支,或许用自动驾驶的 L4、英伟达芯片等高难度的技术来类比更合适。虽然 L4 至今没有实现,但自动驾驶技术从 L2 到 L4 的过程中曾衍生了不同维度的产品商业化(如扫地机器人),同样,AGI 也是一个逐步取得胜利、逐步催生商业技术产品的过程。

有些团队本就不具备竞争 AGI 的技术实力,但这并不能推断出“DeepSeek 是唯一能竞争 AGI 的创业团队”或“中国只需要一家 AGI 公司”的结论。哪怕是海外的各家基础模型,也在能力上各有分工,如 GPT 更擅长听指令、Claude 更擅长代码。

再回顾更大的行业规律:如果说搜广推技术由谷歌开启、字节抖音推至巅峰,那么大模型技术由 OpenAI 开启,由将由谁推至巅峰?互联网时代经历了 20 年才得出答案、中间也经历了许多故事,那么AGI 时代也不可能只在 2 年内验证最初的赢家与最后的赢家

那么,AGI 的壁垒在哪?

笔者认为,AGI 的壁垒实际是:算法的优势、技术的创新虽然无法构成坚不可摧的壁垒,但可以赢得时间差

以月之暗面为例。事实上,Moonshot 与 DeepSeek 都是在 2023 年的上半年成立、前后相差只有一个月。

在 2021 年智源的“悟道”大模型项目中,杨植麟也是悟道 2.0 大模型的核心开发者之一,从底层 Transformer 到上层大模型的算法训练都有完整、系统的研究背书。相比之下,DeepSeek 创始团队、包括梁文锋虽是计算机专业背景,但在 NLP、Transformer 与预训练等大模型的关键技术上与 Moonshot 团队必然存在技术学习的时间差

如果以 Moonshot 在成立时就具备训练千亿大模型的能力开始算起,到 DeepSeek 在 2024 年 5 月发布 V2,那么这个时间差粗略计算大约是 1 年;如果严格考虑 V2 训练成本大幅降低的研发时间,这个时间差也至少是 6 个月以上。

但由于 Moonshot 在过去两年更重视产品增长、而非基础模型的底层技术创新,Moonshot 与 DeepSeek 的基础模型时间差也从 2023 年“DeepSeek 至少比 Moonshot 落后半年”变成了 2025 年“Moonshot 至少比 DeepSeek 落后 XXX 年”。在互联网思维的过度指导下,前后相减,Moonshot 至少失去了一年的优势,主动变被动。

据知情人士透露,DeepSeek 内部计划今年 3 月发布 V3.5,6 月之前发布 V4。换言之,假设其他团队的基础模型能在 6 月赶上 V3 与 R1,作为先行者,DeepSeek 已经利用时间差赢得了领先的技术研发期,以及这半年内的生态护城河。模型的效果容易提升,但生态不容易割据。

是坐享其成,还是参与竞争,亦或看清局势、早早转向自身的优势所在,不容易判断。尽管 DeepSeek 当前风头正盛,但AGI 仍然是一个挂在高处的果子,需要持续的底层技术创新

在跋涉的过程中,一定会有人退出,无论是 VC 也好、创业者也好、技术人员也好,但无论如何,这条路上不会只有 DeepSeek, 也希望不会只有 DeepSeek。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

为什么中国只有一个 DeepSeek?

谁将替代 Transformer?

Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友投诉张雪机车业务员“太狂”,张雪本人回应:提供证据,奖励1万

网友投诉张雪机车业务员“太狂”,张雪本人回应:提供证据,奖励1万

极目新闻
2026-04-13 11:56:44
王毅访朝,不到24小时,韩国宣布从38线裁军,半岛局势或迎来转变

王毅访朝,不到24小时,韩国宣布从38线裁军,半岛局势或迎来转变

轩逸阿II
2026-04-14 02:20:02
美军的小宝贝丢在了伊朗,中国若得到,可以少奋斗几年?

美军的小宝贝丢在了伊朗,中国若得到,可以少奋斗几年?

梦醉为红颜一笑
2026-04-12 16:33:18
湖人狂喜!佩林卡压哨捡宝,25+6神经刀补位,网友:血赚不亏

湖人狂喜!佩林卡压哨捡宝,25+6神经刀补位,网友:血赚不亏

兰亭墨未干
2026-04-14 12:51:18
女人好色起来会有多恐怖?男人只能求饶

女人好色起来会有多恐怖?男人只能求饶

那年秋天
2026-04-12 18:30:03
飘了?会员为山姆带来1400亿营收,山姆却将90天无忧退货缩至7天

飘了?会员为山姆带来1400亿营收,山姆却将90天无忧退货缩至7天

青眼财经
2026-04-13 23:20:36
十六年执政将结束,匈牙利“变天”引关注,欧尔班意外败选震动欧洲

十六年执政将结束,匈牙利“变天”引关注,欧尔班意外败选震动欧洲

环球网资讯
2026-04-14 07:02:10
我国首例公开转世人:6岁凭记忆找到前世的家,还找到前世情人

我国首例公开转世人:6岁凭记忆找到前世的家,还找到前世情人

小兰聊历史
2026-04-13 12:04:13
三倍薪酬、十倍经费、等待7年仍是副教授:日本顶尖量子物理学者远走中国

三倍薪酬、十倍经费、等待7年仍是副教授:日本顶尖量子物理学者远走中国

深究科学
2026-04-14 08:26:57
终究还是离了!姐姐卖烧饼挣了几百万,全给弟弟买车房,后悔吗?

终究还是离了!姐姐卖烧饼挣了几百万,全给弟弟买车房,后悔吗?

许三岁
2026-04-11 16:36:44
赖清德宣布窜访非洲小国,不到24小时,就被狠狠打脸,不简单

赖清德宣布窜访非洲小国,不到24小时,就被狠狠打脸,不简单

DS北风
2026-04-13 19:08:21
伊朗:巴林、沙特、卡塔尔、阿联酋、约旦,赔偿

伊朗:巴林、沙特、卡塔尔、阿联酋、约旦,赔偿

观察者网
2026-04-14 08:17:06
史上最强阔折叠来了!华为Pura X Max顶配版搭载麒麟9030 Pro:售价过万

史上最强阔折叠来了!华为Pura X Max顶配版搭载麒麟9030 Pro:售价过万

快科技
2026-04-14 11:28:34
粟裕那一枪,到底是打歪了,还是故意打歪的

粟裕那一枪,到底是打歪了,还是故意打歪的

鹤羽说个事
2026-03-30 22:03:41
越南高铁动工:拒绝中国技术,德国西门子胜出!中国网友:放心了

越南高铁动工:拒绝中国技术,德国西门子胜出!中国网友:放心了

影像温度
2026-04-14 06:55:17
美军一空中加油机伤痕累累 可能参与对伊朗军事行动

美军一空中加油机伤痕累累 可能参与对伊朗军事行动

环球网资讯
2026-04-14 08:59:45
“只剩咱俩了,你也100了,都不容易”!查尔斯国王看望百岁保姆

“只剩咱俩了,你也100了,都不容易”!查尔斯国王看望百岁保姆

书酱瞄瞄
2026-03-20 15:37:53
以总理:与伊朗的停火可能很快结束

以总理:与伊朗的停火可能很快结束

澎湃新闻
2026-04-13 20:22:08
女大学生吐槽“普信男”视频火了,却因长相被嘲:你也照照镜子吧

女大学生吐槽“普信男”视频火了,却因长相被嘲:你也照照镜子吧

世界圈
2026-04-12 00:10:16
IGN满分神作来了!《哈迪斯2》贺图:明日凌晨登PS/XS

IGN满分神作来了!《哈迪斯2》贺图:明日凌晨登PS/XS

游民星空
2026-04-14 10:45:20
2026-04-14 14:04:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7187文章数 20744关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

头条要闻

恒大集团、恒大地产及许家印案开庭 许家印认罪悔罪

体育要闻

他做对了所有事,却被整个职业网坛放逐了八年

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印受审当庭表示认罪悔罪

汽车要闻

长城欧拉5限定版纯电版上市 限量99台售价13.38万元

态度原创

艺术
游戏
房产
健康
军事航空

艺术要闻

这位美女画家的夏天竟如此梦幻

血源电影制片人发声!最爱的游戏 竭尽全力做到最好

房产要闻

改善标杆,1.5w+起横扫国兴!海口楼市,打出最猛一张牌!

干细胞抗衰4大误区,90%的人都中招

军事要闻

伊朗要求五个中东国家赔偿战争损失

无障碍浏览 进入关怀版