网易首页 > 网易号 > 正文 申请入驻

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

0
分享至

机器之心报道

机器之心编辑部

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」

DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。

最先陷入恐慌的,似乎是同样推崇开源的 Meta。

最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek 最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。

原文如下:

这一切始于 DeepSeek-V3,它在基准测试中就已经让 Llama 4 落后。更糟糕的是那个「拥有 550 万训练预算的不知名中国公司」。
工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。这一点都不夸张。
管理层担心如何证明庞大的生成式 AI 组织的成本是合理的。当生成式 AI 组织中的每个「领导」的薪资都比训练整个 DeepSeek-V3 的成本还要高,而我们有好几十个这样的「领导」时,他们要如何面对高层?
DeepSeek-R1 让情况变得更加可怕。虽然我不能透露机密信息,但这些很快就会公开。
这本应该是一个以工程为重点的小型组织,但是因为很多人想要参与进来分一杯羹,人为地膨胀了组织的招聘规模,结果每个人都成了输家。

原贴链接:https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分别发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在发布时提到,该模型在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

不过,更引人关注的是,这个参数量高达 671B 的大型语言模型训练成本仅 558 万美元。具体来说,它的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练,总共也只有 278.8 H800 GPU Hours。相较之下,Meta 的 Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。

而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、自然语言推理等任务上,它的性能比肩 OpenAI o1 正式版。而且模型在发布的同时,权重同步开源。很多人惊呼,原来 DeepSeek 才是真正的 OpenAI。UC Berkeley 教授 Alex Dimakis 则认为, DeepSeek 现在已经处于领先位置,美国公司可能需要迎头赶上了。

看到这里,我们不难理解为何 Meta 的团队会陷入恐慌。如果今年推出的 Llama 4 没有点硬本事,他们「开源之光」的地位岌岌可危。

有人指出,其实该慌的不止 Meta,OpenAI、谷歌、Anthropic 又何尝没有受到挑战。「这是一件好事,我们可以实时看到公开竞争对创新的影响。」

还有人担心起了英伟达的股价,表示「如果 DeeSeek 的创新是真的,那 AI 公司是否真的需要那么多显卡?」

不过,也有人质疑,DeepSeek 究竟是靠创新还是靠蒸馏 OpenAI 的模型取胜?有人回复说,这可以从他们的发布的技术报告中找到答案。

目前,我们还无法确定帖子的真实性。

不知道 Meta 后续将如何回应,即将到来的 Llama 4 又会达到怎样的性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
妻子把男闺蜜接回家住,我学她也找了个女知己,带回家时她急了

妻子把男闺蜜接回家住,我学她也找了个女知己,带回家时她急了

千秋文化
2026-06-25 19:57:13
普京暴怒通缉“马扎儿”  伊朗再度给川普加码

普京暴怒通缉“马扎儿” 伊朗再度给川普加码

西楼饮月
2026-06-25 18:07:30
她是上海知名主持人,嫁音乐人团长丈夫生一女,39岁稳坐当家花旦

她是上海知名主持人,嫁音乐人团长丈夫生一女,39岁稳坐当家花旦

法老不说教
2026-06-26 22:53:28
特朗普称伊朗无人机袭击霍尔木兹海峡船只违反停火协议

特朗普称伊朗无人机袭击霍尔木兹海峡船只违反停火协议

澎湃新闻
2026-06-27 01:14:13
高市宣布出席APEC避见中方,美国找理由缺席

高市宣布出席APEC避见中方,美国找理由缺席

寄予的清风
2026-06-27 06:15:30
两家A股公司宣布涨价

两家A股公司宣布涨价

证券时报
2026-06-26 18:26:17
Anthropic致信国会控阿里“史上最大蒸馏”,马斯克:你倒是先别装

Anthropic致信国会控阿里“史上最大蒸馏”,马斯克:你倒是先别装

闪存猎手
2026-06-26 10:34:48
4-1、5-0!世界杯疯狂,姆巴佩金靴竞争,韩国仅剩3席

4-1、5-0!世界杯疯狂,姆巴佩金靴竞争,韩国仅剩3席

7号观察室
2026-06-27 05:35:28
A股:证监会最新出手,开出私募史上最重罚单!下周一将迎新变化

A股:证监会最新出手,开出私募史上最重罚单!下周一将迎新变化

云鹏叙事
2026-06-27 00:00:07
受权发布|全国人民代表大会常务委员会任命名单

受权发布|全国人民代表大会常务委员会任命名单

新华社
2026-06-26 23:08:02
终于有经济学家批评体制内退休金太高、加剧代际矛盾,评论区炸锅

终于有经济学家批评体制内退休金太高、加剧代际矛盾,评论区炸锅

慧翔百科
2026-06-23 08:47:02
iPhone 17 将打破历史纪录,成为寿命最长的苹果手机!

iPhone 17 将打破历史纪录,成为寿命最长的苹果手机!

XCiOS俱乐部
2026-06-25 19:31:03
《爱情岛》女星自曝热衷69姿势,小屋众人面前亲密行为惹争议

《爱情岛》女星自曝热衷69姿势,小屋众人面前亲密行为惹争议

浅遇时光
2026-06-27 01:07:05
李玮锋:2002年世界杯踢完巴西队后,我想退役的心都有了

李玮锋:2002年世界杯踢完巴西队后,我想退役的心都有了

懂球帝
2026-06-27 01:37:06
从狂赚到大亏15亿卢布!吉利长安在俄罗斯一年从天堂摔地狱

从狂赚到大亏15亿卢布!吉利长安在俄罗斯一年从天堂摔地狱

老马拉车莫少装
2026-05-11 14:18:27
世界杯32进16时间确定!日本vs巴西,荷兰vs摩洛哥,晋级预测如下

世界杯32进16时间确定!日本vs巴西,荷兰vs摩洛哥,晋级预测如下

球场没跑道
2026-06-26 10:09:46
重磅!房产新政来了....

重磅!房产新政来了....

新浪财经
2026-06-27 00:16:59
蒋勤勤突然红了眼眶,说吴越至今未婚,是自己二十年过不去的心结

蒋勤勤突然红了眼眶,说吴越至今未婚,是自己二十年过不去的心结

观察鉴娱
2026-06-26 10:43:23
王忠林任全国人大环境与资源保护委员会副主任委员

王忠林任全国人大环境与资源保护委员会副主任委员

澎湃新闻
2026-06-26 19:50:33
杨瀚森赛季原形毕露,发牌本事曾骗惨开拓者与球迷

杨瀚森赛季原形毕露,发牌本事曾骗惨开拓者与球迷

林子说事
2026-06-26 08:05:13
2026-06-27 07:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13370文章数 142682关注度
往期回顾 全部

科技要闻

GPT-5.6发布,旗舰模型先向可信伙伴开放

头条要闻

13岁女孩称被两男子性侵 家属:警方立案4个月后撤案

头条要闻

13岁女孩称被两男子性侵 家属:警方立案4个月后撤案

体育要闻

我在世界杯的每次奔跑,都为了证明你没看错

娱乐要闻

玥儿不回北京,马筱梅解释后妈身份

财经要闻

"索具龙头"领大额罚单

汽车要闻

11.99万起 捷途自由者7 PLUS/山海T1四驱版上市

态度原创

亲子
手机
房产
公开课
军事航空

亲子要闻

你的底线来了,老兵月子中心了解一下

手机要闻

vivo 联发科共研大屏 AI 最优解,X Fold6 展开旗舰折叠新时代

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:驶离指定航线船舶不享有安全保障

无障碍浏览 进入关怀版