网易首页 > 网易号 > 正文 申请入驻

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

0
分享至

机器之心报道

机器之心编辑部

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」

DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。

最先陷入恐慌的,似乎是同样推崇开源的 Meta。

最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek 最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。

原文如下:

这一切始于 DeepSeek-V3,它在基准测试中就已经让 Llama 4 落后。更糟糕的是那个「拥有 550 万训练预算的不知名中国公司」。
工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。这一点都不夸张。
管理层担心如何证明庞大的生成式 AI 组织的成本是合理的。当生成式 AI 组织中的每个「领导」的薪资都比训练整个 DeepSeek-V3 的成本还要高,而我们有好几十个这样的「领导」时,他们要如何面对高层?
DeepSeek-R1 让情况变得更加可怕。虽然我不能透露机密信息,但这些很快就会公开。
这本应该是一个以工程为重点的小型组织,但是因为很多人想要参与进来分一杯羹,人为地膨胀了组织的招聘规模,结果每个人都成了输家。

原贴链接:https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分别发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在发布时提到,该模型在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

不过,更引人关注的是,这个参数量高达 671B 的大型语言模型训练成本仅 558 万美元。具体来说,它的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练,总共也只有 278.8 H800 GPU Hours。相较之下,Meta 的 Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。

而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、自然语言推理等任务上,它的性能比肩 OpenAI o1 正式版。而且模型在发布的同时,权重同步开源。很多人惊呼,原来 DeepSeek 才是真正的 OpenAI。UC Berkeley 教授 Alex Dimakis 则认为, DeepSeek 现在已经处于领先位置,美国公司可能需要迎头赶上了。

看到这里,我们不难理解为何 Meta 的团队会陷入恐慌。如果今年推出的 Llama 4 没有点硬本事,他们「开源之光」的地位岌岌可危。

有人指出,其实该慌的不止 Meta,OpenAI、谷歌、Anthropic 又何尝没有受到挑战。「这是一件好事,我们可以实时看到公开竞争对创新的影响。」

还有人担心起了英伟达的股价,表示「如果 DeeSeek 的创新是真的,那 AI 公司是否真的需要那么多显卡?」

不过,也有人质疑,DeepSeek 究竟是靠创新还是靠蒸馏 OpenAI 的模型取胜?有人回复说,这可以从他们的发布的技术报告中找到答案。

目前,我们还无法确定帖子的真实性。

不知道 Meta 后续将如何回应,即将到来的 Llama 4 又会达到怎样的性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
几十个家庭垄断一座城:县城婆罗门的闭环游戏,正在逼走年轻人

几十个家庭垄断一座城:县城婆罗门的闭环游戏,正在逼走年轻人

黑噪音
2026-03-21 19:33:08
能两次不立案,能让警察守6小时,路虎里坐的到底是何方神圣?

能两次不立案,能让警察守6小时,路虎里坐的到底是何方神圣?

天天热点见闻
2026-03-22 10:35:38
物理学博士张朝阳出马!科普雷军“60+60”口误

物理学博士张朝阳出马!科普雷军“60+60”口误

超角度
2026-03-21 21:43:05
价格飙涨6000%!原研药集体撤离中国的影响,开始出现了...

价格飙涨6000%!原研药集体撤离中国的影响,开始出现了...

牛锅巴小钒
2026-03-21 19:20:35
一年花掉一辆保时捷,中年人为什么沉迷“打鸟”?

一年花掉一辆保时捷,中年人为什么沉迷“打鸟”?

大象新闻
2026-03-21 15:25:02
詹姆斯详解绝杀战术:我的任务是冲筐吸引对手 肯纳德得到大空位

詹姆斯详解绝杀战术:我的任务是冲筐吸引对手 肯纳德得到大空位

罗说NBA
2026-03-22 11:32:52
人贩子“梅姨”落网,和画像判若两人,她拐卖孩子的数量能判死刑

人贩子“梅姨”落网,和画像判若两人,她拐卖孩子的数量能判死刑

汉史趣闻
2026-03-21 20:38:28
3天暴跌40%!被套牢的中国大妈,该醒醒了:黄金从来不是避险资产

3天暴跌40%!被套牢的中国大妈,该醒醒了:黄金从来不是避险资产

社会日日鲜
2026-03-22 07:07:19
上海出了一家水变油的“科技”公司?财联社还帮忙宣传,全是一伙诈骗犯

上海出了一家水变油的“科技”公司?财联社还帮忙宣传,全是一伙诈骗犯

回旋镖
2026-03-22 10:31:37
郑州一公司使用AI后立马大规模裁员,只留下前台和销售

郑州一公司使用AI后立马大规模裁员,只留下前台和销售

映射生活的身影
2026-03-21 20:36:56
杜兰特总分超乔丹!阿门压哨补篮火箭绝杀热火 阿德巴约32+21

杜兰特总分超乔丹!阿门压哨补篮火箭绝杀热火 阿德巴约32+21

醉卧浮生
2026-03-22 10:29:25
杨瀚森9投6中拿到14分11板3助3帽,正负值+24全场最高

杨瀚森9投6中拿到14分11板3助3帽,正负值+24全场最高

懂球帝
2026-03-22 08:44:06
重磅会议,今日举行!蓝佛安、潘功胜将发声

重磅会议,今日举行!蓝佛安、潘功胜将发声

证券时报
2026-03-22 08:22:03
男子4s店蹭饭260顿后续:被熟人认出,本人发声喊冤,妻子被威胁

男子4s店蹭饭260顿后续:被熟人认出,本人发声喊冤,妻子被威胁

奇思妙想草叶君
2026-03-20 22:45:31
文班20+8+6+5帽!马刺5连胜送步行者队史最长16连败 榜眼24分

文班20+8+6+5帽!马刺5连胜送步行者队史最长16连败 榜眼24分

醉卧浮生
2026-03-22 10:20:44
一滴水放大400万倍后,99.99%都是空的

一滴水放大400万倍后,99.99%都是空的

物理系老郭
2026-03-21 20:00:06
核设施遭袭!伊朗发出全球追杀令,24小时内,普京一句话稳住局面

核设施遭袭!伊朗发出全球追杀令,24小时内,普京一句话稳住局面

军机Talk
2026-03-22 11:06:25
靳磊任广东省委常委、深圳市委书记

靳磊任广东省委常委、深圳市委书记

新京报
2026-03-22 12:15:28
投诉德云社的愤怒先生,您的脆弱不能代表上海

投诉德云社的愤怒先生,您的脆弱不能代表上海

关尔东
2026-03-21 23:11:21
28连败!至今0胜,创CBA新纪录,球迷:滚出CBA

28连败!至今0胜,创CBA新纪录,球迷:滚出CBA

体育哲人
2026-03-22 00:49:03
2026-03-22 13:16:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12555文章数 142590关注度
往期回顾 全部

科技要闻

OpenAI开启“人海战术” 冲刺8000人规模

头条要闻

70后靳磊出任深圳市委书记 曾在河南工作多年

头条要闻

70后靳磊出任深圳市委书记 曾在河南工作多年

体育要闻

郑钦文两盘横扫前美网冠军 迎迈阿密站开门红

娱乐要闻

《澎湖海战》重启宣传 上映时间确定了

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

家居
亲子
游戏
旅游
公开课

家居要闻

时空交织 空间绮梦

亲子要闻

看看谁运气好

《黑神话》官方上新春季新品!3月23日正式开售

旅游要闻

49.9元/人!“鲸鱼湾—云海花田—磊楼”直通车开通

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版