网易首页 > 网易号 > 正文 申请入驻

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

0
分享至



机器之心报道

机器之心编辑部

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」

DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。

最先陷入恐慌的,似乎是同样推崇开源的 Meta。

最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek 最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。

原文如下:

这一切始于 DeepSeek-V3,它在基准测试中就已经让 Llama 4 落后。更糟糕的是那个「拥有 550 万训练预算的不知名中国公司」。
工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。这一点都不夸张。
管理层担心如何证明庞大的生成式 AI 组织的成本是合理的。当生成式 AI 组织中的每个「领导」的薪资都比训练整个 DeepSeek-V3 的成本还要高,而我们有好几十个这样的「领导」时,他们要如何面对高层?
DeepSeek-R1 让情况变得更加可怕。虽然我不能透露机密信息,但这些很快就会公开。
这本应该是一个以工程为重点的小型组织,但是因为很多人想要参与进来分一杯羹,人为地膨胀了组织的招聘规模,结果每个人都成了输家。



原贴链接:https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分别发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在发布时提到,该模型在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

不过,更引人关注的是,这个参数量高达 671B 的大型语言模型训练成本仅 558 万美元。具体来说,它的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练,总共也只有 278.8 H800 GPU Hours。相较之下,Meta 的 Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。



而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、自然语言推理等任务上,它的性能比肩 OpenAI o1 正式版。而且模型在发布的同时,权重同步开源。很多人惊呼,原来 DeepSeek 才是真正的 OpenAI。UC Berkeley 教授 Alex Dimakis 则认为, DeepSeek 现在已经处于领先位置,美国公司可能需要迎头赶上了。



看到这里,我们不难理解为何 Meta 的团队会陷入恐慌。如果今年推出的 Llama 4 没有点硬本事,他们「开源之光」的地位岌岌可危。

有人指出,其实该慌的不止 Meta,OpenAI、谷歌、Anthropic 又何尝没有受到挑战。「这是一件好事,我们可以实时看到公开竞争对创新的影响。」



还有人担心起了英伟达的股价,表示「如果 DeeSeek 的创新是真的,那 AI 公司是否真的需要那么多显卡?」



不过,也有人质疑,DeepSeek 究竟是靠创新还是靠蒸馏 OpenAI 的模型取胜?有人回复说,这可以从他们的发布的技术报告中找到答案。



目前,我们还无法确定帖子的真实性。

不知道 Meta 后续将如何回应,即将到来的 Llama 4 又会达到怎样的性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
甲流来势汹汹?提醒中老年:若白酒戒不掉,这3点需谨记

甲流来势汹汹?提醒中老年:若白酒戒不掉,这3点需谨记

清风游史
2025-02-07 14:22:03
AI时代,预测65%小学生将从事尚未诞生的职业,父母你准备好了吗

AI时代,预测65%小学生将从事尚未诞生的职业,父母你准备好了吗

肯定式教养
2025-02-07 16:47:15
高通放出一张图,扯下国产手机的“遮羞布”,华为却格外不同!

高通放出一张图,扯下国产手机的“遮羞布”,华为却格外不同!

小柱解说游戏
2025-02-08 03:04:39
司马南露面了

司马南露面了

梦野艳齐说人文
2025-02-03 14:50:52
献血313次的四川“献血大王”突发脑梗,医生:其脑梗与献血无关

献血313次的四川“献血大王”突发脑梗,医生:其脑梗与献血无关

鲁中晨报
2025-02-07 11:11:11
沪宁高速总投资超175亿,已开通29年,每年50多亿营收让人眼红

沪宁高速总投资超175亿,已开通29年,每年50多亿营收让人眼红

近史博览
2025-02-06 23:17:35
正式更换!郑钦文宣布意外决定,中国网协批准

正式更换!郑钦文宣布意外决定,中国网协批准

保持热爱0263
2025-02-06 21:50:04
所谓的撬锁开灯,不宜与土匪强盗划上等号,部分网友言辞过于偏激

所谓的撬锁开灯,不宜与土匪强盗划上等号,部分网友言辞过于偏激

笑熬浆糊111
2025-02-08 00:05:22
姜文一家的温馨全家福,两个儿子长得像父亲,高大帅气

姜文一家的温馨全家福,两个儿子长得像父亲,高大帅气

娱你同欢
2025-01-08 20:57:11
记者评加布里埃尔:是葡萄牙联赛的状态节奏,比中国球员反应快

记者评加布里埃尔:是葡萄牙联赛的状态节奏,比中国球员反应快

直播吧
2025-02-07 19:57:15
证监会突然出手!2月8日,深夜爆出的三大消息冲击市场!

证监会突然出手!2月8日,深夜爆出的三大消息冲击市场!

风口招财猪
2025-02-08 02:46:17
924球!40岁首球!C罗抢点捅射,5场连入7球,连刷8大纪录

924球!40岁首球!C罗抢点捅射,5场连入7球,连刷8大纪录

奥拜尔
2025-02-08 00:56:46
悬念揭晓!辽篮新大外提前曝光,斯佩尔曼加盟板上钉钉,杨鸣笑了

悬念揭晓!辽篮新大外提前曝光,斯佩尔曼加盟板上钉钉,杨鸣笑了

君马体育
2025-02-07 20:34:17
笑喷!宋小宝穿詹皇23号球衣现场看湖勇大战,被问NBA总冠军:辽篮!

笑喷!宋小宝穿詹皇23号球衣现场看湖勇大战,被问NBA总冠军:辽篮!

818体育
2025-02-07 13:07:44
是意甲太落后了吗?沃克去了米兰发挥又成世一卫了

是意甲太落后了吗?沃克去了米兰发挥又成世一卫了

百里无心
2025-02-07 07:18:31
选举即将结局?德国16万人出动,魏德尔借到东风,默克尔怕啥来啥

选举即将结局?德国16万人出动,魏德尔借到东风,默克尔怕啥来啥

蓝色海边
2025-02-08 02:25:35
转正!Shams:勇士将内线球员波斯特的双向合同转为两年标准合同

转正!Shams:勇士将内线球员波斯特的双向合同转为两年标准合同

直播吧
2025-02-08 03:47:10
汪小菲与具俊晔的经济差距!

汪小菲与具俊晔的经济差距!

星辰故事屋
2025-02-06 21:27:42
俄绝密文件突然曝光:一旦北约动手,普京先对付中国的两大邻国?

俄绝密文件突然曝光:一旦北约动手,普京先对付中国的两大邻国?

前沿知识局
2025-02-04 20:16:15
为什么封神榜里神仙都不愿意被封神?

为什么封神榜里神仙都不愿意被封神?

唐古看今1
2025-02-06 23:11:15
2025-02-08 06:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
10026文章数 142186关注度
往期回顾 全部

科技要闻

阿里否认10亿美元投资DeepSeek传闻

头条要闻

特朗普称预计将于下周与泽连斯基会面 或会与普京对话

头条要闻

特朗普称预计将于下周与泽连斯基会面 或会与普京对话

体育要闻

从超级射手到顶流UP主 40岁C罗还不想退场

娱乐要闻

姐姐突然去世 小S主持工作请假半年

财经要闻

金价狂飙,金店却现罕见一幕

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

家居
亲子
健康
旅游
公开课

家居要闻

调整布局 提升空间美感

亲子要闻

康希诺:婴幼儿用DTcP正式纳入优先审评品种

抑郁症患者称好的“乌托邦”宝地

旅游要闻

在航班座位下捡到鞭炮?机场回应

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版