网易首页 > 网易号 > 正文 申请入驻

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

0
分享至

机器之心报道

机器之心编辑部

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」

DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。

最先陷入恐慌的,似乎是同样推崇开源的 Meta。

最近,有 Meta 员工在美国匿名职场社区 teamblind 上面发布了一个帖子。帖子提到,国内 AI 创业公司 DeepSeek 最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者的低成本高歌猛进下,后者无法解释自己的超高预算的合理性。

原文如下:

这一切始于 DeepSeek-V3,它在基准测试中就已经让 Llama 4 落后。更糟糕的是那个「拥有 550 万训练预算的不知名中国公司」。
工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。这一点都不夸张。
管理层担心如何证明庞大的生成式 AI 组织的成本是合理的。当生成式 AI 组织中的每个「领导」的薪资都比训练整个 DeepSeek-V3 的成本还要高,而我们有好几十个这样的「领导」时,他们要如何面对高层?
DeepSeek-R1 让情况变得更加可怕。虽然我不能透露机密信息,但这些很快就会公开。
这本应该是一个以工程为重点的小型组织,但是因为很多人想要参与进来分一杯羹,人为地膨胀了组织的招聘规模,结果每个人都成了输家。

原贴链接:https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分别发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中,DeepSeek-V3 在发布时提到,该模型在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

不过,更引人关注的是,这个参数量高达 671B 的大型语言模型训练成本仅 558 万美元。具体来说,它的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与后训练的训练,总共也只有 278.8 H800 GPU Hours。相较之下,Meta 的 Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。

而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、自然语言推理等任务上,它的性能比肩 OpenAI o1 正式版。而且模型在发布的同时,权重同步开源。很多人惊呼,原来 DeepSeek 才是真正的 OpenAI。UC Berkeley 教授 Alex Dimakis 则认为, DeepSeek 现在已经处于领先位置,美国公司可能需要迎头赶上了。

看到这里,我们不难理解为何 Meta 的团队会陷入恐慌。如果今年推出的 Llama 4 没有点硬本事,他们「开源之光」的地位岌岌可危。

有人指出,其实该慌的不止 Meta,OpenAI、谷歌、Anthropic 又何尝没有受到挑战。「这是一件好事,我们可以实时看到公开竞争对创新的影响。」

还有人担心起了英伟达的股价,表示「如果 DeeSeek 的创新是真的,那 AI 公司是否真的需要那么多显卡?」

不过,也有人质疑,DeepSeek 究竟是靠创新还是靠蒸馏 OpenAI 的模型取胜?有人回复说,这可以从他们的发布的技术报告中找到答案。

目前,我们还无法确定帖子的真实性。

不知道 Meta 后续将如何回应,即将到来的 Llama 4 又会达到怎样的性能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一人毁掉整部剧?央视剧《主角》唯一败笔,观众:看他演戏真别扭

一人毁掉整部剧?央视剧《主角》唯一败笔,观众:看他演戏真别扭

老黯谈娱
2026-05-26 12:47:27
北京刚淘汰没多久,赵睿开启特训,为后续世预赛做准备!

北京刚淘汰没多久,赵睿开启特训,为后续世预赛做准备!

篮球资讯达人
2026-05-27 23:36:46
美国漫展惊现“新鲜脚汁” 一杯卖15美元

美国漫展惊现“新鲜脚汁” 一杯卖15美元

3DM游戏
2026-05-25 15:33:17
抗战初期,贺老总一度很闹心:120师两个首任旅长,都出了变故!

抗战初期,贺老总一度很闹心:120师两个首任旅长,都出了变故!

兴趣知识
2026-05-28 00:26:11
“不认识他,上来就扇我媳妇的脸,给她打个脑震荡”,河南一小区多位业主称物业经理喝酒后,对业主们又打又骂无差别攻击,警方已立案调查

“不认识他,上来就扇我媳妇的脸,给她打个脑震荡”,河南一小区多位业主称物业经理喝酒后,对业主们又打又骂无差别攻击,警方已立案调查

潇湘晨报
2026-05-27 21:20:16
唯一不与中国建交的邻国,首都离中国仅45公里,曾实行一妻多夫

唯一不与中国建交的邻国,首都离中国仅45公里,曾实行一妻多夫

抽象派大师
2026-05-17 02:10:48
洛夫顿最新伤情来了!亲自发声,卢伟表态,广厦翻盘机会来了?

洛夫顿最新伤情来了!亲自发声,卢伟表态,广厦翻盘机会来了?

萌兰聊个球
2026-05-27 08:09:30
东坝夜市爆火!但吐槽的也真多!

东坝夜市爆火!但吐槽的也真多!

东坝邻友圈
2026-05-27 17:21:48
黄仁勋有“分身”了?辽宁小伙穿皮衣拿显卡,播放量破百万!

黄仁勋有“分身”了?辽宁小伙穿皮衣拿显卡,播放量破百万!

雷科技
2026-05-27 18:54:20
婴儿哭了30万年,终于有人听懂

婴儿哭了30万年,终于有人听懂

碳基打工人
2026-05-18 01:39:40
倒查5年!最严医疗反腐新规动真格了

倒查5年!最严医疗反腐新规动真格了

医脉圈
2026-05-26 20:52:59
有个词叫破窗效应。如果你整天不学习,不运动,生活是不会变好的

有个词叫破窗效应。如果你整天不学习,不运动,生活是不会变好的

富书
2026-05-16 13:00:57
没想到,卷入草台风波的张雪,因台湾馆长一句话赚足海峡两岸口碑

没想到,卷入草台风波的张雪,因台湾馆长一句话赚足海峡两岸口碑

阿伧说事
2026-05-27 19:52:02
国乒赛事延期?前国手透露原因,这次想开了,王曼昱问题值得重视

国乒赛事延期?前国手透露原因,这次想开了,王曼昱问题值得重视

三十年莱斯特城球迷
2026-05-27 23:52:10
湖北大娘割四赔五后续!村干部垫钱,当地人曝更多,欺生已成习惯

湖北大娘割四赔五后续!村干部垫钱,当地人曝更多,欺生已成习惯

小鋭有话说
2026-05-27 14:12:59
教师行业倒查进入最严期,重点查处4类问题!

教师行业倒查进入最严期,重点查处4类问题!

细说职场
2026-05-27 18:29:33
欧洲主要股指收盘集体收涨

欧洲主要股指收盘集体收涨

财联社
2026-05-27 23:36:07
“后悔了”!《给阿嬷的情书》原主演称放弃机会遗憾,恳请再合作

“后悔了”!《给阿嬷的情书》原主演称放弃机会遗憾,恳请再合作

童叔不飙车
2026-05-27 13:09:52
荷兰队世界杯名单身价:赫拉芬贝赫9000万最高,全队8.39亿欧

荷兰队世界杯名单身价:赫拉芬贝赫9000万最高,全队8.39亿欧

懂球帝
2026-05-27 22:44:19
许世友酒后和386旅政委打架,惹怒了陈赓,刘伯承直接将他调走!

许世友酒后和386旅政委打架,惹怒了陈赓,刘伯承直接将他调走!

史之韵
2026-05-28 00:57:35
2026-05-28 03:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13097文章数 142653关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

头条要闻

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

旅游
本地
游戏
健康
数码

旅游要闻

5月27日最佳情报|晨韵如诗超治愈,蜀葵绽放花枝温婉雅致

本地新闻

用剪纸的方式,打开江苏扬州

IGN年度第三款满分神作!丰富度不输老头环、塞尔达

打外泌体会比干细胞更安全吗

数码要闻

雷鸟GT系列AR眼镜发布 267英寸巨幕+杜比视界 1899起

无障碍浏览 进入关怀版