网易首页 > 网易号 > 正文 申请入驻

DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

0
分享至

新智元报道

编辑:KingHZ

【新智元导读】DeepSeek和xAI相继用R1和Grok-3证明:预训练Scaling Law不是OpenAI的护城河。将来95%的算力将用在推理,而不是现在的训练和推理各50%。OpenAI前途不明,生死难料!

语言模型竞技场LM Arena,新的「全能冠军」诞生了!

这次是「地球上最聪明的AI」——Grok 3。

Grok 3证明了Scaling Law的确有效,OpenAI技术护城河被攻破!

此前,DeepSeek证明不用Scaling Law也能达到OpenAI o1水平。

真是「一根筋,两头堵」:无论Scaling Law有用没用,OpenAI的技术「窗户纸」被捅破了。

这不得不怀疑OpenAI到底行不行?OpenAI的盈利模式有可持续性吗?xAI+DeepSeek又能带来什么?

Atreides Management的管理合伙人和首席投资官Gavin S. Baker,分享了自己对AI竞争的见解。

OpenAI时代结束

从2022年夏季到2024年春季,OpenAI在GPT-4上领先,直到谷歌和Anthropic追上了GPT-4。

OpenAI是首个积极采用传统「Scaling Law」进行预训练的公司,享受了大约7个季度的主导地位。

首次实现o1推理只带来了几个月的优势。

如今,DeepSeek、谷歌和xAI与OpenAI大致处于同一水平,其中xAI可能稍占优势。

谷歌和xAI预计很快会凭借其更好的基础模型,显著超越o3。

因此,OpenAI迫切需要推出GPT-5,作为未来「o5」推理模型的基础。

奥特曼都承认,OpenAI未来的领先优势将会缩小。

而微软CEO纳德拉则明确表示,在模型能力上,OpenAI一度拥有独特的优势,而这一即将结束

OpenAI没有独门秘籍

谷歌和xAI都拥有独特且有价值的数据源,这些数据源使它们逐渐区别于DeepSeek、OpenAI和Anthropic。

如果Meta在模型能力方面赶上,也会如此。

Gavin S. Baker认为:没有访问独特且有价值数据的顶级AI模型,是有史以来贬值最快的资产。

蒸馏只会加剧这一现象。

微软似乎也认同这一观点:选择了不再给OpenAI投入1600亿美元进行预训练,并取消了传闻中的数据中心建设。

如果没有访问YouTube、X、TeslaVision、Instagram和Facebook等独有数据,未来的尖端模型可能不会有投资回报(ROI)。

从这个角度看,扎克伯格的战略似乎更加合理。

最终,独有的数据可能是唯一能够带来差异化,并对预训练万亿甚至千万亿级别参数模型的投资回报的基础。

OpenAI难以一家独大

经济学家Ethan Mollick,则认为AI的确进入了新时代,OpenAI时代落幕了。

左图是训练Scaling Law,也就就是说模型规模越大,性能越强。训练更大的模型需要增加计算能力、数据和能源的使用量。

通常,需要将计算能力增加10倍以获得性能的线性增长。计算能力以FLOPs(浮点运算)衡量,这是计算机执行的基本数学运算的数量,如加法或乘法。

右图是推理Scaling Law,也就就是说模型思考越久,它表现越好。

如果让模型花更多计算能力去处理问题,就能得到更好的结果——

就像给聪明人几分钟额外时间来解决谜题一样。

这称之为测试时或推理时计算

第二个规模法则诞生了推理模型(Reasoner)。

在需要时,第三代模型都将作为Reasoners运行,因为有两个优势:更大的训练规模,以及在解决问题时具有可扩展性。

这两个Scaling Law正在极大地提升AI的数学能力,并且还在增加其他方面的能力。

如果有一个大型、智能的AI模型,就可以用它来创建更小、更快、更便宜的模型,这些模型的智能程度虽然不如母模型,但仍然相当高。

即使是小型模型,但加入了推理能力,它们会变得更加智能。这意味着AI的能力在提升,而成本却在下降。

下图展示了这一趋势的迅速发展,y轴上表示AI的能力,x轴上表示成本的对数下降。

GPT-4刚发布时,每百token大约需要50美元(大约相当于一个单词)。

而现在使用比比原始GPT-4更强大的Gemini 1.5 Flash,每百万token的成本大约只有12美分,成本下降了99%+。

GPQA是一系列非常难的多项选择题,旨在测试高级知识。拥有互联网访问权限的博士在其专业领域外的正确率为34%,在其专业领域内的正确率为81%。每百万token的成本是使用模型的成本(Gemini Flash Thinking的成本是估算的)。

OpenAI内忧外患

Gavin S. Baker认为微软之所以不给OpenAI提供1600亿美元的预训练资金,就是因为AI的预训练是前期成本,并不能带来利润。

相反,微软将提供OpenAI推理服务来赚钱。

The information估计软银今年将在OpenAI产品上投入超过20亿美元,约占OpenAI收入的20%。25-30年,OpenAI在算力上的花费为3200亿美元。2027年现金消耗达200亿美元。

而在2023年,纳德拉一度公开表示无法想象没有AI的生活,要全力押注AI。

现在微软和OpenAI的裂痕在持续加大。

去年,微软就表示将非OpenAI的模型接入到Copilot中。

在未来某个时刻,微软甚至可能使用开源模型来支持Copilot。

Copilot已有多家AI供应商

除了最大的外部合作伙伴,一些高管和重要员工也纷纷另立门户。

前CTO,Mira Murati,与OpenAI的老同事联合创立了Thinking Machines Lab,目标是AI研究和产品。 前首席科学家,Ilya Sutskever,创立了Safe Superintelligence,目标是AI安全。 创始员工,Andrej Karpathy,两度加入OpenAI,最后选择离开,创立Eureka Labs,主营业务为AI教育。 副总裁,Dario Amodei,创立Anthropic,最近刚刚推出了AI模型Claude 3.7 Sonnet。

更不要提,马斯克还在法院提起诉讼,竭力阻止奥特曼将OpenAI转为非营利公司。

AI的收入来自推理

如果Scaling Law还有效,训练数据决定了未来大模型的投资回报,那么只有2到3家公司,会进行尖端模型的预训练。

只要少数几个巨型数据中心,就足以让它们进行所需的连续集群预训练。

其余的AI计算只需要一些较小的数据中心,这些数据中心经过地理优化,从而实现了低延迟和/或高成本效益的推理。

Gavin S. Baker认为:「经济高效的推理 = 更便宜、质量较低的电力」。

现在,全世界有6-10家公司会预训练尖端模型,但到那时,一切将截然不同。

请注意,推理模型的计算量非常大。测试时的计算意味着计算就是智能。

因此,与2023-2024年整个市场的「以预训练为中心」相比,这种情况所需的计算量可能还要大。

这和目前的算力分布,完全不同:

不再是预训练和推理各占50%的情况。 而可能变成预训练只占5%,推理占95%。 很多硬件将针对推理进行优化,而很少针对预训练优化。

卓越的基础设施将至关重要。

所有这些都没有考虑到设备上(on-device)推理和/或完全量化的影响。

而超级智能(ASI)的经济效益,本质上是未知的。

Gavin S. Baker希望它们很高,但一个拥有140智商的模型,在设备上运行并访问关于世界的独特数据,对于大多数用例来说可能已经足够。

ASI(超级智能)并不需要用来预订旅行等任务。

到2030年,推理成本(即运行AI模型的成本)预计将超过训练成本,因此OpenAI需要一个长期可持续的解决方案。

如果Stargate项目未能提供与微软云服务相同的稳定性和效率,这可能会带来重大风险。

时间会证明一切。

DeepSeek效应

即便是DeepSeek梁文峰公开表示,业内对DeepSeek-R1反应过度。他表示这只是一次一般的普通的创新,世界每天都有类似这样的创新。

不妨假设一下,DeepSeek来自美国中西部某个实验室。

比如,某个计算机科学实验室买不起最新的英伟达芯片,只能使用旧硬件。

但他们有一个很棒的算法和系统部门,用几百万美元训练了一个模型:

瞧,这个模型与o1大致相当。看,我们找到了一个新的训练方法,我们优化了很多算法!

每个人都像「哦哇」一样开始尝试同样的方法,然后欢呼:这是AI进步的一周!

美国股市也不会因此蒸发一万亿美元。

DeepSeek的确在大模型训练上,取得了一些创新。但和其他从业人员一样研究同样的问题。

不仅如此,他们还发表了论文,并开源了模型。

在开源AI界,甚至出现了用最经济的方法,复刻DeepSeek-R1「顿悟时刻」的竞赛。

这一切就像是2004年的谷歌。

在2004年,谷歌在上市招股书S-1文件中,向世界透露他们使用分布式算法,在计算机网络中将商品连接在一起,实现了最佳的性价比,从而构建了最大的超级计算机集群。

谷歌S-1文件链接:https://www.sec.gov/Archives/edgar/data/1288776/000119312504073639/ds1.htm

这与当时其他所有科技公司都不同,它们只是购买越来越大的大型机。

为了跟上不断上升的交易量,一些大公司会从甲骨文购买越来越大的数据库服务器。

谷歌的S-1描述了如何能够超越大型机的可伸缩性限制。

后来,谷歌发表了MapReduce和BigTable论文,描述了用于管理和控制这个成本效益更高、功能更强大的超级计算机的算法。

谷歌在取得如此巨大成功之后,并没有马上发表论文,公开他们的做法。

相比之下,在与模型发布的同时,DeepSeek发表了论文。

DeepSeek的发展轨迹,与2004年谷歌展示自己的能力并没有什么本质不同。

竞争对手仍然需要调整并实际去做这件事,但DeepSeek推动了这一领域的发展。

认为英伟达、OpenAI、Meta、微软、谷歌等公司已经完蛋了,这种想法也没什么理由。

当然,DeepSeek是一个新的、强大的新兴公司,但AI领域不是每周都会出现这样的情况吗?

每个人都会在几个月内复制这一成就,一切都会变得更便宜。

唯一的真正后果是,AI乌托邦/末日现在比以往任何时候都要近。

参考资料:

https://x.com/GavinSBaker/status/1893348988386189774

https://x.com/SumitGup/status/1893709368480117096

https://www.oneusefulthing.org/p/a-new-generation-of-ais-claude-37

https://x.com/yishan/status/1884101107368223113

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
旅居东京三个月彻底悟透:日本遍地没早餐店,根本不是没钱没人做

旅居东京三个月彻底悟透:日本遍地没早餐店,根本不是没钱没人做

老特有话说
2026-06-24 15:07:56
全网看哭!698分高考少年查分当场崩溃:没人撑腰的孩子

全网看哭!698分高考少年查分当场崩溃:没人撑腰的孩子

手工制作阿爱
2026-06-26 02:32:17
美女法官的“赤脚秀” 为何引来群嘲

美女法官的“赤脚秀” 为何引来群嘲

宾语观世
2026-06-25 19:56:53
baby带小海绵现身港迪,素颜弓着背玩手机仍好美,3部手机抢镜

baby带小海绵现身港迪,素颜弓着背玩手机仍好美,3部手机抢镜

柒佰娱
2026-06-26 09:41:09
世界杯离谱剧本!输球比赢球更好!两队或争相摆烂

世界杯离谱剧本!输球比赢球更好!两队或争相摆烂

澜归序
2026-06-26 03:36:08
许世友打完对越反击战就被免职了。很多人说是伤亡太大背了锅

许世友打完对越反击战就被免职了。很多人说是伤亡太大背了锅

汪茫的创业之路
2026-06-24 14:49:35
日本3-1全胜巴西爆冷,世界第一逆天翻盘

日本3-1全胜巴西爆冷,世界第一逆天翻盘

李橑在北漂
2026-06-26 05:09:46
太亏了!安徽一高考生数学0分,总分458超过本科线,原因让人无语

太亏了!安徽一高考生数学0分,总分458超过本科线,原因让人无语

育学笔谈
2026-06-25 21:23:28
离谱?三浦知良确定将再踢1年,8个月后迎60大寿,毛剑卿:纯胡闹

离谱?三浦知良确定将再踢1年,8个月后迎60大寿,毛剑卿:纯胡闹

风过乡
2026-06-26 07:34:31
稀土归零5个月,光刻胶暴跌95%:中日互相卡脖子,谁先扛不住?

稀土归零5个月,光刻胶暴跌95%:中日互相卡脖子,谁先扛不住?

小陆搞笑日常
2026-06-26 03:38:03
K组彻底乱套!葡萄牙5球白赢,哥伦比亚一剑封喉,C罗被逼入绝境

K组彻底乱套!葡萄牙5球白赢,哥伦比亚一剑封喉,C罗被逼入绝境

童叔不飙车
2026-06-26 00:50:15
“香港名媛碎尸案”被害人母亲涉嫌诈骗,追逃信息疑遭民警泄露

“香港名媛碎尸案”被害人母亲涉嫌诈骗,追逃信息疑遭民警泄露

澎湃新闻
2026-06-25 19:50:03
泰缅边境又炸了!妙瓦底倒了,更血腥的“KK园区2.0”正在崛起

泰缅边境又炸了!妙瓦底倒了,更血腥的“KK园区2.0”正在崛起

小小科普员
2026-06-25 16:06:40
难以置信!第一神童宁铂,17岁留校任教,27岁被关监狱,38岁出家

难以置信!第一神童宁铂,17岁留校任教,27岁被关监狱,38岁出家

从零到一研究所
2026-06-25 17:45:36
日本有人着急了

日本有人着急了

新民周刊
2026-06-26 09:14:06
8换2大交易!森林狼获三球搭档华子冲冠 黄蜂获里德+多个选秀权

8换2大交易!森林狼获三球搭档华子冲冠 黄蜂获里德+多个选秀权

醉卧浮生
2026-06-25 21:35:42
这名带着气胸引流管高考的同学有望上清华,他说考试那天比任何时候都平静

这名带着气胸引流管高考的同学有望上清华,他说考试那天比任何时候都平静

澎湃新闻
2026-06-25 21:08:28
中国正式改口!以后不叫“日本政府”了,新称呼传递的信号不一般

中国正式改口!以后不叫“日本政府”了,新称呼传递的信号不一般

潘冹旅行浪子
2026-06-23 00:04:49
无冕之王避开巴西!布罗比3射3球创历史 荷兰3-1突尼斯头名晋级

无冕之王避开巴西!布罗比3射3球创历史 荷兰3-1突尼斯头名晋级

钉钉陌上花开
2026-06-26 08:54:31
厄瓜多尔2比1德国:足球没有理所当然!

厄瓜多尔2比1德国:足球没有理所当然!

张佳玮写字的地方
2026-06-26 06:32:00
2026-06-26 10:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15533文章数 66937关注度
往期回顾 全部

科技要闻

美国政府要求OpenAI分批发布GPT-5.6

头条要闻

牛弹琴:委内瑞拉强震或致10万人死亡 美欧被指负主责

头条要闻

牛弹琴:委内瑞拉强震或致10万人死亡 美欧被指负主责

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

刘嘉玲想放弃梁朝伟,没有自理能力

财经要闻

悬在科技头上的达摩克利斯之剑

汽车要闻

老板们的新座驾!65万元起,尊界V800/V680开启预订

态度原创

家居
亲子
数码
公开课
军事航空

家居要闻

绿意盎然 自然之境

亲子要闻

胆囊摘除后出现这五个后遗症

数码要闻

HyperX暗影精灵PRO 16:白天高效搞创作,晚上爽玩3A大作

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:驶离指定航线船舶不享有安全保障

无障碍浏览 进入关怀版