网易首页 > 网易科技 > IT业界 > 正文

外媒:DeepSeek省了训练费,但推理模型应用成"烧钱黑洞"

0
分享至

2月24日消息,尽管投资者曾一度产生疑虑,但来自大型科技企业、各国政府以及风投机构的巨额资金正以前所未有的速度流入人工智能领域。要理解这一现象背后的原因,关键在于洞察人工智能技术本身的演进趋势。

当前,人工智能技术正从传统的大语言模型向推理模型和AI代理转变。传统的大语言模型,即多数免费人工智能聊天机器人所使用的模型,其训练过程需要消耗庞大的电力和计算时间。然而,随着技术的进步,我们正在迅速找到方法,在用户调用这些模型时减少其运行所需的资源。与之不同,基于大型语言模型的推理模型,其实际运行过程消耗的计算和电力资源是传统模型的数倍。

自OpenAI于2024年9月发布其首款推理模型o1以来,人工智能公司纷纷加速推出能与之抗衡的系统。这其中包括DeepSeek R1,它震撼了整个人工智能行业,并让许多科技和能源企业的估值出现波动。上周,埃隆·马斯克(Elon Musk)旗下人工智能初创公司xAI也推出了其推理模型Grok 3。

DeepSeek的推出之所以引发了一定程度的恐慌,是因为它证明了人工智能模型可以以更低的成本进行训练,这可能会削减对数据中心和昂贵先进芯片的需求。然而,DeepSeek实际上推动了人工智能行业更坚定地迈向资源密集型的推理模型,这意味着计算基础设施的需求依然十分强劲。

鉴于推理模型具备更强大的能力,它们可能很快成为人们使用人工智能执行多种任务时的默认方式。OpenAI首席执行官山姆·奥特曼(Sam Altman)曾表示,该公司人工智能模型的下一次重大升级将包含高级推理能力。

那么,为何推理模型及其相关产品(如“深度研究”工具和AI代理)需要如此多的算力资源?答案在于它们的工作原理。

英伟达人工智能产品管理副总裁卡里·布里斯基(Kari Briski)在最近一篇博客中解释称,人工智能推理模型消耗的算力资源,通常是传统大语言模型的100倍以上,这是因为推理模型在“思维链”中需要长时间与自己对话,而这些推理过程用户往往看不见。模型消耗的算力资源与其生成的词汇量成正比,因此,如果推理模型生成的词汇量是常规模型的100倍,那么它也将消耗相应的电力和算力资源。

当推理模型接入互联网时,如谷歌、OpenAI和Perplexity的“深度研究”模型所做的那样,资源消耗会更多。这些模型对算力资源的需求还只是开始。对此,谷歌、微软和Meta计划在2025年总共投入至少2150亿美元用于资本支出,其中大部分将用于建设人工智能数据中心。这标志着他们的资本支出较去年增长了45%。

今年1月,随着中国AI模型DeepSeek R1的发布,每token的算力成本(包括电力与硬件支出)似乎将迎来断崖式下降。DeepSeek通过论文证明,其AI模型的训练与部署效率远超美国AI实验室此前公开的方法。

表面上看,这似乎预示着人工智能未来对算力资源的需求将大幅降低,可能只有当前需求的十分之一,甚至更少。但随着推理模型的问世,当它们回答查询时对算力资源的需求可能会大幅增加。简而言之,若基于DeepSeek技术的新型高效模型将AI算力需求削减至十分之一,而推理模型的普及使其使用需求激增100倍,未来整体算力需求仍将净增10倍。

而这只是起点。随着企业发现新型人工智能模型的能力更强,它们会越来越频繁地调用这些模型,这使得对算力资源的需求从模型训练转向模型使用,即人工智能行业所称的“推理”。

为其他公司提供人工智能算力资源的Baseten公司首席执行官图欣·斯里瓦斯塔瓦(Tuhin Srivastava)表示,这种向推理需求的转变已在进行中。他的客户包括在应用程序和服务中使用人工智能的科技公司,如允许内容创作者通过转录编辑音频和视频的Descript,以及处理医疗记录的初创公司PicnicHealth。

斯里瓦斯塔瓦称,随着客户自身产品需求的快速增长,他们发现需要更多的人工智能处理能力。他补充道:“六个月前,我们帮助一位客户将算力资源需求降低了60%,但仅仅三个月后,他们的算力消耗已反超原水平。”

OpenAI、谷歌和Meta等公司仍在竞相训练能力更强的人工智能模型。无论成本多高,它们的目标都是尽可能抢占尚处萌芽阶段的人工智能市场。Fractional AI首席执行官克里斯·泰勒(Chris Taylor)表示:“我认为,尖端实验室很可能需要持续投入巨额资金以推动前沿技术的发展。”他的公司,如同Baseten及蓬勃发展的人工智能生态系统中的许多其他企业,依赖这些尖端模型为客户提供服务。

风险投资家、Theory Ventures创始人托马斯·通古兹(Tomasz Tunguz)预测,未来几年,新的创新和更多人工智能专用微芯片可能使得人工智能系统比今天更高效,或使终端系统效率提升千倍。投资者和大型科技公司押注的是,在未来十年内,由于推理模型的普及和快速采用,对人工智能模型的需求可能会急剧增长。

通古兹表示:“你每一次键盘敲击,或对着麦克风说的每一个音节,每个操作节点都将由至少一个AI系统实时处理。”如果真是这样,他补充道,人工智能市场的规模可能很快会比现在扩大1000倍。(小小)

延伸阅读
相关推荐
热点推荐
“老年斑”的罪魁祸首被发现,45岁后尽量少去碰,老了也能不长斑

“老年斑”的罪魁祸首被发现,45岁后尽量少去碰,老了也能不长斑

垚垚分享健康
2026-01-23 09:48:38
美国启动所谓“和平委员会”,匈牙利、巴基斯坦、阿根廷、印尼、蒙古等18国已签署!特朗普达沃斯讲话,却遭群嘲

美国启动所谓“和平委员会”,匈牙利、巴基斯坦、阿根廷、印尼、蒙古等18国已签署!特朗普达沃斯讲话,却遭群嘲

每日经济新闻
2026-01-23 00:41:25
演员王雷方向嫣然天使基金捐款500元/月,发文称:李亚鹏太感人了,自己钱不多、富裕了再多捐

演员王雷方向嫣然天使基金捐款500元/月,发文称:李亚鹏太感人了,自己钱不多、富裕了再多捐

台州交通广播
2026-01-22 22:01:38
马克龙达沃斯论坛戴墨镜成“带货明星”,眼镜公司:接到大量“求同款”订单

马克龙达沃斯论坛戴墨镜成“带货明星”,眼镜公司:接到大量“求同款”订单

红星新闻
2026-01-23 12:26:32
终于理解为啥吕布从没斩杀有名大将,却被称为第一猛将!评论太精辟

终于理解为啥吕布从没斩杀有名大将,却被称为第一猛将!评论太精辟

热闹的河马
2024-10-08 16:25:19
夏普27分7篮板开拓者击败热火4连胜,阿夫迪亚20分7篮板

夏普27分7篮板开拓者击败热火4连胜,阿夫迪亚20分7篮板

湖人崛起
2026-01-23 13:21:50
杜兰特36+7火箭加时惜败76人 恩比德32+15+10马克西36+10

杜兰特36+7火箭加时惜败76人 恩比德32+15+10马克西36+10

醉卧浮生
2026-01-23 10:39:00
上海警方:全市严查!已抓120余人,收缴违法烟花爆竹6500余箱

上海警方:全市严查!已抓120余人,收缴违法烟花爆竹6500余箱

环球网资讯
2026-01-23 08:55:20
嫣然医院房东心态崩了?从强硬要李亚鹏道歉,到开始求过个好年

嫣然医院房东心态崩了?从强硬要李亚鹏道歉,到开始求过个好年

安宁007
2026-01-22 23:02:37
视源股份32岁程序员猝死:底薪3千24小时待岗 公司多岗位要求“抗压能力强”

视源股份32岁程序员猝死:底薪3千24小时待岗 公司多岗位要求“抗压能力强”

中国能源网
2026-01-23 09:04:03
文班26+13+5帽马刺大胜爵士 福克斯31+5+5弩机17+11+14

文班26+13+5帽马刺大胜爵士 福克斯31+5+5弩机17+11+14

醉卧浮生
2026-01-23 12:27:47
特朗普达沃斯论坛三种错!两个涉及中国!

特朗普达沃斯论坛三种错!两个涉及中国!

新民周刊
2026-01-23 09:10:13
马斯克创造历史,身家即将突破55000亿

马斯克创造历史,身家即将突破55000亿

新行情
2026-01-22 14:10:00
永远不可能被抹杀的历史:四野部队里的那三万日籍士兵

永远不可能被抹杀的历史:四野部队里的那三万日籍士兵

深度报
2026-01-21 21:25:16
唯一在世的中共一代领导人,曾任中央政治局常委,如今109岁

唯一在世的中共一代领导人,曾任中央政治局常委,如今109岁

霹雳炮
2026-01-22 23:01:02
“光速升迁”的朝鲜副总理,被当场罢免

“光速升迁”的朝鲜副总理,被当场罢免

中国新闻周刊
2026-01-22 18:56:04
年薪400万银行高管被曝“失联”,官方暂未回应,反腐猜测四起

年薪400万银行高管被曝“失联”,官方暂未回应,反腐猜测四起

老猫观点
2026-01-20 08:04:27
货车司机高速上倒车捡配电柜索要5000元报酬,失主:货价1.8万元,无奈给了4300元

货车司机高速上倒车捡配电柜索要5000元报酬,失主:货价1.8万元,无奈给了4300元

极目新闻
2026-01-23 00:48:44
丹麦称已开始与美国合作,正参与格陵兰岛框架协议谈判

丹麦称已开始与美国合作,正参与格陵兰岛框架协议谈判

界面新闻
2026-01-23 07:06:18
米兰冬奥会中国参赛运动员名单公示:谷爱凌、苏翊鸣等在列

米兰冬奥会中国参赛运动员名单公示:谷爱凌、苏翊鸣等在列

界面新闻
2026-01-23 09:22:23
2026-01-23 13:36:49

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

媒体:特朗普达沃斯论坛上犯了三种错 两个涉及中国

头条要闻

媒体:特朗普达沃斯论坛上犯了三种错 两个涉及中国

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

“四十不惑”的吉利 信力不信命

态度原创

游戏
本地
家居
手机
公开课

PS5暴死新游被LGBT群体嘲讽:这就是"反觉醒"的下场

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

家居要闻

在家度假 160平南洋混搭宅

手机要闻

vivo V70 FE手机曝光:额定6870mAh电池、55W充电、IP68防水

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×