网易首页 > 网易科技 > IT业界 > 正文

外媒:DeepSeek省了训练费,但推理模型应用成"烧钱黑洞"

0
分享至

2月24日消息,尽管投资者曾一度产生疑虑,但来自大型科技企业、各国政府以及风投机构的巨额资金正以前所未有的速度流入人工智能领域。要理解这一现象背后的原因,关键在于洞察人工智能技术本身的演进趋势。

当前,人工智能技术正从传统的大语言模型向推理模型和AI代理转变。传统的大语言模型,即多数免费人工智能聊天机器人所使用的模型,其训练过程需要消耗庞大的电力和计算时间。然而,随着技术的进步,我们正在迅速找到方法,在用户调用这些模型时减少其运行所需的资源。与之不同,基于大型语言模型的推理模型,其实际运行过程消耗的计算和电力资源是传统模型的数倍。

自OpenAI于2024年9月发布其首款推理模型o1以来,人工智能公司纷纷加速推出能与之抗衡的系统。这其中包括DeepSeek R1,它震撼了整个人工智能行业,并让许多科技和能源企业的估值出现波动。上周,埃隆·马斯克(Elon Musk)旗下人工智能初创公司xAI也推出了其推理模型Grok 3。

DeepSeek的推出之所以引发了一定程度的恐慌,是因为它证明了人工智能模型可以以更低的成本进行训练,这可能会削减对数据中心和昂贵先进芯片的需求。然而,DeepSeek实际上推动了人工智能行业更坚定地迈向资源密集型的推理模型,这意味着计算基础设施的需求依然十分强劲。

鉴于推理模型具备更强大的能力,它们可能很快成为人们使用人工智能执行多种任务时的默认方式。OpenAI首席执行官山姆·奥特曼(Sam Altman)曾表示,该公司人工智能模型的下一次重大升级将包含高级推理能力。

那么,为何推理模型及其相关产品(如“深度研究”工具和AI代理)需要如此多的算力资源?答案在于它们的工作原理。

英伟达人工智能产品管理副总裁卡里·布里斯基(Kari Briski)在最近一篇博客中解释称,人工智能推理模型消耗的算力资源,通常是传统大语言模型的100倍以上,这是因为推理模型在“思维链”中需要长时间与自己对话,而这些推理过程用户往往看不见。模型消耗的算力资源与其生成的词汇量成正比,因此,如果推理模型生成的词汇量是常规模型的100倍,那么它也将消耗相应的电力和算力资源。

当推理模型接入互联网时,如谷歌、OpenAI和Perplexity的“深度研究”模型所做的那样,资源消耗会更多。这些模型对算力资源的需求还只是开始。对此,谷歌、微软和Meta计划在2025年总共投入至少2150亿美元用于资本支出,其中大部分将用于建设人工智能数据中心。这标志着他们的资本支出较去年增长了45%。

今年1月,随着中国AI模型DeepSeek R1的发布,每token的算力成本(包括电力与硬件支出)似乎将迎来断崖式下降。DeepSeek通过论文证明,其AI模型的训练与部署效率远超美国AI实验室此前公开的方法。

表面上看,这似乎预示着人工智能未来对算力资源的需求将大幅降低,可能只有当前需求的十分之一,甚至更少。但随着推理模型的问世,当它们回答查询时对算力资源的需求可能会大幅增加。简而言之,若基于DeepSeek技术的新型高效模型将AI算力需求削减至十分之一,而推理模型的普及使其使用需求激增100倍,未来整体算力需求仍将净增10倍。

而这只是起点。随着企业发现新型人工智能模型的能力更强,它们会越来越频繁地调用这些模型,这使得对算力资源的需求从模型训练转向模型使用,即人工智能行业所称的“推理”。

为其他公司提供人工智能算力资源的Baseten公司首席执行官图欣·斯里瓦斯塔瓦(Tuhin Srivastava)表示,这种向推理需求的转变已在进行中。他的客户包括在应用程序和服务中使用人工智能的科技公司,如允许内容创作者通过转录编辑音频和视频的Descript,以及处理医疗记录的初创公司PicnicHealth。

斯里瓦斯塔瓦称,随着客户自身产品需求的快速增长,他们发现需要更多的人工智能处理能力。他补充道:“六个月前,我们帮助一位客户将算力资源需求降低了60%,但仅仅三个月后,他们的算力消耗已反超原水平。”

OpenAI、谷歌和Meta等公司仍在竞相训练能力更强的人工智能模型。无论成本多高,它们的目标都是尽可能抢占尚处萌芽阶段的人工智能市场。Fractional AI首席执行官克里斯·泰勒(Chris Taylor)表示:“我认为,尖端实验室很可能需要持续投入巨额资金以推动前沿技术的发展。”他的公司,如同Baseten及蓬勃发展的人工智能生态系统中的许多其他企业,依赖这些尖端模型为客户提供服务。

风险投资家、Theory Ventures创始人托马斯·通古兹(Tomasz Tunguz)预测,未来几年,新的创新和更多人工智能专用微芯片可能使得人工智能系统比今天更高效,或使终端系统效率提升千倍。投资者和大型科技公司押注的是,在未来十年内,由于推理模型的普及和快速采用,对人工智能模型的需求可能会急剧增长。

通古兹表示:“你每一次键盘敲击,或对着麦克风说的每一个音节,每个操作节点都将由至少一个AI系统实时处理。”如果真是这样,他补充道,人工智能市场的规模可能很快会比现在扩大1000倍。(小小)

延伸阅读
相关推荐
热点推荐
湖人输在哪:东契奇眼睛受伤最后两攻甩锅 詹姆斯丢压哨绝杀三分

湖人输在哪:东契奇眼睛受伤最后两攻甩锅 詹姆斯丢压哨绝杀三分

醉卧浮生
2026-02-25 14:00:24
三只羊(小杨哥)借壳美股上市股价大起大落,蛋蛋晒合影引发热议!辛巴被曝无法回国!

三只羊(小杨哥)借壳美股上市股价大起大落,蛋蛋晒合影引发热议!辛巴被曝无法回国!

TVB的四小花
2026-02-24 11:36:02
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
年轻时是游泳健将,这大体格看着太健康了,气血足大气漂亮!

年轻时是游泳健将,这大体格看着太健康了,气血足大气漂亮!

健身狂人
2026-02-26 01:54:59
升糖最快的主食被揪出,是白米饭的8倍,专家:糖尿病人别吃了

升糖最快的主食被揪出,是白米饭的8倍,专家:糖尿病人别吃了

小舟谈历史
2025-10-13 09:19:21
赚中国人的钱,却扬言“不用中国人”,美国巨头终于把自己作死了

赚中国人的钱,却扬言“不用中国人”,美国巨头终于把自己作死了

Hi科普啦
2026-02-24 14:47:21
农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

白云故事
2026-01-22 17:30:05
新华鲜报|乐享消费!节日支付数据看热气腾腾中国年

新华鲜报|乐享消费!节日支付数据看热气腾腾中国年

新华社
2026-02-24 23:28:07
史上最热过年确定,春季已大范围偏早!网友:今年夏天会不会热哭?

史上最热过年确定,春季已大范围偏早!网友:今年夏天会不会热哭?

中国气象爱好者
2026-02-25 21:37:24
天生一张娃娃脸都已经46了,你敢想

天生一张娃娃脸都已经46了,你敢想

超人强动物俱乐部
2026-02-25 19:21:58
听说闫学晶炫富导致中央戏剧学院的管理层都被团灭了!

听说闫学晶炫富导致中央戏剧学院的管理层都被团灭了!

达文西看世界
2026-02-15 20:25:40
央视直播中日男篮对决,篮协主席:世预赛已到最危险时刻!

央视直播中日男篮对决,篮协主席:世预赛已到最危险时刻!

篮球看比赛
2026-02-25 19:43:24
王楚然的腿有点粗呀,但身材整体上还是无敌的存在!

王楚然的腿有点粗呀,但身材整体上还是无敌的存在!

动物奇奇怪怪
2026-02-25 16:07:41
体坛联播|欧冠16强出炉:皇马、大巴黎入围,尤文图斯止步

体坛联播|欧冠16强出炉:皇马、大巴黎入围,尤文图斯止步

澎湃新闻
2026-02-26 08:02:35
毛奇、李佩霞2026年近况公布,两人服刑结局给所有人提了醒

毛奇、李佩霞2026年近况公布,两人服刑结局给所有人提了醒

娱乐督察中
2026-02-21 03:23:47
印度挺不住了,面对未来的停电危机,给中企画了张7000多亿的大饼

印度挺不住了,面对未来的停电危机,给中企画了张7000多亿的大饼

大鱼简科
2026-02-25 22:21:52
76年周恩来逝世,遗体告别江青来得最晚,一进门就大喊:大姐在哪

76年周恩来逝世,遗体告别江青来得最晚,一进门就大喊:大姐在哪

春秋砚
2026-02-26 08:15:07
42岁曲婉婷现状,面相越来越西方化,住小公寓穿起球毛衣账号被封

42岁曲婉婷现状,面相越来越西方化,住小公寓穿起球毛衣账号被封

削桐作琴
2026-02-23 22:00:18
韧带撕裂赛季报销,火箭悍将惹下大祸,大合同彻底泡汤了!

韧带撕裂赛季报销,火箭悍将惹下大祸,大合同彻底泡汤了!

君子一剑似水流年
2026-02-25 06:53:46
欧冠16强:英超6队 西甲3队 德甲2队 法甲意甲葡超土超挪超1队

欧冠16强:英超6队 西甲3队 德甲2队 法甲意甲葡超土超挪超1队

智道足球
2026-02-26 07:33:49
2026-02-26 09:15:00

科技要闻

“机器人只跳舞,没什么用”

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

健康
艺术
时尚
手机
军事航空

转头就晕的耳石症,能开车上班吗?

艺术要闻

一幅眼花缭乱草书:从书法创作到青少年书法教育的思考

伦敦时装周|2026秋冬流行趋势早知道

手机要闻

三星Galaxy S26系列手机AI功能盘点:升级Bixby,筛选陌生来电

军事要闻

美政府给新伊核协议设限内容遭披露

无障碍浏览 进入关怀版
×