网易首页 > 网易号 > 正文 申请入驻

AI竞赛进入“算账时间”:Token成本如何成为企业胜负手?

0
分享至

财联社1月2日讯(记者郭松峤)“我们平台上每天有海量的客服、推荐、风控场景需要调用大模型,Token成本就像悬在头上的‘达摩克利斯之剑’。”一位电商企业的AI技术负责人近日对财联社记者感叹,并道出了全行业的普遍焦虑。

2026年,随着人工智能大模型从技术演示走向产业落地,一个冰冷的现实摆在所有从业者面前:企业主和CIO们开始用商业的眼光,而非技术炫酷的程度,来审视每一笔AI投资。那个决定性的商业天平,最终倾斜到了一个最基础的计量单位上——Token(令牌)。

当智能体应用越铺越开,单个交互会话的Token消耗量呈指数级激增,高昂的成本结构让许多创新在规模化前,就卡死在了“经济账”上。

不过,企业的痛点,正是政策与产业发力的交汇点。

政策引擎:打响“成本歼灭战”的发令枪

进入“十五五”时期,国家对于人工智能产业发展的顶层设计,发生了从“鼓励探索”到“赋能千行百业”的深刻转变。

国家部委层面,国家数据局已将“优化算力资源布局”、“实施全国一体化算力网监测调度工程”列为重点任务,其深层逻辑正是通过优化资源配置和提升使用效率,从源头降低社会使用算力的总成本。工信部则持续推动“国货国用”,鼓励国产AI芯片及服务器等关键环节的生态突破,这不仅是供应链安全的保障,更是通过开放、竞争的市场环境,倒逼技术效能提升和成本下降。

地方的行动更为迅速直接。深圳市在其行动计划中,设定了AI算力综合成本下降的量化目标。更引人注目的是如福建漳州等地推出的“算力券”政策,直接为企业抵扣使用公共算力的费用,实质上是政府出手,替企业分担最核心的Token成本压力。

“这些政策组合拳,瞄准的正是AI产业化最后一公里的障碍——成本。”天使投资人、资深人工智能专家郭涛向财联社记者解读,“它传递的信号是,未来的竞争,不仅是技术高低的竞争,更是将技术转化为经济价值的效率竞争。”

token消耗量指数级增长

Token是大型语言模型处理信息的基本单位。用户输入的每一个字、模型输出的每一段话,都在消耗Token。因此,Token成本直接决定了调用AI服务的价格。

当前的现实是,尽管以DeepSeek为代表的开源大模型极大地降低了创新门槛,但智能体应用的普及却催生了Token消耗量的 “指数级海啸”。

据行业最新数据显示,头部科技公司的月度Token处理量已突破千万亿级别,且年增长率超过十倍。单次交互的上下文越来越长,任务规划越来越复杂,导致单任务Token消耗激增数十倍。

“这好比移动互联网初期,如果1MB流量的价格始终居高不下,就不会有今天的短视频和直播生态。”郭涛指出。他比喻,AI基础设施的 “提速降本” ,将直接决定“人工智能+”在千行百业渗透的深度与广度。

来自多方的数据也有力佐证了token消耗量的指数级增长趋势。

火山引擎最新披露的数据显示,截至今年12月,字节跳动旗下豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍,相比2024年5月刚推出时的日均调用量增长达417倍;谷歌在10月披露,其各平台每月处理的token用量已达1300万亿,相当于日均43.3万亿,而一年前月均仅为9.7万亿。

华东某大型商业银行科技部负责人告诉记者,该行一年在智能客服、风险审计、投研助手等场景的Token消耗费用已达数千万元级。“随着智能体覆盖的业务越来越复杂,交互越来越频繁,成本压力急剧上升。我们今年技术预算的一个核心KPI,就是实现单位智能业务成本的显著下降。”

这一诉求在今年以来变得尤为迫切。据财联社记者了解,包括浙江、江苏在内的多个制造业大省,在推动“智改数转”过程中,已将“AI应用成本”作为企业申报专项扶持资金的重要评估维度。

当使用量达到“百万亿token/月”的量级时,哪怕每百万token成本只下降1美元,也可能带来每月1亿美元的成本差异。浪潮信息首席AI战略官刘军认为:“token成本就是竞争力,它直接决定了智能体的盈利能力。要让AI真正进入规模化普惠阶段,token成本必须在现有基础上继续实现数量级的下降。”

硬件创新瞄准token成本瓶颈

降本呼声高涨,但为何如此之难?

财联社记者调研了解到,根源在于当前主流的AI算力基础设施,其设计基因源于大模型的“训练时代”。

训练任务像一场持续数月、需要调动全部兵力的“集团军大会战”,追求的是总体吞吐量和稳定性。而当进入“推理时代”,尤其是智能体所需的实时交互推理,任务更像是一场场要求“秒级响应”的“特种部队精确突击”。沿用旧架构,导致了三大核心瓶颈:算力利用率(MFU)严重“倒挂”、“存储墙”瓶颈加剧、横向扩展代价高昂。

面对这一结构性挑战,单纯的硬件堆砌已无解。行业领军企业开始将创新火力集中到系统架构层面,目标是实现Token成本的 “数量级跨越”。

以算力基础设施提供商浪潮信息近期发布的新品为例,其思路颇具代表性。该公司推出的元脑HC1000超扩展AI服务器,并未追求单一的算力峰值,而是瞄准了“单位算力的Token产出效率”这一新靶心。

刘军表示:“我们看到原来的AI计算是瞄着大而全去建设的,五脏俱全,各种各样的东西都在里面。但是当我们聚焦降低token成本这一核心目标之后,我们重新思考系统架构设计,找到系统瓶颈,重构出一个极简设计的系统。”

刘军强调,当前“1元/每百万token”还远远不够,面对未来token消耗量的指数级增长,若要实现单token成本的持续、数量级下降,需要推动计算架构的根本性革新。

“这也要求整个AI产业的产品技术创新,要从当前的规模导向转为效率导向,从根本上重新思考和设计AI计算系统,发展AI专用计算架构,探索开发大模型芯片,推动算法硬件化的专用计算架构创新,实现软硬件深度优化,这将是未来的发展方向。”刘军说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
42岁金莎商演3首歌35万,敬业冻红胳膊坚持挣干净钱

42岁金莎商演3首歌35万,敬业冻红胳膊坚持挣干净钱

车窗起雾q
2026-01-04 11:37:31
段子:特朗普说前俄罗斯军事顾问提供了马杜罗情报,只要价1美元

段子:特朗普说前俄罗斯军事顾问提供了马杜罗情报,只要价1美元

回旋镖
2026-01-04 13:03:41
越过转型的山丘:上汽2025驶向结构与生态的星辰大海

越过转型的山丘:上汽2025驶向结构与生态的星辰大海

汽车十三行
2026-01-04 20:33:35
独取2分晋级决赛!樊振东两场4局赢球太强了 日乒名将被他碾压

独取2分晋级决赛!樊振东两场4局赢球太强了 日乒名将被他碾压

颜小白的篮球梦
2026-01-04 20:35:20
一饭桌抓拍,撕开王石和田朴珺的“体面”!两人只剩一家共同公司

一饭桌抓拍,撕开王石和田朴珺的“体面”!两人只剩一家共同公司

火山詩话
2025-12-30 09:11:12
新加坡科学院院士国大教授陈小元,被指涉及性不端行为遭校方解雇

新加坡科学院院士国大教授陈小元,被指涉及性不端行为遭校方解雇

知社学术圈
2026-01-04 15:47:09
华北农村过冬太难!燃气费居高不下,偷烧煤会遭无人机巡查

华北农村过冬太难!燃气费居高不下,偷烧煤会遭无人机巡查

爆角追踪
2026-01-04 13:52:23
没有这种食物,你的肌肉将消失!医生:60岁后恢复肌力的7种食物

没有这种食物,你的肌肉将消失!医生:60岁后恢复肌力的7种食物

健康之光
2026-01-04 09:31:45
美军突袭抓获马杜罗,三个细节值得关注

美军突袭抓获马杜罗,三个细节值得关注

中国能源网
2026-01-04 15:34:08
泽连斯基声称支持美国抓马杜罗!但他忘了:俄罗斯可“照方抓药”

泽连斯基声称支持美国抓马杜罗!但他忘了:俄罗斯可“照方抓药”

近史博览
2026-01-04 18:00:45
当众拳打主裁头部!渝超球员被禁赛5年 球迷不满:其他人都没事?

当众拳打主裁头部!渝超球员被禁赛5年 球迷不满:其他人都没事?

风过乡
2026-01-04 20:32:02
HarmonyOS的2025:从“可用”到“好用”,鸿蒙生态从突破走向成熟

HarmonyOS的2025:从“可用”到“好用”,鸿蒙生态从突破走向成熟

钛媒体APP
2025-12-24 13:31:42
新年首个工作日,中纪委连打4“虎”,释放何种信号?

新年首个工作日,中纪委连打4“虎”,释放何种信号?

南方都市报
2026-01-04 17:30:14
宝马降价后记者实探重庆线下4S店:元旦三天卖出30多台车,销量较以往节假日增幅50%,20万元可开走入门级X1

宝马降价后记者实探重庆线下4S店:元旦三天卖出30多台车,销量较以往节假日增幅50%,20万元可开走入门级X1

极目新闻
2026-01-03 20:19:54
马杜罗戴镣铐对镜头比耶,心态很好咧嘴微笑,被捕后换了好几次衣服

马杜罗戴镣铐对镜头比耶,心态很好咧嘴微笑,被捕后换了好几次衣服

笔墨V
2026-01-04 15:25:39
委内瑞拉致函联合国安理会提出四项要求

委内瑞拉致函联合国安理会提出四项要求

新京报
2026-01-03 20:16:02
向华强公开《寻秦记》成本:古天乐差点睡天桥,电影面临巨亏

向华强公开《寻秦记》成本:古天乐差点睡天桥,电影面临巨亏

光影新天地
2026-01-04 17:47:39
中企在拉美投资“卡壳”!花22个月建成的铜矿无法投产:总统换了人,主管部门领导也换了多次

中企在拉美投资“卡壳”!花22个月建成的铜矿无法投产:总统换了人,主管部门领导也换了多次

每日经济新闻
2026-01-04 20:26:08
深圳新鹏城官宣!连签8强援,阿代米奥乌苏领衔,戴伟浚降薪回归

深圳新鹏城官宣!连签8强援,阿代米奥乌苏领衔,戴伟浚降薪回归

奥拜尔
2026-01-04 16:12:29
马杜罗为何宁做美国阶下囚,不做俄罗斯座上宾

马杜罗为何宁做美国阶下囚,不做俄罗斯座上宾

民间胡扯老哥
2026-01-04 10:09:54
2026-01-04 21:32:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
667358文章数 1016482关注度
往期回顾 全部

科技要闻

独家|宇树科技上市绿色通道被叫停

头条要闻

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

头条要闻

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

体育要闻

球队陷入危难,一名44岁教练选择复出打球

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

本地
时尚
手机
教育
数码

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

如果可以,希望鲁豫老师再工作30年!

手机要闻

荣耀Magic8 Air曝光:大R角+eSIM,性能、外围拉满!

教育要闻

高考地理中的回归年

数码要闻

GANSS迦斯推出换电鼠标FLX7:PAW3311传感器,1kHz回报率

无障碍浏览 进入关怀版