网易首页 > 网易号 > 正文 申请入驻

大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024

0
分享至

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

大模型应用落地元年,谁家业务更值得关注?

Tokens使用量,正在成为最关键的衡量指标。

量子位结合市场数据观察,2024下半年国内大模型商用落地日均Tokens消耗量翻了近10倍,从1000亿级规模到10000亿规模,只用了6个月,月复合增长率达到45%。其中,10-12月增长进一步提速。

其中,只有1家云厂商商用Tokens日均消耗量的月均复合增长率超过60%

它就是火山引擎

5月份,它还停留在日均百亿级Tokens水平,不及全行业1/5;8月初突破千亿Tokens大关,并在之后保持迅速增长,12月日均Tokens市场份额占比超50%,超过其他玩家份额总和。

(初期市场变化迅速,整体估算会偏小。各厂商数据不包含各家自研模型服务商的应用消耗,比如火山引擎——豆包APP)

什么概念?

这意味着平均每秒并发Token数约为750万。按照一个生成式AI模型单次响应平均需要处理1000个Tokens,每秒就要处理7500个用户请求。

突然拉开差距,背后核心影响因素还是AI原生应用爆发

根据对外披露数据,截至12月中旬,豆包大模型的日均Tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍。

据AI产品榜应用榜数据,2024年1月至10月,中国AI原生应用(APP)累计下载量排名前5名的总下载量已经达到了1.8亿;11月全球总榜前10名中,国产AI应用占两席,豆包以5998万月活位居第二,并保持着10%以上的增速

这一趋势给To B层面也带来深刻影响,最新披露的商用落地日均Tokens规模就是最直接的证明。

透过这一数据,大模型产业落地情况,在此变得更加清晰了一些。

为什么是Tokens消耗量?

在LLM中,Token是模型理解和生成的最小意义单位。它是将自然语言文本转换成可理解格式的关键步骤。

作为原始文本数据与LLM之间的桥梁,Token能帮助模型确保文本的连贯性和一致性,有效处理各种任务,如写作、翻译和回答查询。

随着趋势发展,下一个Token预测的方式也逐渐来到多模态领域,视觉Tokenizer能将视频和图像转换为离散Token,文本和音频的Token也可以进一步合并为一个多模态联合词汇表……这意味着,文字、图片、视频、语音等不同模态信息都可以经过Token被标准化为统一的符号系统。

在行业落地层面,这一定义也被进一步认可。

阿里集团吴泳铭曾在演讲中提到,生成式AI让世界有了一个统一的语言——Token。它可以是任何文字、图像、视频和声音的代码。大模型可以通过物理世界数据的Token化,理解真实世界的方方面面,有了这样的理解,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。

那么,Token作为单位能衡量什么呢?

预训练语料规模、上下文长度、推理长度……甚至是商业价值。

首先,模型预训练用了多少Token语料,代表了它的基础知识储备含量。目前市面上的通用大模型,预训练语料库规模都在几万亿Tokens水平。

其次,模型能够理解多少Token的输入和输出,反映了它的理解能力。大模型的上下文能力、处理速度,也是以Token为单位衡量。

第三,Token还是大模型推理算力的计量单位。比如底层芯片厂商如今都会通过“每秒生成Token的数量”来证明自家产品的硬件能力。甚至如果有的模型参数未公开,也能通过它的Token生成速度来倒推模型规模(在相同硬件上即可推算)。

最后,几乎顺理成章地,Token也成为大模型API的定价单位。

目前云厂商为大模型的定价模式固定为:千输入Tokens和千输出Tokens。经过1年价格战,现如今大模型的价格已经被打到1元可买百万Tokens。

△OpenAI API部分定价

各家如何降价?背后也是一套学问。

据火山引擎智能算法负责人、火山方舟负责人吴迪透露,大模型API定价是一个科学计算的结果,其中综合了AI Infra承载力、市场未来用量、模型成本下降三个变量

在国内,云厂商也早已用大模型日平均调用量来证明自家云服务能力。包括字节、百度、腾讯在内,都在长期披露此数据。

而日调用量的单位,还是Token。

Tokens消耗量暴增,为何是现在?

大模型趋势开启后,全行业Tokens消耗量与日俱增。

2024下半年开始,几乎到了有史以来最凶猛的增长期。

IDC分享,2023年12月中国生成式AI日均Tokens处理规模(除去自有业务和生成式AI应用)还停留在35亿。4个月后,该数字翻了将近10倍;再过半年后,这个数字已经预计为1.12万亿,一年时间翻了320倍。

结合厂商们近日披露的数据,这种趋势显然还在继续。

不过,为何是现在?

一方面,从技术角度来看,RAG、智能体、多模态兴起进一步拓宽大模型应用落地场景,加速了整体趋势进展。

大模型应用落地,最首要的难题就是如何让它更懂垂直领域、私域问题,让它能帮助某个特定企业解决实际场景问题。

RAG、向量数据库的优势正好可以解决这一问题。它能快速将企业积累的海量数据充分应用,解决大模型落地的“幻觉”问题。与Agent相结合,RAG可以快速落地于企业客服、AI NPC等场景。过去一年中,RAG也是云厂商们主推产品之一。

Agent则开启了新一代智能交互范式,在2024年几乎呈现了爆发式增长。从个人助手到企业级解决方案,Agent开始出现在金融交易、医疗诊断等垂直领域;通用领域,手机、PC等终端拥抱生成式浪潮,也选择将Agent作为切入口,重塑OS以及交互方式。

而多模态AI趋势,则进一步拓宽了大模型应用落地的范畴。人类接收的信息80%来自视觉,视觉将能极大程度拓展大模型的能力便捷。比如以Sora为代表的视频生成技术已经给全球影视行业带来冲击与新思考;AI视频通话成为Apple Intelligence最引人注目的能力之一;此外,以谷歌NotebookLM为代表的AI播客类应用也杀入大众视野,AI应用本身也因为多模态趋势而变得更加丰富。

这都为大模型应用落地打开了更多新思路。

另一方面,随着一些标杆案例出现,大模型红利已经变得不容置疑。它不仅能帮助企业增效,而且落地周期短,千行百业对大模型都有着强烈需求。

IDC调研显示,大模型落地周期多在6-12个月(48.5%)和12-18个月(30.3%)之间。相比于其他IT解决方案可以更快上线,尤其是对于互联网企业或者已有AI应用基础的企业。

预计未来一年,大模型可帮助企业降低18%成本、增加2%收入、缩短24%流程时间,提高17%员工工作效率、提高7%资产利用率、提高19%产品创新水平。

比如互联网行业对于运营成本降低和产品设计创新有很突出需求,搜索问答、广告推送、商品推荐、营销文案生成、教育培训、办公辅助等均已开始规模化应用。

金融、智能终端、游戏、教育科研、汽车等领域的需求也在愈加明确,AI应用场景还在不断深入。

供给侧,行业内基础大模型格局逐渐稳定、大模型产品矩阵日渐完整,千行百业的需求到了可以实现的时刻。

最关键的是,模型费用在不断降低、模型能力在不断丰富,大模型行业在朝着更普惠的方向发展。

比如火山引擎Force冬季大会上,豆包视觉理解模型正式发布,为企业提供极具性价比的多模态大模型处理能力,0.003元/千Tokens输入,一元钱可以处理284张720P图片,比行业价格便宜85%。

两股趋势相融合,也就不难理解为何在2024下半年,市场整体Tokens使用量暴增。

数据增长背后是大模型在各个领域落地结果。

以火山引擎披露数据为例。豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。

最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。

Tokens成本还会降,规模化增长未到瓶颈

透过一系列大模型商用落地数据,大模型整体趋势发展脉络也更加清晰。

参考赛迪顾问《2024中国MaaS市场发展研究报告》,MaaS市场发展呈现出4方面特点:

  • 第一,Agent加速下AI应用开发门槛持续降低,模型将进一步在场景中深度应用;
  • 第二,成本因素影响,大小模型协同将成为主流趋势;
  • 第三,模型推理工具链生态的不断完善,将提高MaaS的模型部署效率;
  • 第四,“公有云+专有云”的MaaS部署模式将为企业用户提供安全与成本兼顾的解决方案。

MaaS市场内,Tokens成本还会进一步下降,规模化增长没有到瓶颈。

  • 第一,大模型训练成本增速放缓。随着o1范式开启,推理侧算力需求将被更加重视。同时以DeepSeek V3为代表的模型还在进一步优化训练成本。
  • 第二,算力领域来到“黄氏定律”时代,“GPU将推动AI性能实现逐年翻倍”、“没有任何物理定理可以阻止AI数据中心扩展到一百万芯片”。
  • 第三,云厂商内部模式逐渐跑通,渠道进一步打开、生态进一步建立,成本也能进一步优化。

行业内对于未来的预估,也十分有信心。火山引擎智能算法负责人吴迪曾表示,2027年豆包每天Token消耗量预计超过100万亿,是原来的100倍以上。

对应来看,当下Tokens消耗量的暴增,或许还只是大模型应用落地爆发的开始,真正的规模化增长远没有到来。

现在,更像是一个冲出起跑线的时刻。

而谁能成为这场角逐中的引领者,透过Tokens消耗量这个核心指标,可以提前窥见端倪了。

大模型趋势正在进入全新阶段:大规模商用落地。
生产力释放背后,商业机会不断涌现。我们希望通过这一系列栏目提供一种视角,分析大模型应用落地早期阶段浮现出的种种规律变化,从技术维度把握创新浪潮背后的演化路线。
以上是量子位最新原创系列策划栏目「模力熵增」第二期。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
正式裁掉!再见,NBA,一场没打白拿2660万啊,热火太难了

正式裁掉!再见,NBA,一场没打白拿2660万啊,热火太难了

球童无忌
2026-04-11 20:46:37
穆萨维伊将访华

穆萨维伊将访华

环球时报国际
2026-04-10 16:42:13
世界上最可怜的国家:全国仅两辆公交、吃青菜算土豪,面临被淹没

世界上最可怜的国家:全国仅两辆公交、吃青菜算土豪,面临被淹没

老谢谈史
2026-04-10 13:40:50
是时候摊牌了,中方明确信号:要打,战火必须烧进美国本土!

是时候摊牌了,中方明确信号:要打,战火必须烧进美国本土!

史说方休
2026-04-11 01:23:59
重庆球迷组织联合声明:抗议李镇全被罚,要求对刘浩帆同等处罚

重庆球迷组织联合声明:抗议李镇全被罚,要求对刘浩帆同等处罚

懂球帝
2026-04-11 12:11:12
卫健委明确:只要深度睡眠达到这个时长,该干嘛干嘛,别自我焦虑

卫健委明确:只要深度睡眠达到这个时长,该干嘛干嘛,别自我焦虑

路医生健康科普
2026-04-09 11:30:21
亚锦赛战报:太强了,石宇奇11-0/10-0暴打世界第6,横扫晋级决赛

亚锦赛战报:太强了,石宇奇11-0/10-0暴打世界第6,横扫晋级决赛

求球不落谛
2026-04-11 19:03:51
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
随着申花1-0战胜海港,泰山1-0,中超最新积分:榜首领先垫底20分

随着申花1-0战胜海港,泰山1-0,中超最新积分:榜首领先垫底20分

球场没跑道
2026-04-11 21:36:16
李镇全笑了!铜梁龙两球领先,张志雄处子球,全队疯狂庆祝

李镇全笑了!铜梁龙两球领先,张志雄处子球,全队疯狂庆祝

奥拜尔
2026-04-11 19:37:34
山东男篮23分惨败浙江稠州,心凉了,邱彪或已对球队失去控制

山东男篮23分惨败浙江稠州,心凉了,邱彪或已对球队失去控制

姜大叔侃球
2026-04-11 21:43:32
权力超越胡志明?苏林当选越南国家主席,身兼三职掌大权

权力超越胡志明?苏林当选越南国家主席,身兼三职掌大权

刘振起观点
2026-04-11 20:00:22
中国绝大多数小县城,其实根本没有独立创造财富的能力

中国绝大多数小县城,其实根本没有独立创造财富的能力

流苏晚晴
2026-04-11 17:53:01
壮丽归航!阿尔忒弥斯2号宇航员平安回家,人类重返月球时代正式开启

壮丽归航!阿尔忒弥斯2号宇航员平安回家,人类重返月球时代正式开启

大洛杉矶LA
2026-04-11 08:41:21
广西一小学生在闹市独自驾车行驶,被群众和交警拦下,知情人:偷拿老师车钥匙开车出来

广西一小学生在闹市独自驾车行驶,被群众和交警拦下,知情人:偷拿老师车钥匙开车出来

台州交通广播
2026-04-11 18:34:55
周一见12年后,文章开店客流爆满,马伊琍蜕变,唯有姚笛复出艰难

周一见12年后,文章开店客流爆满,马伊琍蜕变,唯有姚笛复出艰难

萌神木木
2026-04-11 20:56:36
闫闯 被问买问界M6和Model Y哪个好? 被旁边大哥一句话干沉默了

闫闯 被问买问界M6和Model Y哪个好? 被旁边大哥一句话干沉默了

周哥一影视
2026-04-11 03:19:35
全红婵后续:香港媒体先爆料,检察日报喊话严查,队友集体背刺!

全红婵后续:香港媒体先爆料,检察日报喊话严查,队友集体背刺!

眼光很亮
2026-04-09 12:34:30
黄金配角赵达结婚!是殷桃前任,模特新娘身高近1米8开豪车当老板

黄金配角赵达结婚!是殷桃前任,模特新娘身高近1米8开豪车当老板

林大师热点
2026-04-11 14:13:55
日本学生留学重心转向亚洲

日本学生留学重心转向亚洲

参考消息
2026-04-10 20:36:04
2026-04-11 22:15:00
量子位 incentive-icons
量子位
追踪人工智能动态
12457文章数 176449关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

特朗普:美方开始清理霍尔木兹海峡

头条要闻

特朗普:美方开始清理霍尔木兹海峡

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

时尚
本地
手机
健康
公开课

普通人穿衣其实很简单!构造腰线、一衣多穿,大方舒适又自然

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

手机要闻

荣耀600 Pro再次曝光,极窄四等边+超大R角,骁龙8 Elite也没落下

干细胞抗衰4大误区,90%的人都中招

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版