网易首页 > 网易号 > 正文 申请入驻

AI部署中的隐性成本:在企业应用中 Claude 模型可能比 GPT 贵 20-30%

0
分享至

众所周知,不同的模型家族可能采用不同的 Tokenizer(分词器)。然而,目前对于这些分词器的“分词”过程本身存在何种差异的分析还相当有限。所有分词器是否都会对相同的输入文本产生相同数量的 Token?如果不会,那么生成的 Token 有多大差异?这种差异是否显著?

在本文中,我们探讨了这些问题,并考察了分词变异性带来的实际影响。我们对两大前沿模型家族进行了对比剖析:OpenAI 的 ChatGPT 与 Anthropic 的 Claude。尽管它们宣传的“每 Token 成本”都极具竞争力,但实验结果显示,在企业应用中,Anthropic 模型的总运行成本可能比 GPT 模型高出 20–30%。

API 定价 — Claude 3.5 Sonnet 与 GPT-4o

截至 2024 年 6 月,这两款先进的前沿模型在定价结构上极具竞争力。Anthropic 的 Claude 3.5 Sonnet 与 OpenAI 的 GPT-4o 在输出 Token 成本上相同,而 Claude 3.5 Sonnet 在输入 Token 成本方面则低 40%。

隐藏的 Tokenizer 低效性

尽管 Anthropic 模型在输入 Token 成本上较低,我们观察到,在对一组固定提示进行的实验中,使用 GPT-4o 的总体运行成本远低于 Claude Sonnet-3.5。为何会出现这种情况?

Anthropic 的分词器倾向于将相同的输入文本拆分成比 OpenAI 分词器更多的 Token。这意味着,对于相同的提示,Anthropic 模型产生的 Token 数量远多于 OpenAI 的对应模型。因此,尽管 Claude 3.5 Sonnet 在每个输入 Token 上标明的成本较低,但由于产生了更多 Token,这部分节省会被额外的分词成本所抵消,导致实际使用中的总体成本更高。

这种隐性成本源自 Anthropic 分词器对信息的编码方式,其往往使用更多的 Token 来表示相同内容。Token 数量的膨胀对成本以及上下文窗口的利用效率产生了显著影响。

领域相关的分词低效性

Anthropic 的分词器对不同类型的领域内容采用不同的分词策略,导致与 OpenAI 模型相比,其生成的 Token 数量增加的程度不一。AI 研究社区也注意到了类似的分词差异。我们在三个热门领域上对这一发现进行了测试,即:英文文章、代码 (Python) 和数学。

领域 模型输入 GPT Token Claude Token Token 超出比例 英文文章 77 89 ~16% 代码 (Python) 60 78 ~30% 数学 114 138 ~21%,Claude 3.5 Sonnet 分词器相对于 GPT-4o 的 Token 超出比例 。

在比较 Claude 3.5 Sonnet 与 GPT-4o 时,不同内容领域中分词低效性的程度存在显著差异。对于英文文章,Claude 的分词器生成的 Token 数量比 GPT-4o 多约 16%。而当内容更具结构性或技术性时,这一差异会急剧上升:对于数学公式,Token 超出比例为 21%,而对于 Python 代码,Claude 生成的 Token 数量则高出 30%。

这种差异的产生源于部分内容类型(如技术文档和代码)常包含特定的模式和符号,Anthropic 的分词器会将这些内容拆分成更小的部分,从而导致较高的 Token 数量。相较之下,自然语言内容的 Token 超出比例则较低。

分词低效性的其他实际影响

除了对成本的直接影响外,分词低效性还会间接影响上下文窗口的利用率。虽然 Anthropic 模型宣称拥有 200K Token 的更大上下文窗口(相比之下,OpenAI 的上下文窗口为 128K Token),但由于其冗长的特性,其实际可用的 Token 空间可能更少。因此,“宣传”的上下文窗口与实际“有效”上下文窗口之间可能存在或大或小的差异。

分词器的实现

GPT 模型采用 Byte Pair Encoding (BPE) 技术,该技术将经常一起出现的字符对合并以生成 Token。具体来说,最新的 GPT 模型使用的是开源的 o200k_base 分词器。GPT-4o 使用的实际 Token(在 tiktoken 分词器中)可以在这里查看。

JSON { #reasoning "o1-xxx": "o200k_base", "o3-xxx": "o200k_base", # chat "chatgpt-4o-": "o200k_base", "gpt-4o-xxx": "o200k_base", # e.g., gpt-4o-2024-05-13 "gpt-4-xxx": "cl100k_base", # e.g., gpt-4-0314, etc., plus gpt-4-32k "gpt-3.5-turbo-xxx": "cl100k_base", # e.g, gpt-3.5-turbo-0301, -0401, etc. }

遗憾的是,由于 Anthropic 的分词器不像 GPT 那样直接且易于获取,因此对其探讨的内容相对较少。Anthropic 曾于 2024 年 12 月发布了其 Token 计数 API,但在 2025 年后续版本中很快就被淘汰。

据 Latenode 报道,"Anthropic 使用的是一种独特的分词器,仅拥有 65,000 种 Token 变体,而 GPT-4 则拥有 100,261 种 Token 变体"。这个 Colab 笔记本包含了用于分析 GPT 与 Claude 模型之间分词差异的 Python 代码。另一个能够对接一些常见、公开分词器的工具也验证了我们的发现。无需调用实际模型 API 即可主动估算 Token 数量并预估成本,对于 AI 企业而言至关重要。

Anthropic 具有竞争力的定价背后隐藏着成本:尽管 Anthropic 的 Claude 3.5 Sonnet 在输入 Token 成本上比 OpenAI 的 GPT-4o 低 40%,但由于输入文本分词方式的差异,这种表面上的成本优势可能存在误导性。

隐的 "分词器低效性":Anthropic 模型天生更为冗长。对于处理大量文本的企业来说,在评估模型部署的真实成本时,理解这一差异至关重要。

领域相关的分词低效性:在选择 OpenAI 与 Anthropic 模型时,应评估输入文本的性质。对于自然语言任务来说,成本差异可能微乎其微;但对于技术性或结构化内容,Anthropic 模型可能会导致明显更高的成本。

实际上下文窗口:由于 Anthropic 分词器的冗长特性,其宣传的 200K Token 上下文窗口可用空间可能比 OpenAI 的 128K Token 更少,从而在宣传与实际有效窗口之间可能存在潜在差距。

截至发稿时,Anthropic 尚未对 VentureBeat 的置评请求作出回应。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
遭到中方拒绝后,欧盟内部终于意识到:中国已经不把他们放在眼里

遭到中方拒绝后,欧盟内部终于意识到:中国已经不把他们放在眼里

阿鄖田间生活
2026-01-19 16:38:53
4-6!中国男足真踢不过,遇苦主难进U23亚洲杯决赛,李昊神奇不再

4-6!中国男足真踢不过,遇苦主难进U23亚洲杯决赛,李昊神奇不再

国足风云
2026-01-19 22:15:04
24GB+1TB!新机官宣:1月19日,新品发布上市!

24GB+1TB!新机官宣:1月19日,新品发布上市!

科技堡垒
2026-01-19 11:54:00
刚刚确认!全国楼市开始反弹!一线城市涨74%!新一线躁动...

刚刚确认!全国楼市开始反弹!一线城市涨74%!新一线躁动...

居者
2026-01-19 14:55:37
为啥都想进体制内,这张图说明了

为啥都想进体制内,这张图说明了

微微热评
2026-01-18 20:10:08
红色才是赵今麦的本色 大胆才能穿出自信,不过这马的表情有点丰富

红色才是赵今麦的本色 大胆才能穿出自信,不过这马的表情有点丰富

草莓解说体育
2026-01-19 14:21:22
上海合作组织发布关于伊朗局势的声明

上海合作组织发布关于伊朗局势的声明

澎湃新闻
2026-01-16 21:45:09
6位顾客花19元点两碗汤,在店里留下大量垃圾,老板要求带走垃圾被怼“就这点格局”

6位顾客花19元点两碗汤,在店里留下大量垃圾,老板要求带走垃圾被怼“就这点格局”

潇湘晨报
2026-01-18 22:39:53
患癌前的聂卫平有多放纵?烟酒成瘾,连吃13只螃蟹,喝百万茅台

患癌前的聂卫平有多放纵?烟酒成瘾,连吃13只螃蟹,喝百万茅台

全球热点大揭秘
2026-01-16 19:34:46
5岁孩子长期玩"玩具",黑眼珠逐渐"消失",医生:很难恢复了

5岁孩子长期玩"玩具",黑眼珠逐渐"消失",医生:很难恢复了

大果小果妈妈
2026-01-15 20:16:55
互联网上人人遵守的君子协定,正在被AI撕得粉碎!

互联网上人人遵守的君子协定,正在被AI撕得粉碎!

码农翻身
2026-01-19 08:57:45
一波未平一波又起!闫学晶的账还没有算清,49岁李湘又“塌”了

一波未平一波又起!闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟
2026-01-19 19:00:08
省委决定:鞍山市长吴开华,出任市委书记

省委决定:鞍山市长吴开华,出任市委书记

上观新闻
2026-01-19 12:04:06
李亚鹏自曝体检后疑似患癌,忙着处理医院欠租没时间恐慌!所幸多个好消息传来

李亚鹏自曝体检后疑似患癌,忙着处理医院欠租没时间恐慌!所幸多个好消息传来

上观新闻
2026-01-19 12:44:08
罗马诺:格伊和曼城完成签约,合同5年半+周薪超过30万英镑

罗马诺:格伊和曼城完成签约,合同5年半+周薪超过30万英镑

懂球帝
2026-01-19 20:36:06
海南免税店部分金饰品售罄!金店店员:一个镯子能省1.3万,正加急补货

海南免税店部分金饰品售罄!金店店员:一个镯子能省1.3万,正加急补货

鲁中晨报
2026-01-19 14:47:01
梁小龙妻子发声:突发心脏衰竭,下午2点住院,患病到离开仅6小时

梁小龙妻子发声:突发心脏衰竭,下午2点住院,患病到离开仅6小时

鋭娱之乐
2026-01-19 15:40:55
帅化民直言之前压根没打算回大陆祭祖,究其原因着实令人唏嘘!

帅化民直言之前压根没打算回大陆祭祖,究其原因着实令人唏嘘!

达文西看世界
2026-01-18 22:14:50
牛女士道歉后续:爷爷转账100删除孩子联系方式,有人跑单位去闹

牛女士道歉后续:爷爷转账100删除孩子联系方式,有人跑单位去闹

阿纂看事
2026-01-17 09:52:50
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
2026-01-19 22:40:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15550文章数 49685关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

李亚鹏前妻:为孩子父亲点赞 多年笨拙的坚守很不容易

头条要闻

李亚鹏前妻:为孩子父亲点赞 多年笨拙的坚守很不容易

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

手机
房产
本地
健康
公开课

手机要闻

iQOO15 Ultra官宣2月初发,为极致玩家而生

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

血常规3项异常,是身体警报!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版