网易首页 > 网易号 > 正文 申请入驻

AI领域Token解析:为何字少反而更耗Token?

0
分享至

该事件此前在社交平台引发讨论,有用户发现,无论用何种方式引导,MiniMax大模型都无法正常输出这三个字,要么答非所问,要么胡言乱语。

根据界面快讯报道,MiniMax排查后确认,问题根源并非所谓“禁忌词汇”,而是token机制。

“嘉祺”二字被分词器合并为独立token,但该token在后训练数据中出现频次极低,导致模型遗忘其生成能力。





Token是什么?简单粗暴点说,1个Token大约等于1.5个汉字,你让AI给你出东西,背后消耗的就是Token。

很多人误以为字数越少,AI消耗的算力就越少,却忽略了模型的底层逻辑。

这个翻译过程,就是通过分词器将内容切成碎片,这些碎片就是token,再映射成数字ID供模型处理。



分词器的核心是词表,收录着模型认识的所有token,由算法从海量语料中训练生成,和人类的分词逻辑完全不同。

一个token可能是一个汉字,也可能是多个常用汉字的组合,高频组合会被整体收录,低频组合则会被拆分。



近期百度发布的Token Factory,从侧面印证了token与成本的深度关联。该技术可减少23%的token消耗。

这背后,是AI行业从“拼参数”向“拼成本”的转型。

对企业而言,token就是AI世界的“硬通货”,每一枚token的消耗,都对应着GPU计算、显存占用和电费开支。





这种成本压力,不仅困扰着国内企业,也影响着全球AI监管走向。

5月5日,美国商务部下属NIST与Google DeepMind、Microsoft、xAI签署协议,对前沿AI模型开展部署前评估,重点关注国家安全相关风险。







4月7日Anthropic发布的Mythos模型,该模型具备自主网络攻击能力,证明前沿AI已能威胁关键基础设施。

美国的收紧,本质是担心高算力、高token消耗的前沿模型,带来不可控的安全风险。

与美国相反,欧盟在5月7日宣布简化AI规则,明确高风险AI系统实施时序,降低企业合规成本。

此前欧盟严格的监管的抬升了企业成本,使其在AI竞争中落后于中美,此次简化是在守住底线的前提下,为创新松绑。

中美欧的监管差异,背后是不同的竞争诉求,美国要守住前沿技术优势,欧盟要平衡合规与创新,中国则在推进商业化的同时,优化技术降低成本。而这一切,都绕不开token这个核心环节。





这种差距曾是国产AI的短板,但如今已逐步缩小。



GPT早年就有一个知名故障token“solid gold Maggie cup”,因训练语料中出现频次极低,模型无法解释其含义,轻则答非所问,重则逻辑混乱。

MiniMax和GPT的翻车案例,都指向同一个问题,token的质量比数量更重要。

哪怕一个token被收录进词表,若训练不充分,也会导致模型“犯蠢”,这背后是分词器算法和训练数据的双重考验。



当前主流的分词方法有三种,BPE、WordPiece与Unigram。BPE反复合并高频相邻片段,GPT系列采用这种方法;WordPiece合并标准更严格,偏向专业术语组合;Unigram则通过淘汰制精简词表,适配多语言场景。

不同方法的选择,决定了token的切分效率,也影响着企业的成本控制。

百度Token Factory之所以能降本,核心就是优化了分词逻辑和缓存机制,减少了不必要的token消耗。



很多人追捧的“省token技巧”,大多忽略了模型的底层逻辑。

AI行业的竞争,早已不只是模型参数的比拼。

当中国AI周调用量突破4.69万亿token,token成本成为企业竞争力的关键。谁能在保证性能的同时,降低token消耗,谁就能在商业化竞争中占据主动。







美国的监管收紧、欧盟的规则简化、中国企业的技术优化,本质上都是围绕AI的安全与成本展开。

token看似是一个微小的技术细节,却串联起AI技术、商业竞争和全球监管的方方面面。

字少未必省token,就像看似简单的技术细节,往往藏着最核心的竞争逻辑。



声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
NBA总裁肖华!回应阴阳合同!调查进入收尾阶段

NBA总裁肖华!回应阴阳合同!调查进入收尾阶段

篮球教学论坛
2026-06-04 18:49:53
2.0T!林肯新款SUV:16.99万元起

2.0T!林肯新款SUV:16.99万元起

手机评测室
2026-06-04 11:52:42
哀嚎一片!6月开房率仅14%,海口酒店店家哭诉“一夜无新客上门”

哀嚎一片!6月开房率仅14%,海口酒店店家哭诉“一夜无新客上门”

火山詩话
2026-06-03 10:11:59
《主角》30万包秦娥一台戏,赚60万与胡三元平分,刘四团傻得戳心

《主角》30万包秦娥一台戏,赚60万与胡三元平分,刘四团傻得戳心

知法而形
2026-06-04 10:50:17
沪电股份股价创历史新高

沪电股份股价创历史新高

证券时报
2026-06-04 14:46:02
热苏斯加盟埃弗顿?太妃糖酝酿重磅引援,多重难题阻碍交易落地

热苏斯加盟埃弗顿?太妃糖酝酿重磅引援,多重难题阻碍交易落地

球事百科吖
2026-06-04 18:54:01
苏大36岁副教授去世!生前获奖无数,父母曝死因,网友:红颜薄命

苏大36岁副教授去世!生前获奖无数,父母曝死因,网友:红颜薄命

阅微札记
2026-06-04 09:36:57
10大“微塑料”日用品排名,矿泉水第5,茶包第3,看看谁排第一名

10大“微塑料”日用品排名,矿泉水第5,茶包第3,看看谁排第一名

阿龙美食记
2026-06-03 10:54:58
陈妍希申请强制执行后,陈晓在人民日报发文,卓伟曝俩人离婚原因

陈妍希申请强制执行后,陈晓在人民日报发文,卓伟曝俩人离婚原因

记录天下风云
2026-06-04 00:15:06
郭正亮:黄仁勋在赖清德任内五次访台均未见面,是赖最大危机

郭正亮:黄仁勋在赖清德任内五次访台均未见面,是赖最大危机

海峡导报社
2026-06-04 16:34:42
两岸军机在空中遭遇,解放军精准报出台军机编号:5531、5532

两岸军机在空中遭遇,解放军精准报出台军机编号:5531、5532

阿龙聊军事
2026-06-03 21:33:26
英伟达官宣推出全球首款完全开放的全模态物理AI模型NVIDIA Cosmos 3

英伟达官宣推出全球首款完全开放的全模态物理AI模型NVIDIA Cosmos 3

财联社
2026-06-04 17:07:10
穷疯了?世界杯球迷禁带水杯,场内仅售可口可乐旗下高价矿泉水

穷疯了?世界杯球迷禁带水杯,场内仅售可口可乐旗下高价矿泉水

夜白侃球
2026-06-04 14:40:16
克里米亚正在成为俄罗斯对乌克兰战争中最重要的前线之一

克里米亚正在成为俄罗斯对乌克兰战争中最重要的前线之一

山河路口
2026-06-03 20:02:52
萨巴伦卡:不明白为什么要开着顶棚,我现在只想退出网坛

萨巴伦卡:不明白为什么要开着顶棚,我现在只想退出网坛

懂球帝
2026-06-04 00:07:25
人这一生,四大定数,皆是天意

人这一生,四大定数,皆是天意

青苹果sht
2026-06-02 05:16:02
全球4个最顶尖大脑作出共同判断,留给人类的时间只有5年了

全球4个最顶尖大脑作出共同判断,留给人类的时间只有5年了

史政先锋
2026-05-23 15:03:56
马汉航空:中国往返伊朗航线全面恢复运营

马汉航空:中国往返伊朗航线全面恢复运营

界面新闻
2026-06-04 14:19:12
央视曝光!成本一两毛卖近30元,暴利达300倍!网友:智商税

央视曝光!成本一两毛卖近30元,暴利达300倍!网友:智商税

阿纂看事
2026-06-04 16:03:51
中老年夏天必备,两大麦冬搭配,每天一杯精神好

中老年夏天必备,两大麦冬搭配,每天一杯精神好

开心美食白科
2026-06-03 20:54:57
2026-06-04 19:40:49
流云青史
流云青史
纪录真实事件,谈谈美秒人生。
2660文章数 337关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

演讲中飚脏话辱骂学生 粉笔网CEO发文二次致歉

头条要闻

演讲中飚脏话辱骂学生 粉笔网CEO发文二次致歉

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

SpaceX发行价135美元 6月12日上市交易

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

亲子
旅游
本地
教育
公开课

亲子要闻

深耕儿童呼吸过敏诊疗,儿内科呼吸中心打造专科标杆

旅游要闻

“夏嗨璧山乐满园”启幕,一起来玩水采果观赛事!

本地新闻

用杨柳青年画的方式,打开天津

教育要闻

2026届高考生可以放心了!今年高考不会很难!相反会简单!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版