网易首页 > 网易号 > 正文 申请入驻

推翻「预测下一个token」范式!微信AI新研究:把token压缩成连续向量更具性价比

0
分享至


来源:量子位 | 公众号QbitAI

鱼羊 发自 凹非寺

大模型一个token一个token生成,效率太低怎么办?

微信AI联手清华大学,提出了一个新的解法:

一个token能装下的信息太少,不如把它们打包成连续向量让大模型从预测下一个token,转变为预测下一个向量


研究团队给这种新范式取名CALM(连续自回归语言模型)

实验表明,将K个词元压缩成一个连续向量,可以将语言模型建模为一系列连续向量,生成步骤减少至原来的1/K。

这样一来,模型就能在平衡性能和计算成本时,实现更高的性价比。

有网友认为,这种方法看上去越来越接近大脑实际处理上下文的方式。


还有网友提出,CALM像是DeepSeekOCR/Glyph的改进版。


提升每个预测单元的语义带宽

研究人员指出,预测下一个token的现有模型范式,一开始是因为基于字符级运行的模型计算量太大而被提出的。

也就是说,方法背后的关键思想是:提升每个文本单元的信息密度,能够缩短序列长度并显著提升模型效率。

进一步挖掘本质,可以总结出一条提升大模型生成效率的有效途径:持续提升每个预测单元的语义带宽


问题在于,如果想让一个token装更多的信息,就得把词表做得超大,反而会让计算量和存储成本爆炸。

微信AI和清华大学团队想了个办法:把多个token打包成一个连续向量,让模型每次处理一个向量,而不是一个token。这样一来,比如一个序列的长度为T,将K个token打包为1个向量,序列长度就会缩短为T/K。

他们设计了一个高保真自编码器,能将K个token压缩成一个连续向量,并能以超过99.9%的准确率从中重构原始token。


连续自回归语言模型

不过,从处理token向处理向量转变,还面临着一个重大挑战:

由于不存在有限词汇表,模型将无法借助标准的softmax层,对所有可能结果计算出明确的概率分布。

这也就意味着,需要为此开发全新的建模工具。

于是,研究团队提出了CALM——一套完整的、无需依赖概率似然的框架。


CALM框架 无似然语言建模

训练方面,CALM采用“能量损失”来教模型学习连续向量。

不用算概率,而是改用“能量分数”来判断模型生成的向量好不好。

具体来说,为了实现连续向量生成,研究人员采用轻量级生成头作为模型的核心输出组件。该生成头以最后一个隐藏状态为条件,来生成输出向量。

同时,为避免迭代式采样过程造成新的推理瓶颈,研究人员引入了Energy Transformer

Energy Transformer专为连续向量的高效单步生成设计,无需迭代,仅需1步计算即可输出连续向量。

能量损失是CALM训练Energy Transformer时用的损失函数,不依赖概率计算,而是用“距离”和“多样性约束”两个维度判断向量质量——既让生成的向量贴近真实值,又避免模型只会生成一种向量。

无似然语言模型评估

不算概率了,困惑度(Perplexity)这个评估指标也就不好用了。

为此,研究人员提出了BrierLM,一种基于布里尔分数的新型语言模型评估指标。

只需从模型中抽取样本,就能无偏地估算出BrierLM值。

实验证明,BrierLM值和困惑度高度相关,能保证对模型能力的公平比较。

无似然温度采样

现在流行的大语言模型是通过温度采样来实现可控生成的,但这同样依赖于概率分布。

CALM提出了无似然温度采样,这一算法基于拒绝采样,通过调整样本的接受概率来实现温度控制。


实验结果:更具性价比

研究人员通过实验验证,CALM在平衡性能和计算成本时更有性价比。

在标准语言建模任务上,CALM-M(K=4,参数量371M)在性能上与Transformer-S(281M参数)相当,但训练浮点运算数(FLOPs)减少了44%,推理FLOPs减少了34%。


模型越大,CALM的优势越明显。并且随着语义带宽K的增加,CALM的性能-效率比也会更优。


不过,研究人员也提到,压缩的token数K太多时,反而会导致性能下降,可能需要更换更大的模型。

论文地址:
https://arxiv.org/abs/2510.27688

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
已经没人因为出轨离婚了

已经没人因为出轨离婚了

黎兜兜
2026-01-21 21:26:05
郭富城现身北京机场,个子好矮,比正常女生矮一大截!有1米55?

郭富城现身北京机场,个子好矮,比正常女生矮一大截!有1米55?

乐悠悠娱乐
2026-01-23 10:23:33
外交部:叙利亚承诺不会允许任何实体利用叙利亚领土从事损害中国安全、主权和利益的活动

外交部:叙利亚承诺不会允许任何实体利用叙利亚领土从事损害中国安全、主权和利益的活动

环球网资讯
2026-01-22 15:58:33
泳池映芳华,半百“老斑鸠”的比基尼仪式感

泳池映芳华,半百“老斑鸠”的比基尼仪式感

飛娱日记
2026-01-20 10:53:50
陈幸同正式公开恋情

陈幸同正式公开恋情

最爱乒乓球
2026-01-23 00:04:58
孙悦自曝录春晚被冻伤,满脸通红引网友心疼

孙悦自曝录春晚被冻伤,满脸通红引网友心疼

红星新闻
2026-01-21 12:12:25
战役结束,陈毅来到六纵,对皮定均说:你小子副司令是干不成了!

战役结束,陈毅来到六纵,对皮定均说:你小子副司令是干不成了!

史之铭
2026-01-23 03:56:47
中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

中国向全世界披露:美国4400颗卫星,包围中国空间站,这是要做啥

素衣读史
2026-01-17 18:35:57
“矮大紧”事后补料,“牢A”理论更扎实!

“矮大紧”事后补料,“牢A”理论更扎实!

达文西看世界
2026-01-22 10:52:23
马克龙受了奇耻大辱,转头对中国提出两个请求,特朗普紧急摊牌

马克龙受了奇耻大辱,转头对中国提出两个请求,特朗普紧急摊牌

策略述
2026-01-22 12:48:55
太奢侈!怪不得许多国家拖欠联合国会费,看看都把钱花什么地方了

太奢侈!怪不得许多国家拖欠联合国会费,看看都把钱花什么地方了

我心纵横天地间
2026-01-22 19:25:01
美国卡脖子,被广东佛山一家工厂破解,连台积电都来排队

美国卡脖子,被广东佛山一家工厂破解,连台积电都来排队

涵豆说娱
2026-01-22 18:37:29
国家要给涨养老金和工资了?先别高兴,国家要动有房人的蛋糕了?

国家要给涨养老金和工资了?先别高兴,国家要动有房人的蛋糕了?

现代小青青慕慕
2026-01-14 12:58:46
吴石遗孀王碧奎 1950 年夫牺牲,台颠沛 30 年拒返赴美吐隐情

吴石遗孀王碧奎 1950 年夫牺牲,台颠沛 30 年拒返赴美吐隐情

磊子讲史
2026-01-06 11:48:34
央视官宣!国足冲亚洲杯冠军,足协重要决定:安东尼奥新职位曝光

央视官宣!国足冲亚洲杯冠军,足协重要决定:安东尼奥新职位曝光

冷紫葉
2026-01-22 19:20:23
车臣王卡德罗夫儿子车祸入ICU,幕后真相竟然如此离奇!

车臣王卡德罗夫儿子车祸入ICU,幕后真相竟然如此离奇!

世界探索者探索
2026-01-22 17:48:27
休媒怒批申京软弱无能!火蜜建议决胜时刻DNP:在场-18各种误攻

休媒怒批申京软弱无能!火蜜建议决胜时刻DNP:在场-18各种误攻

颜小白的篮球梦
2026-01-23 10:55:24
重庆彭水县多所中学迎来献血车,同学们积极踊跃参与献血

重庆彭水县多所中学迎来献血车,同学们积极踊跃参与献血

映射生活的身影
2026-01-23 08:58:46
中国人寿HR讥讽本科求职者不配有双休,公司该学历员工达7.17万人

中国人寿HR讥讽本科求职者不配有双休,公司该学历员工达7.17万人

商业透镜
2026-01-22 15:55:59
唐伯虎真迹现身美国,世上仅此一件,网友:让当代书家汗颜

唐伯虎真迹现身美国,世上仅此一件,网友:让当代书家汗颜

幸福娃3790
2025-12-04 11:10:09
2026-01-23 11:56:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4493文章数 37399关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

面值400元“马钞”卖了3000元 有人报价4600元

头条要闻

面值400元“马钞”卖了3000元 有人报价4600元

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

“四十不惑”的吉利 信力不信命

态度原创

手机
本地
数码
家居
教育

手机要闻

华为Pura80/Pro/ Pro+系列开启新年礼遇,至高可享1500元优惠

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

数码要闻

GL.iNet安全网关GL-MT5000发售:支持OpenWRT,569元

家居要闻

在家度假 160平南洋混搭宅

教育要闻

143:21!高校“博士热”:学历内卷下硕士生的困境与破局

无障碍浏览 进入关怀版