网易首页 > 网易号 > 正文 申请入驻

高效又高质量!Token-Shuffle 革新图像生成方式

0
分享至

IT之家 4 月 26 日消息,科技媒体 marktechpost 昨日(4 月 25 日)发布博文,报道称 Meta AI 创新推出 Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。

IT之家注:自回归模型是一种用于时间序列分析的统计方法,主要用于预测数据序列中的未来值。该模型的核心思想是当前的值与过去的值之间存在线性关系,因此可以用变量自身的历史数据来预测当前或未来的值。

在语言生成方面,自回归模型大放异彩,近年来也被广泛探索用于图像合成,然而在面对高分辨率图像时,AR 模型遭遇瓶颈。

不同于文本生成仅需少量 token,图像合成中高分辨率图片往往需要数千个 token,计算成本随之暴增。这让许多基于 AR 的多模态模型只能处理低中分辨率图像,限制了其在精细图像生成中的应用。

尽管扩散模型(Diffusion Models)在高分辨率上表现强劲,但其复杂的采样过程和较慢的推理速度也存在局限。

Token-Shuffle 的核心机制与优势

Meta AI 推出的 Token-Shuffle 方法直击 token 效率问题。它通过识别多模态大语言模型(MLLMs)中视觉词汇的维度冗余,提出了一种创新策略:在 Transformer 处理前,将空间上相邻的视觉 token 沿通道维度合并,推理后再恢复原始空间结构。

这种 token 融合机制大幅降低了计算成本,在保持视觉质量的同时,让自回归模型能够高效处理最高 2048×2048 分辨率的图像。Token-Shuffle 无需改动 Transformer 架构,也无需额外预训练编码器,操作简单且兼容性强。

具体而言,Token-Shuffle 包含 token-shuffle 和 token-unshuffle 两个步骤。输入准备阶段,空间相邻 token 通过 MLP(多层感知机)压缩为单个 token,减少 token 数量。

以窗口大小 s 为例,token 数量可减少 s² 分之一,显著降低 Transformer 的计算量(FLOPs)。此外,该方法还引入了针对自回归生成的 classifier-free guidance(CFG)调度器,动态调整引导强度,优化文本-图像对齐效果。

实验成果与未来潜力

Token-Shuffle 在 GenAI-Bench 和 GenEval 两大基准测试中展现了强大实力。在 GenAI-Bench 上,基于 2.7B 参数的 LLaMA 模型,Token-Shuffle 在“困难”提示下取得 VQAScore 0.77,超越其他 AR 模型如 LlamaGen(+0.18)和扩散模型 LDM(+0.15)。

在 GenEval 中,其综合得分为 0.62,为 AR 模型树立了新标杆。用户评估也显示,尽管在逻辑一致性上略逊于扩散模型,但 Token-Shuffle 在文本对齐、图像质量上优于 LlamaGen 和 Lumina-mGPT。

IT之家附上参考地址

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
外媒:40%的消费者希望中国品牌汽车进入美国市场

外媒:40%的消费者希望中国品牌汽车进入美国市场

环球网资讯
2026-03-24 13:45:12
伊朗重要人事任命,释放强烈信号!

伊朗重要人事任命,释放强烈信号!

斐君观点
2026-03-25 21:08:16
米切尔28分6板4助 NBA骑士103-120热火 诺曼-鲍威尔19分

米切尔28分6板4助 NBA骑士103-120热火 诺曼-鲍威尔19分

环球体坛啄木鸟
2026-03-26 21:22:20
从广东到东北!刘强东游艇版图扩容,150亿元项目进驻大连

从广东到东北!刘强东游艇版图扩容,150亿元项目进驻大连

南方都市报
2026-03-26 14:42:13
匈牙利外长:即日起逐步停止向乌克兰输送天然气

匈牙利外长:即日起逐步停止向乌克兰输送天然气

财联社
2026-03-26 00:09:09
CBA焦点战今夜打响!CCTV5不直播!青岛争前4,北控广州冲季后赛

CBA焦点战今夜打响!CCTV5不直播!青岛争前4,北控广州冲季后赛

北纬的咖啡豆
2026-03-26 20:24:16
WCBA季后赛:张茹三大国手对决,35分惨败国手6中0,外援16中2

WCBA季后赛:张茹三大国手对决,35分惨败国手6中0,外援16中2

体娱荒原
2026-03-26 21:27:54
巨石强森壮汉穿假体演半神,这半遮半掩的曲线,谁能顶得住?

巨石强森壮汉穿假体演半神,这半遮半掩的曲线,谁能顶得住?

娱乐领航家
2026-03-26 20:00:03
沪指失守3900点,跌近0.9%

沪指失守3900点,跌近0.9%

每日经济新闻
2026-03-26 13:14:13
内部人士:NBA或将取消快船队科怀·伦纳德的“无效”合同

内部人士:NBA或将取消快船队科怀·伦纳德的“无效”合同

好火子
2026-03-25 23:51:43
出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

策略述
2026-03-26 13:45:17
美议员喊话特朗普:如果北京不答应美国要求,就不准中国做一件事

美议员喊话特朗普:如果北京不答应美国要求,就不准中国做一件事

让心灵得以栖息
2026-03-26 05:03:07
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
CBA常规赛第30轮 上海男篮客场112-80大胜山西 李弘权27分

CBA常规赛第30轮 上海男篮客场112-80大胜山西 李弘权27分

环球体坛啄木鸟
2026-03-26 21:26:35
被美国点名后,巴基斯坦意识到了现实的残酷:不可能在中美间骑墙

被美国点名后,巴基斯坦意识到了现实的残酷:不可能在中美间骑墙

鸢飞九天
2026-03-26 20:21:07
戏都没演明白还当评委,自己都没拿过奖,坐在评审团位置不心虚吗

戏都没演明白还当评委,自己都没拿过奖,坐在评审团位置不心虚吗

娱乐圈笔娱君
2026-03-25 10:46:06
3.73-1.79!国足传来好消息,2-1爆冷世界杯鱼腩队?比赛时间如下

3.73-1.79!国足传来好消息,2-1爆冷世界杯鱼腩队?比赛时间如下

侃球熊弟
2026-03-26 21:09:11
国民党大乱!马英九紧急发声、与郑丽文决裂?萧旭岑恐遭牢狱之灾

国民党大乱!马英九紧急发声、与郑丽文决裂?萧旭岑恐遭牢狱之灾

沧海一书客
2026-03-25 12:07:49
事情闹大了,日本内阁连发公告,中国的态度,告诉了世界一个事实

事情闹大了,日本内阁连发公告,中国的态度,告诉了世界一个事实

梦史
2026-03-26 19:42:17
泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

TVB的四小花
2026-03-26 12:18:20
2026-03-26 21:59:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336122文章数 607090关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
时尚
数码
旅游
军事航空

手机要闻

15年经典落幕!MIUI正式停更,澎湃OS全面接棒

上新|| 她们说,找到了自己的人生裙子!

数码要闻

iQOO Z11x发布:LCD党的护眼神机 1499元起

旅游要闻

别再人挤人,泰州的这条老街,传承1200年!

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版