网易首页 > 网易号 > 正文 申请入驻

英伟达发布 TiDAR:单步生成多个 Token,AI 吞吐量提升近 600%

0
分享至

科技媒体 Tom's Hardware 今天(12 月 2 日)发布博文,报道称英伟达在最新论文中,详述名为 TiDAR 的新型 AI 解码方法,巧妙融合了自回归(Autoregressive)与扩散(Diffusion)两种模型机制,利用 GPU 的“空闲槽位”加速文本生成。

自回归(Autoregressive)是一种生成方式,AI 必须根据上一个字才能猜出下一个字,像接龙一样,只能按顺序一个接一个生成。

扩散(Diffusion)常用于 AI 绘画的技术,通过逐步去除噪点来生成内容,在 TiDAR 中,它被用来一次性“猜”出好几个可能的词,供后续筛选。

IT之家援引博文介绍,当前的语言模型通常一次生成一个 Token(词元),这种逐个生成的机制导致了极高的计算成本和延迟。

TiDAR 的核心理念在于利用模型推理过程中未被使用的“空闲槽位”,在不牺牲生成质量的前提下,通过单步生成多个 Token 来大幅提升响应速度并降低 GPU 运行时长。

在技术原理方面,TiDAR 创新性地训练单个 Transformer 模型同时执行两项任务:标准的自回归“下一词预测”和基于扩散的“并行起草”。

不同于以往依赖独立草稿模型的投机解码(Speculative Decoding),TiDAR 通过结构化的注意力掩码(Attention Mask)将输入分为三个区域:前缀区、验证区和起草区。

投机解码是一种加速技术,先用一个小模型快速草拟一段话,再由大模型进行检查和修正。TiDAR 试图在同一个模型内完成这两步。

这种设计让模型在利用扩散头并行起草新 Token 的同时,还能通过自回归头验证这些草稿,最关键的是,它确保了 KV 缓存(KV Cache)的结构有效性,解决了早期扩散解码器面临的部署难题。

研究团队基于 Qwen 系列模型进行了测试。在 HumanEval 和 GSM8K 等基准测试中,TiDAR 的准确率与基准模型持平甚至略有提升。

在速度方面,15 亿参数版本的 TiDAR 模型实现了 4.71 倍的吞吐量增长;而 80 亿参数版本的表现更为抢眼,吞吐量达到了 Qwen3-8B 基准的 5.91 倍。这表明在当前测试规模下,TiDAR 能有效利用 GPU 的显存带宽,在不增加额外显存搬运的情况下生成更多 Token。

该媒体指出尽管实验数据亮眼,TiDAR 目前仍面临规模扩展的挑战。论文中的测试仅限于 80 亿参数以下的中小模型,且未涉及定制化的内核级优化(如 fused kernels),仅使用了标准的 PyTorch 环境。

随着模型参数量和上下文窗口的扩大,计算密度可能会饱和,从而压缩“多 Token 扩展”的成本优势。研究人员表示,未来将在更大规模的模型上进行验证,以确定该技术是否能成为云端大规模 AI 部署的实用替代方案。

本文源自:IT之家

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

来科点谱
2026-02-20 07:16:30
哈梅内伊刚死,有一个狠人站了出来!他的话或让美以彻底笑不出来

哈梅内伊刚死,有一个狠人站了出来!他的话或让美以彻底笑不出来

通文知史
2026-03-02 16:00:07
中央定调,延迟退休后,62岁退休,比60岁退休的多领10%养老金?

中央定调,延迟退休后,62岁退休,比60岁退休的多领10%养老金?

另子维爱读史
2026-02-17 19:02:27
伊朗反抗阵营今何在?大部分“抵抗之弧”成员已参战:也门胡塞武装率先支援,黎巴嫩真主党高精度火箭弹还击,伊拉克武装袭击28次

伊朗反抗阵营今何在?大部分“抵抗之弧”成员已参战:也门胡塞武装率先支援,黎巴嫩真主党高精度火箭弹还击,伊拉克武装袭击28次

极目新闻
2026-03-03 11:51:45
美伊大战后果来了,石油涨价欧佩克宣布增产,中国能源转型很明智

美伊大战后果来了,石油涨价欧佩克宣布增产,中国能源转型很明智

甜柠聊史
2026-03-02 16:51:07
特朗普称不排除对伊派地面部队

特朗普称不排除对伊派地面部队

财联社
2026-03-03 08:59:08
年轻人累死累活挣三四千,老人拿七八千退休金,该如何破局?

年轻人累死累活挣三四千,老人拿七八千退休金,该如何破局?

猫叔东山再起
2026-02-24 10:55:03
台专家预言:一旦美以伊开战,中国将获得长达20年的战略缓冲时间

台专家预言:一旦美以伊开战,中国将获得长达20年的战略缓冲时间

诺诺谈史
2026-03-03 00:30:59
OpenAI的“五角大楼时刻”?ChatGPT卸载量暴增近300% 一星评分飙升775%

OpenAI的“五角大楼时刻”?ChatGPT卸载量暴增近300% 一星评分飙升775%

财联社
2026-03-03 13:09:14
“反诈老陈”账号被封,本人回应:问心无愧!MCN机构:即刻解除所有合约,双方合作立即终止

“反诈老陈”账号被封,本人回应:问心无愧!MCN机构:即刻解除所有合约,双方合作立即终止

都市快报橙柿互动
2026-03-01 07:15:47
街头已大量出现,不要踩!不要踩!

街头已大量出现,不要踩!不要踩!

南国今报
2026-03-01 20:00:00
历史上首次,中国石油出现连续涨停走势,并创18年以来新高!

历史上首次,中国石油出现连续涨停走势,并创18年以来新高!

有范又有料
2026-03-03 12:05:49
内贾德死亡真相

内贾德死亡真相

哲空空
2026-03-02 07:50:14
策略:明天3月4日的预判出来了,全面减仓之前,我要说两句!

策略:明天3月4日的预判出来了,全面减仓之前,我要说两句!

一担金
2026-03-03 12:08:49
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
伊朗发射近1200枚导弹报复美国和以色列

伊朗发射近1200枚导弹报复美国和以色列

中国网
2026-03-01 16:43:10
既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

既然给脸不要脸,那就彻底撕破脸!王毅外长已经把话挑明了

安安说
2026-02-01 14:01:51
“当心砸了你儿子的饭碗”,无知母亲晒公务员儿子做农活,被群嘲

“当心砸了你儿子的饭碗”,无知母亲晒公务员儿子做农活,被群嘲

妍妍教育日记
2026-02-24 18:13:37
短短两天内,伊朗大骗局露馅,最高领袖阵亡,美以双双栽跟头

短短两天内,伊朗大骗局露馅,最高领袖阵亡,美以双双栽跟头

面包夹知识
2026-03-02 17:21:21
与孔令辉分手12年,马苏坦白:那晚被黑人驮肩照,终为人生买个单

与孔令辉分手12年,马苏坦白:那晚被黑人驮肩照,终为人生买个单

喜欢历史的阿繁
2026-03-03 07:26:03
2026-03-03 16:44:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545982关注度
往期回顾 全部

科技要闻

拥抱AI的"牛马":边提效边自嘲"自费"上班

头条要闻

53岁独身女租客突发脑梗昏迷 得知其没有亲人多方犯难

头条要闻

53岁独身女租客突发脑梗昏迷 得知其没有亲人多方犯难

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

特朗普“不惜一切”!全球股债齐崩

汽车要闻

长安汽车2月销量151922辆 环比逆势增长12.8%

态度原创

艺术
游戏
家居
亲子
军事航空

艺术要闻

Nihad Aghazada:当代阿塞拜疆画家

《三国杀:一将成名》闪闪节搞大事!“猫界”顶流宫百万震撼加盟

家居要闻

万物互联 享科技福祉

亲子要闻

还得是这个,被逗得团团转

军事要闻

伊朗:击中美空军基地大楼

无障碍浏览 进入关怀版