网易首页 > 网易号 > 正文 申请入驻

英伟达发布TiDAR:单步生成多个Token,吞吐量提升近600%

0
分享至

IT之家 12 月 2 日消息,科技媒体 Tom's Hardware 今天(12 月 2 日)发布博文,报道称英伟达在最新论文中,详述名为 TiDAR 的新型 AI 解码方法,巧妙融合了自回归(Autoregressive)与扩散(Diffusion)两种模型机制,利用 GPU 的“空闲槽位”加速文本生成。

自回归(Autoregressive)是一种生成方式,AI 必须根据上一个字才能猜出下一个字,像接龙一样,只能按顺序一个接一个生成。

扩散(Diffusion)常用于 AI 绘画的技术,通过逐步去除噪点来生成内容,在 TiDAR 中,它被用来一次性“猜”出好几个可能的词,供后续筛选。

IT之家援引博文介绍,当前的语言模型通常一次生成一个 Token(词元),这种逐个生成的机制导致了极高的计算成本和延迟。

TiDAR 的核心理念在于利用模型推理过程中未被使用的“空闲槽位”,在不牺牲生成质量的前提下,通过单步生成多个 Token 来大幅提升响应速度并降低 GPU 运行时长。

在技术原理方面,TiDAR 创新性地训练单个 Transformer 模型同时执行两项任务:标准的自回归“下一词预测”和基于扩散的“并行起草”。

不同于以往依赖独立草稿模型的投机解码(Speculative Decoding),TiDAR 通过结构化的注意力掩码(Attention Mask)将输入分为三个区域:前缀区、验证区和起草区。


投机解码是一种加速技术,先用一个小模型快速草拟一段话,再由大模型进行检查和修正。TiDAR 试图在同一个模型内完成这两步。

这种设计让模型在利用扩散头并行起草新 Token 的同时,还能通过自回归头验证这些草稿,最关键的是,它确保了 KV 缓存(KV Cache)的结构有效性,解决了早期扩散解码器面临的部署难题。


研究团队基于 Qwen 系列模型进行了测试。在 HumanEval 和 GSM8K 等基准测试中,TiDAR 的准确率与基准模型持平甚至略有提升。

在速度方面,15 亿参数版本的 TiDAR 模型实现了 4.71 倍的吞吐量增长;而 80 亿参数版本的表现更为抢眼,吞吐量达到了 Qwen3-8B 基准的 5.91 倍。这表明在当前测试规模下,TiDAR 能有效利用 GPU 的显存带宽,在不增加额外显存搬运的情况下生成更多 Token。

该媒体指出尽管实验数据亮眼,TiDAR 目前仍面临规模扩展的挑战。论文中的测试仅限于 80 亿参数以下的中小模型,且未涉及定制化的内核级优化(如 fused kernels),仅使用了标准的 PyTorch 环境。

随着模型参数量和上下文窗口的扩大,计算密度可能会饱和,从而压缩“多 Token 扩展”的成本优势。研究人员表示,未来将在更大规模的模型上进行验证,以确定该技术是否能成为云端大规模 AI 部署的实用替代方案。

参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
超级厄尔尼诺正在路上!极端天气频现,今年或许会更热

超级厄尔尼诺正在路上!极端天气频现,今年或许会更热

风向观察
2026-03-29 19:39:51
中美会谈结束,沉默11天后,特朗普宣布,中国将再买2000万吨大豆

中美会谈结束,沉默11天后,特朗普宣布,中国将再买2000万吨大豆

史行途
2026-03-29 20:05:59
女足亚冠巨大争议!邓梦晔进球被吹,主裁遭炮轰:99%误判

女足亚冠巨大争议!邓梦晔进球被吹,主裁遭炮轰:99%误判

奥拜尔
2026-03-29 19:27:15
全国猪价跌破5元 创历史新低

全国猪价跌破5元 创历史新低

财联社
2026-03-29 18:02:12
“最快女护士”张水华辞职86天交出瞩目成绩单:参加4场马拉松,夺得2个冠军1次打破赛会纪录,已获20万元+价值10万元汽车

“最快女护士”张水华辞职86天交出瞩目成绩单:参加4场马拉松,夺得2个冠军1次打破赛会纪录,已获20万元+价值10万元汽车

极目新闻
2026-03-29 14:53:27
拉波:梅西离队这件事我认为自己做对了;巴萨永远是梅西的家

拉波:梅西离队这件事我认为自己做对了;巴萨永远是梅西的家

懂球帝
2026-03-29 17:22:07
不装了!徐帆回应离婚7个月后,冯小刚贴脸养女,担心的事发生了

不装了!徐帆回应离婚7个月后,冯小刚贴脸养女,担心的事发生了

共工之锚
2026-03-29 18:18:53
巴基斯坦总理同伊朗总统进行了“一个多小时”通话

巴基斯坦总理同伊朗总统进行了“一个多小时”通话

澎湃新闻
2026-03-28 19:53:13
富人的生活能有多夸张?网友:根本找不到心动还门当户对的人

富人的生活能有多夸张?网友:根本找不到心动还门当户对的人

带你感受人间冷暖
2026-03-27 00:05:14
中国警告美国:勿将冲突战乱引入亚太

中国警告美国:勿将冲突战乱引入亚太

参考消息
2026-03-29 16:18:54
去香港看演唱会火爆!皇岗口岸紧急提醒!

去香港看演唱会火爆!皇岗口岸紧急提醒!

深圳晚报
2026-03-29 20:43:17
印度发出最后警告:化肥不放行或致饥荒,14亿人饭碗成危机

印度发出最后警告:化肥不放行或致饥荒,14亿人饭碗成危机

阿伧说事
2026-03-29 17:44:45
心源性猝死来势汹汹!呼吁:每家备好6样东西,关键时刻能救命!

心源性猝死来势汹汹!呼吁:每家备好6样东西,关键时刻能救命!

阿兵科普
2026-03-28 20:08:11
突发!伊朗公布卫星图:美军一架E-3预警机被“完全摧毁”!单架替换成本超7亿美元,美军目前仅有16架

突发!伊朗公布卫星图:美军一架E-3预警机被“完全摧毁”!单架替换成本超7亿美元,美军目前仅有16架

每日经济新闻
2026-03-29 18:31:17
《李白》侵权?!单依纯致歉后,李荣浩再发四连问硬刚:倒看今天谁能糊弄过去

《李白》侵权?!单依纯致歉后,李荣浩再发四连问硬刚:倒看今天谁能糊弄过去

上观新闻
2026-03-29 17:56:07
主持人沈南参加张雪峰告别式,落泪回忆细节:他就像睡着了一样

主持人沈南参加张雪峰告别式,落泪回忆细节:他就像睡着了一样

萌神木木
2026-03-29 11:50:49
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

谈史论天地
2026-03-29 16:10:03
张雪峰的灵车细节让人泪奔,车尾挂着一棵竹子,上面系着他的衣服

张雪峰的灵车细节让人泪奔,车尾挂着一棵竹子,上面系着他的衣服

魔都姐姐杂谈
2026-03-28 18:18:48
“特朗普被内塔尼亚胡坑了”,万斯把锅甩得这么响 | 京酿馆

“特朗普被内塔尼亚胡坑了”,万斯把锅甩得这么响 | 京酿馆

新京报
2026-03-28 19:39:38
42岁男子长期被职场PUA抱住医生大哭,称一到公司门口就开始心慌,医生:他把领导的评价,当成对自己全部价值的判断

42岁男子长期被职场PUA抱住医生大哭,称一到公司门口就开始心慌,医生:他把领导的评价,当成对自己全部价值的判断

大风新闻
2026-03-28 21:28:03
2026-03-29 21:12:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336511文章数 607097关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

张凌赫事件持续升级!官方点名怒批

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

游戏
本地
数码
艺术
公开课

PS6硬件成本曝光!比PS5贵50%以上:你会买吗?

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

数码要闻

用户称M5 Max MacBook Pro在运行AI工作负载时固态硬盘温度失控

艺术要闻

314米!温哥华第一座超高层摩天楼,像“海绵礁”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版