网易首页 > 网易号 > 正文 申请入驻

不同凡响:NVIDIA RTX AI Toolkit 现提供多 LoRA 支持

0
分享至

在 RTX AI PC 和工作站上使用最新版 RTX AI Toolkit 微调 LLM,最高可将性能提升至原来的 6 倍。

凭借其快速理解、总结和生成基于文本的内容的能力,大语言模型(LLM)正在推动 AI 领域中的一些极为激动人心的发展。

LLM 的这些能力可支持各种场景,包括生产力工具、数字助理、电子游戏中的 NPC 等。但它们并非万能的解决方案,开发者通常必须对 LLM 进行微调,使 LLM 适应他们应用的需求。

NVIDIA RTX AI Toolkit 可通过一种名为“低秩自适应(LoRA)”的技术,让用户轻松地在 RTX AI PC 和工作站上微调和部署 AI 模型。现已推出的最新版支持在 NVIDIA TensorRT-LLM AI 加速库中同时使用多个 LoRA,最高可将微调模型的性能提升至原来的 6 倍。

通过微调提升性能

LLM 必须经过精心定制,才能实现更高的性能并满足用户日益增长的需求。

虽然这些基础模型是基于海量数据训练出来的,但它们通常缺乏开发者的特定场景所需的上下文。例如,通用型 LLM 可以生成游戏对话,但很可能会忽略文风的细微差别和微妙之处。例如,以一位有着黑暗过往并蔑视权威的林地精灵的口吻编写对话时,LLM 很有可能会忽略需要展现出来的微妙文风。

为了获得更符合自己需求的输出,开发者可以使用与应用场景相关的信息对模型进行微调。

以开发一款利用 LLM 生成游戏内对话的应用为例。微调时,首先需要使用预训练模型的权重,例如角色可能会在游戏中说出的内容的相关信息。为使对话符合相应文风,开发者可以基于较小的示例数据集(例如以更诡异或更邪恶的语气编写的对话)调整模型。

在某些情况下,开发者可能希望同时运行所有不同的微调流程。例如,他们可能希望为不同的内容频道生成以不同的语气编写的营销文案。同时,他们可能还希望总结文档并提出文风方面的建议,以及为文生图工具起草电子游戏场景描述和图像提示词。

同时运行多个模型并不现实,因为 GPU 显存无法同时容纳所有模型。即使能同时容纳,模型的推理时间也会受制于显存带宽(即 GPU 从显存读取数据的速度)。

拥抱 LoRA 技术

解决上述问题的常用方法是使用低秩自适应(LoRA)等微调技术。简单来说,您可以将这种技术视为补丁文件,其中包含微调流程中的定制过程。

训练完毕后,定制的 LoRA 可以在推理过程中与基础模型无缝集成,额外的性能开销极少。开发者可以将多个 LoRA 连接到单个模型上,以服务多种场景。这样既能使显存占用率保持在较低水平,又能为各个特定场景提供所需的额外细节内容。

使用多 LoRA 功能通过单个基础模型同时支持多个客户端和场景的架构图

在实际操作中,这意味着应用可以在显存中只保留一个基础模型,同时使用多个 LoRA 实现多种定制。

这个过程称为多 LoRA 服务。当对模型进行多次调用时,GPU 可以并行处理所有调用,更大限度地利用其 Tensor Core 并尽可能减少对显存和带宽的需求,以便开发者在工作流中高效使用 AI 模型。使用多 LoRA 的微调模型的性能最高可提升至原来的 6 倍。

在 GeForce RTX 4090 台式电脑 GPU 上运行 Llama 3B int4 时,应用 LoRA 的 LLM 的推理性能。输入序列长度为 1,000 个 token,输出序列长度为 100 个 token。LoRA 最大秩为 64。

在前文所述的游戏内对话应用的示例中,通过使用多 LoRA 服务,应用的范围可以扩展到同时生成剧情元素和插图,两者都是由单个提示驱动的。

用户可以输入基本的剧情创意,然后 LLM 会充实这个概念,在基本创意的基础上进行扩展,提供详细的基础剧情。然后,应用可以使用相同的模型,并通过两个不同的 LoRA 进行增强,以完善剧情并生成相应的图像。其中一个 LoRA 负责生成 Stable Diffusion 提示词,以便使用本地部署的 Stable Diffusion XL 模型创建视觉效果。同时,另一个针对剧情写作进行微调的 LoRA 可以编写出结构合理、引人入胜的叙事内容。

在这种情况下,两次推理均使用相同的模型,这可确保推理过程所需的空间不会显著增加。第二次推理涉及文本和图像生成,采用批量推理的方式执行。这使得整个过程能够在 NVIDIA GPU 上异常快速且高效地推进。这样一来,用户便能快速迭代不同版本的剧情,轻松完善叙事和插图。

LLM 正在成为现代 AI 的一大重要组成部分。随着采用率和集成率的提升,对于功能强大、速度快、具有特定于应用的定制功能的 LLM 的需求也将与日俱增。RTX AI Toolkit 新增的多 LoRA 支持可为开发者提供强有力的全新方法来加速满足上述需求。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
米兰冬奥首秀:隋文静/韩聪顶压登场 虽有瑕疵仍获65.37分

米兰冬奥首秀:隋文静/韩聪顶压登场 虽有瑕疵仍获65.37分

环球体坛啄木鸟
2026-02-06 22:32:14
萝莉岛成员再添一员猛将!十四世达赖出现,靠邪教演讲获利694万

萝莉岛成员再添一员猛将!十四世达赖出现,靠邪教演讲获利694万

社会酱
2026-02-06 17:39:23
欧盟委员会主席冯德莱恩:欧盟委员会正提出对俄罗斯一揽子新制裁措施

欧盟委员会主席冯德莱恩:欧盟委员会正提出对俄罗斯一揽子新制裁措施

财联社
2026-02-06 22:10:11
大获全胜!国乒陈熠3:1淘汰日本早田希娜,成功晋级亚洲杯女单8强

大获全胜!国乒陈熠3:1淘汰日本早田希娜,成功晋级亚洲杯女单8强

国乒二三事
2026-02-07 11:45:23
热泪盈眶!王濛现身冬奥开幕式:祝中国队身披华服 一起过个好年

热泪盈眶!王濛现身冬奥开幕式:祝中国队身披华服 一起过个好年

风过乡
2026-02-07 09:52:35
68人被交易破纪录!截止日后买断市场来袭 8条大鱼中数人适配火箭

68人被交易破纪录!截止日后买断市场来袭 8条大鱼中数人适配火箭

锅子篮球
2026-02-06 19:28:10
原来家族遗传癌症有可能是因为遗传的厨艺!网友:一语惊醒梦中人

原来家族遗传癌症有可能是因为遗传的厨艺!网友:一语惊醒梦中人

夜深爱杂谈
2026-02-06 18:25:23
孙颖莎击败金娜英,桥本帆乃香击败申裕斌,都是综合实力强

孙颖莎击败金娜英,桥本帆乃香击败申裕斌,都是综合实力强

子水体娱
2026-02-07 11:30:33
广东一小伙去饭店吃饭,吃完不给钱就走,老板娘回看监控却愣了

广东一小伙去饭店吃饭,吃完不给钱就走,老板娘回看监控却愣了

子芫伴你成长
2026-02-07 08:05:03
陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛

陈赫前妻许婧和匈牙利老公在沙特庆生,39 岁身材超棒,太吸睛

陈意小可爱
2026-02-07 09:53:51
嫡长子的压迫感到底有多大!

嫡长子的压迫感到底有多大!

另子维爱读史
2026-02-06 20:22:00
伊朗装甲车街头碾压抗议者 加拿大强烈谴责

伊朗装甲车街头碾压抗议者 加拿大强烈谴责

桂系007
2026-02-06 07:01:11
库迪终止9.9元价格战,咖啡低价策略不香了?

库迪终止9.9元价格战,咖啡低价策略不香了?

Barrons巴伦
2026-02-06 11:56:28
三亚不香了?东北人撤离成潮,压垮他们的不是物价,而是生活现实

三亚不香了?东北人撤离成潮,压垮他们的不是物价,而是生活现实

历史求知所
2025-12-09 20:55:05
上海动真格!3月起住院无需家属陪护,但有一笔钱得说清楚了!

上海动真格!3月起住院无需家属陪护,但有一笔钱得说清楚了!

娱乐洞察点点
2026-02-06 20:45:04
重新签约森林狼!康利钻了空子,NBA要改规则了!

重新签约森林狼!康利钻了空子,NBA要改规则了!

德译洋洋
2026-02-07 12:12:52
"肮脏混乱"!比尔盖茨前妻公开手撕前夫! 这么说性病、喂药

"肮脏混乱"!比尔盖茨前妻公开手撕前夫! 这么说性病、喂药

华人星光
2026-02-06 11:29:15
赖清德最害怕的事发生?敏感时刻,国民党访团抵京,大陆盛情招待

赖清德最害怕的事发生?敏感时刻,国民党访团抵京,大陆盛情招待

君君文谈
2026-02-07 13:40:08
大逆转!湖人双杀76人,詹姆斯一战连创3大神迹,东契奇腿筋重伤

大逆转!湖人双杀76人,詹姆斯一战连创3大神迹,东契奇腿筋重伤

老侃侃球
2026-02-06 13:41:46
千万粉丝一夜清零:军事顶流“听风的蚕”被封,踩中了哪些红线?

千万粉丝一夜清零:军事顶流“听风的蚕”被封,踩中了哪些红线?

月满大江流
2026-02-05 09:17:22
2026-02-07 14:52:49
NVIDIA英伟达中国 incentive-icons
NVIDIA英伟达中国
英伟达(中国)官方账号
3384文章数 1438关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

发视频影射奥巴马夫妇 特朗普拒绝道歉还"甩锅"

头条要闻

发视频影射奥巴马夫妇 特朗普拒绝道歉还"甩锅"

体育要闻

中国体育代表团亮相米兰冬奥会开幕式

娱乐要闻

何超欣说和何猷君没竞争,实力遭质疑

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

AITO问界与Abu Dhabi Motors达成战略合作

态度原创

艺术
本地
健康
公开课
军事航空

艺术要闻

江西省美协 | 2026年度作品展油画选刊

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

重大转变 特朗普签令调整军售排序

无障碍浏览 进入关怀版