网易首页 > 网易号 > 正文 申请入驻

不同凡响:NVIDIA RTX AI Toolkit 现提供多 LoRA 支持

0
分享至

在 RTX AI PC 和工作站上使用最新版 RTX AI Toolkit 微调 LLM,最高可将性能提升至原来的 6 倍。

凭借其快速理解、总结和生成基于文本的内容的能力,大语言模型(LLM)正在推动 AI 领域中的一些极为激动人心的发展。

LLM 的这些能力可支持各种场景,包括生产力工具、数字助理、电子游戏中的 NPC 等。但它们并非万能的解决方案,开发者通常必须对 LLM 进行微调,使 LLM 适应他们应用的需求。

NVIDIA RTX AI Toolkit 可通过一种名为“低秩自适应(LoRA)”的技术,让用户轻松地在 RTX AI PC 和工作站上微调和部署 AI 模型。现已推出的最新版支持在 NVIDIA TensorRT-LLM AI 加速库中同时使用多个 LoRA,最高可将微调模型的性能提升至原来的 6 倍。

通过微调提升性能

LLM 必须经过精心定制,才能实现更高的性能并满足用户日益增长的需求。

虽然这些基础模型是基于海量数据训练出来的,但它们通常缺乏开发者的特定场景所需的上下文。例如,通用型 LLM 可以生成游戏对话,但很可能会忽略文风的细微差别和微妙之处。例如,以一位有着黑暗过往并蔑视权威的林地精灵的口吻编写对话时,LLM 很有可能会忽略需要展现出来的微妙文风。

为了获得更符合自己需求的输出,开发者可以使用与应用场景相关的信息对模型进行微调。

以开发一款利用 LLM 生成游戏内对话的应用为例。微调时,首先需要使用预训练模型的权重,例如角色可能会在游戏中说出的内容的相关信息。为使对话符合相应文风,开发者可以基于较小的示例数据集(例如以更诡异或更邪恶的语气编写的对话)调整模型。

在某些情况下,开发者可能希望同时运行所有不同的微调流程。例如,他们可能希望为不同的内容频道生成以不同的语气编写的营销文案。同时,他们可能还希望总结文档并提出文风方面的建议,以及为文生图工具起草电子游戏场景描述和图像提示词。

同时运行多个模型并不现实,因为 GPU 显存无法同时容纳所有模型。即使能同时容纳,模型的推理时间也会受制于显存带宽(即 GPU 从显存读取数据的速度)。

拥抱 LoRA 技术

解决上述问题的常用方法是使用低秩自适应(LoRA)等微调技术。简单来说,您可以将这种技术视为补丁文件,其中包含微调流程中的定制过程。

训练完毕后,定制的 LoRA 可以在推理过程中与基础模型无缝集成,额外的性能开销极少。开发者可以将多个 LoRA 连接到单个模型上,以服务多种场景。这样既能使显存占用率保持在较低水平,又能为各个特定场景提供所需的额外细节内容。

使用多 LoRA 功能通过单个基础模型同时支持多个客户端和场景的架构图

在实际操作中,这意味着应用可以在显存中只保留一个基础模型,同时使用多个 LoRA 实现多种定制。

这个过程称为多 LoRA 服务。当对模型进行多次调用时,GPU 可以并行处理所有调用,更大限度地利用其 Tensor Core 并尽可能减少对显存和带宽的需求,以便开发者在工作流中高效使用 AI 模型。使用多 LoRA 的微调模型的性能最高可提升至原来的 6 倍。

在 GeForce RTX 4090 台式电脑 GPU 上运行 Llama 3B int4 时,应用 LoRA 的 LLM 的推理性能。输入序列长度为 1,000 个 token,输出序列长度为 100 个 token。LoRA 最大秩为 64。

在前文所述的游戏内对话应用的示例中,通过使用多 LoRA 服务,应用的范围可以扩展到同时生成剧情元素和插图,两者都是由单个提示驱动的。

用户可以输入基本的剧情创意,然后 LLM 会充实这个概念,在基本创意的基础上进行扩展,提供详细的基础剧情。然后,应用可以使用相同的模型,并通过两个不同的 LoRA 进行增强,以完善剧情并生成相应的图像。其中一个 LoRA 负责生成 Stable Diffusion 提示词,以便使用本地部署的 Stable Diffusion XL 模型创建视觉效果。同时,另一个针对剧情写作进行微调的 LoRA 可以编写出结构合理、引人入胜的叙事内容。

在这种情况下,两次推理均使用相同的模型,这可确保推理过程所需的空间不会显著增加。第二次推理涉及文本和图像生成,采用批量推理的方式执行。这使得整个过程能够在 NVIDIA GPU 上异常快速且高效地推进。这样一来,用户便能快速迭代不同版本的剧情,轻松完善叙事和插图。

LLM 正在成为现代 AI 的一大重要组成部分。随着采用率和集成率的提升,对于功能强大、速度快、具有特定于应用的定制功能的 LLM 的需求也将与日俱增。RTX AI Toolkit 新增的多 LoRA 支持可为开发者提供强有力的全新方法来加速满足上述需求。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张兰律师发3条动态,揭大S具俊晔墓地之行内幕

张兰律师发3条动态,揭大S具俊晔墓地之行内幕

甜菊汽水
2026-02-07 16:45:56
不得不说,张本美和有个好父亲!

不得不说,张本美和有个好父亲!

眼界纵横
2026-02-08 16:39:04
意甲前瞻:萨索洛近期两连胜,国米联赛已11轮不败

意甲前瞻:萨索洛近期两连胜,国米联赛已11轮不败

狗哥是一名内拉
2026-02-08 17:12:00
0-2!中国莎娃丢冠:抢7惜败,吞隐形蛋,今年2进决赛全部输球!

0-2!中国莎娃丢冠:抢7惜败,吞隐形蛋,今年2进决赛全部输球!

刘姚尧的文字城堡
2026-02-08 08:29:54
陶斯亮询问母亲,怨不怨毛主席?曾志:主席晚年是个老人嘛

陶斯亮询问母亲,怨不怨毛主席?曾志:主席晚年是个老人嘛

历史龙元阁
2026-02-08 14:10:12
黎春秋任湖南省发改委党组书记

黎春秋任湖南省发改委党组书记

中国经济网
2026-02-08 14:32:20
女子将75万存入银行,可是万万没想到,柜员压根没把钱存入她的账户,而是偷偷转走!

女子将75万存入银行,可是万万没想到,柜员压根没把钱存入她的账户,而是偷偷转走!

张晓磊
2026-02-05 11:31:01
86年我给一个女犯人送饭,她偷偷塞给我一张纸条:救我,我是卧底

86年我给一个女犯人送饭,她偷偷塞给我一张纸条:救我,我是卧底

千秋文化
2026-01-20 20:48:49
协鑫集成+马斯克开展100吉瓦太阳能发电站建设,光伏板块迎来反转

协鑫集成+马斯克开展100吉瓦太阳能发电站建设,光伏板块迎来反转

风风顺
2026-02-08 03:00:03
梅根穿成赫本几乎以假乱真,无人欣赏,暴露她的品牌前途

梅根穿成赫本几乎以假乱真,无人欣赏,暴露她的品牌前途

悦君兮君不知
2026-02-08 10:16:36
岛国成人VA内幕,那些被逼着拍片儿的女孩

岛国成人VA内幕,那些被逼着拍片儿的女孩

年代回忆
2026-02-02 20:24:54
亚乒联就旗帜问题道歉

亚乒联就旗帜问题道歉

五星体育
2026-02-07 19:39:51
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
张西明:大会选举我担任省政协主席,深感使命光荣、责任重大

张西明:大会选举我担任省政协主席,深感使命光荣、责任重大

新京报政事儿
2026-02-08 12:55:33
中国股市大佬罕见发声:股票已跌到全部股东都套牢为什么还会跌?

中国股市大佬罕见发声:股票已跌到全部股东都套牢为什么还会跌?

股经纵横谈
2025-12-22 18:50:58
1946年国军师长戴之奇饮弹自尽后镜头,躺在土堆上,军帽掉落一旁

1946年国军师长戴之奇饮弹自尽后镜头,躺在土堆上,军帽掉落一旁

丫头说事
2026-02-08 15:30:08
33岁吴倩怎么老成这样了?素颜衰老秃顶明显,与李佳航对戏表情严肃

33岁吴倩怎么老成这样了?素颜衰老秃顶明显,与李佳航对戏表情严肃

八卦王者
2026-02-07 15:46:41
800万伊朗人靠体制吃饭

800万伊朗人靠体制吃饭

桂系007
2026-02-07 23:58:05
李楠李春江的教训还不够?吉林广厦疑似默契球,球迷:严惩钟诚

李楠李春江的教训还不够?吉林广厦疑似默契球,球迷:严惩钟诚

弄月公子
2026-02-07 21:16:30
再看《亮剑》原著:才懂丁伟出狱后,为何不愿去寻找李云龙和孔捷

再看《亮剑》原著:才懂丁伟出狱后,为何不愿去寻找李云龙和孔捷

兴趣知识
2026-01-30 01:36:57
2026-02-08 18:11:00
NVIDIA英伟达中国 incentive-icons
NVIDIA英伟达中国
英伟达(中国)官方账号
3384文章数 1438关注度
往期回顾 全部

科技要闻

欧盟认定存在"上瘾"设计 TikTok:结论错误

头条要闻

外媒:由于"作战"需要 美军两架F-22退出"超级碗"表演

头条要闻

外媒:由于"作战"需要 美军两架F-22退出"超级碗"表演

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

曝带女星回老家小区,罗云熙紧急回应

财经要闻

宽基ETF开年大赎回,什么信号?

汽车要闻

VLA司机大模型优化 理想汽车OTA8.3版本更新

态度原创

亲子
家居
手机
游戏
本地

亲子要闻

宝蓝和爸爸叔叔一起制作水晶泥玩具,快来看看谁做的更漂亮~

家居要闻

现代轻奢 温馨治愈系

手机要闻

澎湃OS NEXT再次被确认:底层重构,让千元机起飞!

《地平线:猎人集结》是Guerrilla目前重点 主系列三代还很遥远

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

无障碍浏览 进入关怀版