网易首页 > 网易号 > 正文 申请入驻

使用全新 NVIDIA Llama Nemotron Super v1.5 构建更准确高效的 AI 智能体

0
分享至

AI 智能体现在已经能够解决多步骤问题、编写生产级代码并在多个领域担任通用助手。但要充分发挥其潜力,还需要在控制成本的前提下加入先进的逻辑推理模型。

NVIDIA Nemotron 系列在生态系统中强大的开放模型基础上,通过使用 NVIDIA 开源合成数据集、先进的技术以及工具,进一步提升了模型的准确性、效率和透明度。使得创建实用、适配、高性能的 AI 智能体成为了可能。

该系列最新发布的 Llama Nemotron Super 48B v1.5 版本在保持高吞吐量和计算效率的情况下,显著提升了在数学、科学、编码、函数调用、指令跟随、对话等核心逻辑推理与代理任务中的性能。

该模型现已位居 Artificial Analysis Intelligence Index 排行榜榜首。

本文将详细介绍这一最新 NVIDIA Nemotron 模型的准确性与推理性能、训练方法、数据透明度、架构优化及部署选项。

Llama Nemotron Super v1.5

领跑 Artificial Analysis 排行榜

新模型采用与原 Llama Nemotron Ultra v1 相同的方法构建而成,但使用了更多高质量的逻辑推理数据来进一步进行优化和训练后微调。

该模型凭借在多项逻辑推理和代理任务中展现出的领先性能,问鼎 Artificial Analysis Intelligence Index 排行榜。排行榜汇集 MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME 和 MATH-500 等基准测试的准确率数据。

图 1. Artificial Analysis Intelligence Index 排行榜

根据第三方在一系列行业标准逻辑推理及指令和函数调用任务基准测试中的评估,Llama Nemotron Super v1.5 在高等数学、编码、逻辑推理和对话指标上的表现优于其他开放模型,使其稳居 700 亿参数级模型榜首。

图 2. Llama Nemotron Super v1.5 为逻辑推理和代理任务提供更高的准确性

除了在逻辑推理和代理能力上领先外,该模型还使用能够提高吞吐量性能 (Neural Architecture Search, 神经架构搜索) 的后训练方法,大幅提升了吞吐量。

图 3. Llama Nemotron Super v1.5 为代理任务提供更高的准确性和吞吐量,降低了推理成本

最终得到了一个适合在单个 NVIDIA Hopper 架构 GPU 上运行的高性能模型,使开发者能够开发出更加有效和高效的代理系统。

专为逻辑推理和代理工作负载开发

Llama Nemotron Super v1.5 使用多项 NVIDIA 核心技术开发而成:

Llama Nemotron 后训练开源数据集

该数据集完全通过合成数据生成技术创建而成,其使用了 Qwen3 235B 和 DeepSeek R1 671B 0528 等先进的逻辑推理模型。它使团队能够生成超过 2,600 万行高质量的函数调用、指令跟随、逻辑推理、对话、数学和代码数据。

发布该数据集使我们能公开透明地展示模型训练的具体内容,让开发者和企业更加放心地选择 Llama Nemotron Super v1.5 作为其代理系统的引擎。

除了公开透明外,发布该数据集还使开发者在自行开发模型时无需投入大量的时间和精力去生成高质量数据集,降低了开发新型高性能模型的门槛。

该数据集即将在 Hugging Face 上发布,可通过数据集卡片获得更详细的信息。

后训练流程

如此前文章所述,后训练流程如下:

https://developer.nvidia.com/zh-cn/blog/build-enterprise-ai-agents-with-advanced-open-nvidia-llama-nemotron-reasoning-models-2/

图 4. Llama Nemotron Super v1.5 后训练流程

团队利用强化学习将该模型性能提高到极限,以此实现了上述逻辑推理能力。该模型经过了多道后训练流程,所有流程均针对需要提升的能力定制,包括监督式微调 (SFT) 以及:

  1. 奖励感知偏好优化 (RPO):使用 NVIDIA 先进的奖励模型提升对话能力

  1. 直接偏好优化 (DPO):用于提升工具调用的能力

  1. 可验证奖励强化学习 (RLVR):用于提升指令执行、数学、科学等能力

这套全面的后训练流程确保模型的每项能力都得到了训练,将逻辑推理准确性推向了新高度。

团队还使用了 NeMo Skills 评估和验证模型检查点,加快了迭代速度和研究周期,并实现可复现性。

以 NIM 形式提供

Llama Nemotron Super v1.5

Llama Nemotron Super v1.5 很快将作为 NVIDIA NIM 提供,以便快速、可靠地将其部署到首选的 NVIDIA 加速基础设施上。用户只需使用几行简单命令就能完成部署,并且能够直接集成兼容 OpenAI API 的私有端点,以提升 AI 智能体和逻辑推理应用的性能。此外,Llama Nemotron Super 的强大推理性能可根据需求自动扩展。

开始使用

Llama Nemotron Super v1.5

Llama Nemotron Super v1.5 模型在保持计算效率的同时,还提供强大的逻辑推理能力。它能够驱动从个人开发者到大型企业的各类代理应用。

现可先在 NVIDIA 官网上试用模型。如要对模型进行测试,可通过 Hugging Face 下载检查点,或按照模型卡片通过所提供的指令运行模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈慧琳”太丰满了,穿抹胸都兜不住好身材,我感慨自律女人真美

陈慧琳”太丰满了,穿抹胸都兜不住好身材,我感慨自律女人真美

章眽八卦
2026-03-08 15:36:53
国际原油价格日内跌幅收窄至3%

国际原油价格日内跌幅收窄至3%

每日经济新闻
2026-03-25 23:27:05
轰下7连胜,目标瞄准凯尔特人!骑士能否冲冠,要看你们表现

轰下7连胜,目标瞄准凯尔特人!骑士能否冲冠,要看你们表现

老梁体育漫谈
2026-03-26 00:08:25
新剧照,真的是个顶级劳模!

新剧照,真的是个顶级劳模!

贵圈真乱
2026-03-24 10:21:47
积极信号!一艘泰国油轮安全通过霍尔木兹海峡,相关沟通机制正在发挥作用

积极信号!一艘泰国油轮安全通过霍尔木兹海峡,相关沟通机制正在发挥作用

每日经济新闻
2026-03-25 13:50:33
瞒天过海40年!李嘉诚成最大赢家,日产百万桶,把石油全卖给中国

瞒天过海40年!李嘉诚成最大赢家,日产百万桶,把石油全卖给中国

阿凫爱吐槽
2026-03-24 00:54:18
伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

老马拉车莫少装
2026-03-26 00:02:39
张雪峰老师的头像变黑白了……

张雪峰老师的头像变黑白了……

留学生日报
2026-03-24 21:19:14
朝鲜国运来了!中东大战,又是朝鲜闷声发大财?

朝鲜国运来了!中东大战,又是朝鲜闷声发大财?

北向财经
2026-03-24 22:17:38
大举增兵!美海军陆战队远征波斯湾,五角大楼考虑抽调3000空降兵支援!伊朗发动第78波攻势:主力部队尚未出动,将在战斗中展示新“惊喜”

大举增兵!美海军陆战队远征波斯湾,五角大楼考虑抽调3000空降兵支援!伊朗发动第78波攻势:主力部队尚未出动,将在战斗中展示新“惊喜”

每日经济新闻
2026-03-24 08:50:06
登陆或周内、甚至3天内开始:川普通牒后伊朗称会全面攻击中东

登陆或周内、甚至3天内开始:川普通牒后伊朗称会全面攻击中东

邵旭峰域
2026-03-23 14:40:06
全联盟都默认了!路威点破真相:詹姆斯不会再留在湖人

全联盟都默认了!路威点破真相:詹姆斯不会再留在湖人

夜白侃球
2026-03-25 09:36:57
甘油三酯"祸首"被发现,是猪油的12倍?专家叹息:还有人天天在吃

甘油三酯"祸首"被发现,是猪油的12倍?专家叹息:还有人天天在吃

芳芳历史烩
2026-03-23 11:04:46
法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

法国和浙江同为6000万人口,2025年法国创3万亿美元GDP,浙江呢?

八斗小先生
2026-02-28 18:56:17
日本彻底不装了,迈出最危险一步!中国如何应对?

日本彻底不装了,迈出最危险一步!中国如何应对?

兵国大事
2026-03-25 01:05:04
55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

睡前讲故事
2025-12-12 13:58:11
上海112-80大胜山西 球员评价:4人优秀,5人及格,洛夫顿低迷

上海112-80大胜山西 球员评价:4人优秀,5人及格,洛夫顿低迷

篮球资讯达人
2026-03-26 00:14:02
全新阿尔法S5补贴后9.98万起 增程纯电双动力、城区NOA入手即满配

全新阿尔法S5补贴后9.98万起 增程纯电双动力、城区NOA入手即满配

道哥说车
2026-03-18 18:29:55
南京一大厦有女生坠楼?记者核实:系谣言,实为外省某大厦事件误传

南京一大厦有女生坠楼?记者核实:系谣言,实为外省某大厦事件误传

扬子晚报
2026-03-25 18:25:42
婆婆试戴我的金镯后说:帮你戴几天。我对老公说:要不回来就重买

婆婆试戴我的金镯后说:帮你戴几天。我对老公说:要不回来就重买

九哥哥车评
2026-03-25 16:24:26
2026-03-26 01:23:00
NVIDIA英伟达中国 incentive-icons
NVIDIA英伟达中国
英伟达(中国)官方账号
3477文章数 1444关注度
往期回顾 全部

科技要闻

红极一时却草草收场,Sora宣布正式关停

头条要闻

伊朗放话愿意与"主和派"万斯谈 特朗普表态

头条要闻

伊朗放话愿意与"主和派"万斯谈 特朗普表态

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰经抢救无效不幸去世 年仅41岁

财经要闻

管涛:中东局势如何影响人民币汇率走势?

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

教育
艺术
房产
旅游
公开课

教育要闻

寒门的缺点是自负,优点是敢拼

艺术要闻

1008米!世界新第一高楼用上中国黑科技!

房产要闻

41亿!259亩!建学校…三亚这个大城更,最新方案曝光!

旅游要闻

探秘云南保山勐赫小镇,感受与怒江贡山相拥的独特魅力!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版