网易首页 > 网易号 > 正文 申请入驻

NVIDIA Nemotron 3 Super发布,智能体AI吞吐量提升5倍

0
分享至


今日发布的NVIDIA Nemotron 3 Super是一个拥有1200亿参数的开放模型,其中120亿参数在推理时处于活跃状态,专为大规模运行复杂的智能体AI系统而设计。

该模型现已上线,结合先进的推理能力,能够高效且高精度地为自主智能体完成任务。

AI原生公司应用

Perplexity为用户提供Nemotron 3 Super的搜索功能,并将其作为Computer中20个协调模型之一。CodeRabbit、Factory和Greptile等提供软件开发智能体的公司正在将该模型与专有模型集成到他们的AI智能体中,以更低的成本实现更高的准确性。Edison Scientific和Lila Sciences等生命科学和前沿AI组织将利用该模型为其智能体提供深度文献搜索、数据科学和分子理解能力。

企业软件平台部署

Amdocs、Palantir、Cadence、达索系统和西门子等行业领导者正在部署和定制该模型,以在电信、网络安全、半导体设计和制造领域实现工作流程自动化。

解决多智能体应用的两大瓶颈

当公司从聊天机器人转向多智能体应用时,会遇到两个制约因素。

首先是上下文爆炸。多智能体工作流生成的token数量比标准聊天多15倍,因为每次交互都需要重新发送完整的历史记录,包括工具输出和中间推理过程。在长任务过程中,这种上下文量会增加成本,并可能导致目标偏移,即智能体失去与原始目标的一致性。

其次是思考税。复杂的智能体必须在每一步都进行推理,但为每个子任务使用大型模型会使多智能体应用变得过于昂贵和缓慢,无法实际应用。

Nemotron 3 Super拥有100万token的上下文窗口,允许智能体在内存中保留完整的工作流状态,防止目标偏移。该模型在Artificial Analysis的效率和开放性排行榜中名列榜首,在同等规模模型中保持领先的准确性。

该模型还为NVIDIA AI-Q研究智能体提供支持,在DeepResearch Bench和DeepResearch Bench II排行榜上获得第一名。这些基准测试评估AI系统在大型文档集中进行全面、多步骤研究的能力,同时保持推理一致性。

技术架构突破

Nemotron 3 Super采用混合专家混合(MoE)架构,结合三大创新,相比前代Nemotron Super模型实现高达5倍的吞吐量提升和高达2倍的准确性改进。

混合架构:Mamba层提供4倍更高的内存和计算效率,而Transformer层驱动高级推理。

MoE技术:在其1200亿参数中,推理时只有120亿参数处于活跃状态。

潜在MoE:一种新技术,通过以一个专家的成本激活四个专家专家来提高准确性,以便在推理时生成下一个token。

多token预测:同时预测多个未来词汇,实现3倍更快的推理速度。

在NVIDIA Blackwell平台上,该模型以NVFP4精度运行,这减少了内存需求,使推理速度比NVIDIA Hopper上的FP8快4倍,且精度无损失。

开放获取与部署

NVIDIA在宽松许可下发布Nemotron 3 Super的开放权重。开发者可以在工作站、数据中心或云端部署和定制该模型。

该模型使用前沿推理模型生成的合成数据进行训练。NVIDIA公布了完整的方法论,包括超过10万亿token的预训练和后训练数据集、15个强化学习训练环境和评估方案。研究人员可以进一步使用NVIDIA NeMo平台来微调模型或构建自己的模型。

实际应用场景

Nemotron 3 Super专为处理多智能体系统内的复杂子任务而设计。

软件开发智能体可以一次将整个代码库加载到上下文中,实现端到端的代码生成和调试,无需文档分割。

在金融分析中,它可以将数千页报告加载到内存中,消除了在长时间对话中重新推理的需要,提高了效率。

Nemotron 3 Super具有高精度的工具调用功能,确保自主智能体可靠地导航大型函数库,防止在高风险环境(如网络安全中的自主安全编排)中出现执行错误。

获取途径与合作伙伴

作为Nemotron 3系列的一部分,NVIDIA Nemotron 3 Super可以通过build.nvidia.com、Perplexity、OpenRouter和Hugging Face访问。戴尔科技将该模型引入Hugging Face上的戴尔企业中心,针对戴尔AI工厂的本地部署进行了优化,推进多智能体AI工作流程。HPE也将NVIDIA Nemotron引入其智能体中心,帮助确保企业大规模采用智能体AI。

企业和开发者可以通过多个合作伙伴部署该模型:

云服务提供商:Google Cloud的Vertex AI和Oracle Cloud Infrastructure,即将通过Amazon Bedrock登陆Amazon Web Services以及Microsoft Azure。

NVIDIA云合作伙伴:Coreweave、Crusoe、Nebius和Together AI。

推理服务提供商:Baseten、CloudFlare、DeepInfra、Fireworks AI、Inference.net、Lightning AI、Modal和FriendliAI。

数据平台和服务:Distyl、Dataiku、DataRobot、德勤、安永和塔塔咨询服务。

该模型打包为NVIDIA NIM微服务,支持从本地系统到云端的部署。

Q&A

Q1:NVIDIA Nemotron 3 Super相比前代模型有什么改进?

A:NVIDIA Nemotron 3 Super采用混合专家混合架构,结合三大技术创新,相比前代Nemotron Super模型实现高达5倍的吞吐量提升和高达2倍的准确性改进。它拥有100万token的上下文窗口,能防止智能体在长任务中出现目标偏移。

Q2:多智能体应用面临哪些主要挑战?

A:主要面临两个制约因素:一是上下文爆炸,多智能体工作流生成的token数量比标准聊天多15倍;二是思考税,复杂智能体必须在每一步都进行推理,使用大型模型处理每个子任务会让应用变得过于昂贵和缓慢。

Q3:如何获取和部署NVIDIA Nemotron 3 Super?

A:该模型可通过build.nvidia.com、Perplexity、OpenRouter和Hugging Face等平台访问。支持通过Google Cloud、Oracle云、Amazon Bedrock等云服务商部署,也可通过NVIDIA NIM微服务在本地系统到云端之间灵活部署。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
清明前后,6种蔬菜不要随便买!菜贩子:我从来不吃,顾客抢着买

清明前后,6种蔬菜不要随便买!菜贩子:我从来不吃,顾客抢着买

阿龙美食记
2026-04-02 22:07:37
扎哈罗娃:俄罗斯目前在三条战线上同时作战

扎哈罗娃:俄罗斯目前在三条战线上同时作战

环球网资讯
2026-04-05 11:48:11
我国被严重低估的5所大学,400多分就能上,就业不比985差!

我国被严重低估的5所大学,400多分就能上,就业不比985差!

高三倒计时
2026-04-05 17:46:46
怪不得这么多男明星和她传过绯闻,现实中确实惊为天人。

怪不得这么多男明星和她传过绯闻,现实中确实惊为天人。

情感大头说说
2026-04-05 08:22:46
深圳一小区巷道发现遗书!字迹像孩子所写,现场逐户排查

深圳一小区巷道发现遗书!字迹像孩子所写,现场逐户排查

南方都市报
2026-04-05 15:48:43
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
不知不觉从16涨到了164,板块调整,大盘调整,它为什么不调整?

不知不觉从16涨到了164,板块调整,大盘调整,它为什么不调整?

有范又有料
2026-04-05 18:48:42
特朗普“双线操作”露底,中国准时取消优惠,直击美国薄弱产业

特朗普“双线操作”露底,中国准时取消优惠,直击美国薄弱产业

轩逸阿II
2026-04-06 03:14:36
赵心童10-3特鲁姆普夺冠,包揽红包赛三冠王

赵心童10-3特鲁姆普夺冠,包揽红包赛三冠王

许礆很机智
2026-04-06 04:14:31
善恶有报,移居英国仅2年,57岁吴秀波再迎噩耗,步入李易峰后尘

善恶有报,移居英国仅2年,57岁吴秀波再迎噩耗,步入李易峰后尘

有范又有料
2025-12-17 14:54:06
美国伤亡人数出炉

美国伤亡人数出炉

杨兴文
2026-04-04 22:04:35
16岁就是人间尤物,4年换19个男人,找老实人接盘后,变买菜妈妈

16岁就是人间尤物,4年换19个男人,找老实人接盘后,变买菜妈妈

一盅情怀
2026-03-28 15:38:13
伊朗机会来了!美F35刚被伊朗击落,21架B2又低空送人头?

伊朗机会来了!美F35刚被伊朗击落,21架B2又低空送人头?

南宗历史
2026-04-06 03:06:48
4-3逆转夺冠!王楚钦赛后三句感谢,一句承诺,看哭全场球迷!

4-3逆转夺冠!王楚钦赛后三句感谢,一句承诺,看哭全场球迷!

阿错田间生活
2026-04-05 23:56:45
希金斯为何1-10惨败,赵心童说了句大实话,特鲁姆普压力很大

希金斯为何1-10惨败,赵心童说了句大实话,特鲁姆普压力很大

老癘体育解说
2026-04-05 08:15:07
河北16名老人骑行700公里到韶山缅怀毛主席:我们每月都有退休金,幸福生活不能忘记革命先辈

河北16名老人骑行700公里到韶山缅怀毛主席:我们每月都有退休金,幸福生活不能忘记革命先辈

极目新闻
2026-04-05 18:54:16
美国房价开始换地方涨,华人口中的“传统差区”,如今一套房溢价10万美元

美国房价开始换地方涨,华人口中的“传统差区”,如今一套房溢价10万美元

华人生活网
2026-04-05 04:11:35
伊朗军方:美军营救飞行员“任务失败” 多架飞机被击落

伊朗军方:美军营救飞行员“任务失败” 多架飞机被击落

界面新闻
2026-04-05 14:37:11
伊朗外交部:已向调解方表达立场

伊朗外交部:已向调解方表达立场

上观新闻
2026-04-01 15:05:04
清晨努尔哈赤病逝,34岁皇太极晚上就给36岁继母阿巴亥送弓箭

清晨努尔哈赤病逝,34岁皇太极晚上就给36岁继母阿巴亥送弓箭

铭记历史呀
2026-03-19 16:56:07
2026-04-06 04:24:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17425文章数 49697关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗官员提开放霍尔木兹海峡条件

头条要闻

伊朗官员提开放霍尔木兹海峡条件

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

本地
房产
教育
亲子
健康

本地新闻

跟着歌声游安徽,听古村回响

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

教育要闻

高考地理中的束水攻沙

亲子要闻

小英自曝给女儿剪短发原因!怕头发抢营养长不高,想剃光头太真实

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版