网易首页 > 网易号 > 正文 申请入驻

从Token经济到Agent路由:英伟达用Nemotron重构企业级AI底座

0
分享至

雷峰网消息,2025年12月15日,英伟达正式对外发布Nemotron 3系列开放模型及配套的数据集与工具库,这一举措精准切入全球企业AI转型的核心诉求,为行业带来了兼具透明度与高效能的代理式AI开发解决方案。

随着AI技术在产业场景的深度渗透,企业对AI的应用需求已从单一对话交互升级为复杂工作流自动化,协作式多智能体系统成为必然趋势。

然而,开发者在转型过程中始终面临三重核心困境:智能体间通信开销过高、长任务推理易出现上下文漂移、推理成本居高不下,同时,模型透明度不足也让企业和开发者难以放心将核心业务托付给AI系统。

Nemotron 3的推出正直面这些挑战。

Nemotron 3模型推出Nano、Super和Ultra三种规模,突破性异构潜在混合专家(MoE)架构是核心亮点,既守住了专业化代理式AI所需的性能,又坚持开放特质,让开发者无需在“性能强度”与“使用自由度”间做取舍,成为高效的开发底座。

“开放创新是AI进步的基础。通过Nemotron,我们将先进AI转化成开放平台,为开发者提供构建大规模代理式系统所需的透明度与效率。”英伟达创始人兼首席执行官黄仁勋表示。

Nemotron并非孤立的模型发布,而是英伟达主权AI战略的关键支撑。

埃森哲、德勤、安永、ServiceNow、西门子、Zoom等12家企业已经成为Nemotron早期用户,从制造业的智能产线优化,到网络安全的威胁闭环应对,再到媒体通信的高效协作,这些行业标杆企业正将这款开放模型深度融入核心AI工作流,一场跨领域的智能升级浪潮已悄然拉开序幕。

Token吞吐量提高4倍、减少60%推理Token生成量,Nemotron 3让每一分算力「物超所值」

在多智能体AI系统愈发深入产业的今天,开发者面临很现实的问题:既要依赖专有模型的前沿推理能力支撑复杂任务,又希望借助开放模型的高效与可定制性控制成本。

Nemotron 3的出现,正在解决这种“性能与经济不可兼得”的困境。

任务路由技术成为关键。在单一工作流中,开发者可通过智能调度,让日常高效型任务交由Nemotron 3这样的开放模型处理,而核心复杂的前沿推理则联动专有模型,既保证了智能体的能力,又优化了Token经济效益。这一模式并非理论构想,已在Perplexity的实践中落地。

作为AI浏览器领域的创新者,Perplexity正将Nemotron 3 Ultra纳入其智能体路由器的核心选项。

“Perplexity的构建理念是当精准AI融入先进工具时(例如 AI 助手),人类的好奇心将被放大。通过我们的智能体路由器,可以将工作负载定向到领先的精细调优开放模型,如Nemotron 3 Ultra,或在任务能够从其独特能力中受益时,利用领先的专有模型,以此确保我们的AI助手能够以卓越的速度、效率和规模运行。”Perplexity首席执行官Aravind Srinivas表示。

如果说大企业借助Nemotron 3实现了效率升级,那么这款开放模型对初创公司而言,更像是一把加速创新的“钥匙”。General Catalyst和Mayfield旗下的诸多创业公司,正借助Nemotron 3搭建人机协作的AI队友,实现工作效能的快速提高。

这背后离不开NVIDIA全生态的支撑。

Mayfield管理合伙人Navin Chaddha表示:“英伟达的开放模型堆栈与初创加速计划为初创公司提供了各类模型、工具及经济高效的基础设施,助力其开展试验、实现差异化发展并快速扩展规模。Nemotron 3可以让创始人在构建代理式AI应用和AI队友方面取得先机,并帮助他们利用英伟达庞大的用户基础。”

Nemotron 3系列MoE模型包含三种规模:

Nemotron 3 Nano:是一款具备300亿参数的小型模型,每次运行最多激活30亿参数,适用于针对性、高效的任务。

Nemotron 3 Super:是一款具备约1000亿参数的高精度推理模型,每个Token最多激活100亿参数,适用于多智能体应用。

Nemotron 3 Ultra:是一款具备约5000亿参数的大型推理引擎,每个Token最多激活500亿参数,适用于复杂的AI应用。

Nemotron 3 Nano已正式上线,是计算成本效益极高的模型,其针对软件调试、内容摘要、AI助手工作流及信息检索等任务进行了优化,同时保持了较低的推理成本。并且,模型采用独特的异构MoE架构,以实现效率与可扩展性的提升。

这一设计使其Token吞吐量较Nemotron 2 Nano至高提升4倍,并减少了多达60%的推理Token生成量,大大降低了推理成本。同时,具备100万Token的上下文处理能力,Nemotron 3 Nano具有更强的记忆能力,在处理长时间多步骤任务时能更精准地关联信息。


独立AI基准测试机构Artificial Analysis评定该模型为同等规模模型中兼具极高开放性和效率及卓越精度的模型。

在需要多智能体协作完成低延迟复杂任务的应用中,Nemotron 3 Super表现出色。Nemotron 3 Ultra则作为高级推理引擎,服务于需要深度研究和策略规划的AI工作流。

Nemotron 3 Super与Ultra采用基于英伟达Blackwell架构的超高效4位NVFP4训练格式,可显著降低显存需求并加速训练进程。这种效率使更大规模模型能在现有基础设施上进行训练,不会因更高精度格式而牺牲准确性。

借助Nemotron 3系列模型,开发者可根据特定工作负载选择适配的开放模型,在数十至数百个智能体间灵活扩展,同时在复杂工作流中获得更快速、精准的长时推理能力。

3万亿Token数据、NeMo开源工具库发布,英伟达为开发者按下 「加速键」

英伟达还发布了面向专业AI智能体开发者的训练数据集与前沿强化学习库集合。

3万亿Token规模的全新Nemotron预训练、后训练及强化学习数据集,为开发高性能特定领域智能体提供了丰富的推理、编码及多步骤工作流范例。Nemotron Agentic Safety Dataset则提供真实场景的遥测数据,帮助团队评估并提升复杂智能体系统的安全性。

为加速开发进程,英伟达发布了NeMo Gym与NeMo RL开源库,为Nemotron模型提供训练环境及后训练基础,同时还推出用于验证模型安全性和性能的NeMo Evaluator。所有工具及数据集现已上线GitHub和Hugging Face平台。

Nemotron 3已获得LM Studio、llama.cpp、SGLang和vLLM支持。此外,Prime Intellect与Unsloth正将NeMo Gym 的即用型训练环境直接集成至其工作流,使团队能够更加快速、便捷地获得强大的强化学习训练能力。

目前,Nemotron 3 Nano已上线Hugging Face平台,并通过Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等推理服务商提供。

Nemotron还上线了多个企业级AI与数据基础设施平台,包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。Nemotron 3 Nano将通过Amazon Bedrock(无服务器模式)在亚马逊云科技 (AWS) 平台上提供给使用公有云的客户,并且也即将支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale及Yotta。

Nemotron 3 Nano同时以NVIDIA NIM形式提供,可以在英伟达加速基础设施上进行安全、可扩展的部署,具有极高的隐私性与可控性。Nemotron 3 Super和Ultra预计将于 2026 年上半年推出。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李湘被英国相关部门调查,涉嫌用艺术品国际洗钱,王诗龄已经休学

李湘被英国相关部门调查,涉嫌用艺术品国际洗钱,王诗龄已经休学

花哥扒娱乐
2026-01-25 17:10:22
鼓励老百姓捐献器官,还纳入见义勇为,这些专家到底想干啥?

鼓励老百姓捐献器官,还纳入见义勇为,这些专家到底想干啥?

眼光很亮
2026-01-25 09:19:18
好消息!铁路新规:60岁以上老人乘坐高铁火车,可享受5大福利

好消息!铁路新规:60岁以上老人乘坐高铁火车,可享受5大福利

巢客HOME
2026-01-25 06:50:03
曼城31岁巨星愿加盟巴萨:今夏0转会费 相当于白捡2700万

曼城31岁巨星愿加盟巴萨:今夏0转会费 相当于白捡2700万

叶青足球世界
2026-01-25 20:35:06
2-3不敌曼联,阿森纳遭遇本赛季各项赛事主场首败

2-3不敌曼联,阿森纳遭遇本赛季各项赛事主场首败

懂球帝
2026-01-26 02:37:43
李湘的事儿大吗?

李湘的事儿大吗?

奖一罚十
2026-01-23 21:25:51
真当中国不敢动手?中方向全世界宣布,退出5000亿大项目,菲慌了

真当中国不敢动手?中方向全世界宣布,退出5000亿大项目,菲慌了

趣生活
2026-01-25 19:23:56
2025年新生儿仅有792万,一个重要原因是育儿的廉价劳动力已经不足了

2025年新生儿仅有792万,一个重要原因是育儿的廉价劳动力已经不足了

风向观察
2026-01-25 12:07:51
记住吧,历史总要清算

记住吧,历史总要清算

火事杂谈
2026-01-24 18:52:38
父死女偿!一银行放贷30万,独生女破釜沉舟,彻底给银行整不会了

父死女偿!一银行放贷30万,独生女破釜沉舟,彻底给银行整不会了

火山诗话
2026-01-25 12:21:40
唐山发生2.4级地震,震中有居民称“晃醒了”,镇政府工作人员:未接到损失报告

唐山发生2.4级地震,震中有居民称“晃醒了”,镇政府工作人员:未接到损失报告

极目新闻
2026-01-25 23:01:55
贾国龙最新发声!“将回归一线,不再打造个人IP”

贾国龙最新发声!“将回归一线,不再打造个人IP”

每日经济新闻
2026-01-25 22:13:09
央视曝光!你吃的“新鲜蔬菜”,比老鼠药还毒!已流窜到全国多地

央视曝光!你吃的“新鲜蔬菜”,比老鼠药还毒!已流窜到全国多地

夜深爱杂谈
2026-01-25 19:32:05
知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

一盅情怀
2026-01-25 15:54:20
中国队丢冠仅1夜,队长赴英超!王钰栋遭批:态度有问题 基本废了

中国队丢冠仅1夜,队长赴英超!王钰栋遭批:态度有问题 基本废了

侃球熊弟
2026-01-25 10:37:48
爆冷!绝杀!英超冠军倒下崩盘,创下队史耻辱纪录

爆冷!绝杀!英超冠军倒下崩盘,创下队史耻辱纪录

乌龙球OwnGoal
2026-01-25 12:31:19
川崎重工将在2030前,使其所有发电发动机、燃气轮机兼容氢燃料

川崎重工将在2030前,使其所有发电发动机、燃气轮机兼容氢燃料

知识圈
2026-01-25 22:09:57
美国“退群”,加州“入群”

美国“退群”,加州“入群”

极目新闻
2026-01-24 18:34:19
美国放话:谁敢拦截军售,就是宣战!中国用实力划下红线!

美国放话:谁敢拦截军售,就是宣战!中国用实力划下红线!

华山穹剑
2026-01-23 20:19:29
日本为何禁肉1200年?乃是统治者“制度设计”,解禁后人均身高迅速上涨

日本为何禁肉1200年?乃是统治者“制度设计”,解禁后人均身高迅速上涨

齐天候
2026-01-25 23:29:25
2026-01-26 02:59:00
雷峰网 incentive-icons
雷峰网
关注智能与未来!
68407文章数 656059关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

教育
时尚
房产
健康
游戏

教育要闻

西藏考生必看!合肥工业大学招生计划揭秘

看了鲁豫对章小蕙的采访,最大感触是这一点

房产要闻

正式官宣!三亚又一所名校要来了!

耳石脱落为何让人天旋地转+恶心?

LCK春季赛:道心没有破碎,KT找回状态,三局战胜BRO

无障碍浏览 进入关怀版