网易首页 > 网易号 > 正文 申请入驻

自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务

0
分享至

智东西7月24日报道,NVIDIA宣布推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务,与刚推出的Meta Llama 3.1系列开源模型一起,为全球企业的生成式AI提供强力支持。

Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVIDIA Tensor Core GPU上训练而成,并针对NVIDIA加速计算和软件(无论是在数据中心、云以及配备NVIDIA RTX GPU的本地工作站或配备GeForce RTX GPU的PC上)进行了优化。

就像台积电是面向全球芯片企业的代工厂,NVIDIA也打造了企业级AI代工厂NVIDIA AI Foundry。

NVIDIA创始人兼CEO黄仁勋谈道:“Meta的Llama 3.1开源模型标志着全球企业采用生成式AI的关键时刻已经到来。Llama 3.1将掀起各个企业与行业创建先进生成式AI应用的浪潮。NVIDIA AI Foundry已经在整个过程中集成了Llama 3.1,并能够帮助企业构建和部署自定义Llama超级模型。”


NVIDIA AI Foundry由NVIDIA DGX Cloud AI平台驱动,由NVIDIA与全球领先的公有云共同设计,提供一种可用于快速构建自定义超级模型的端到端服务,旨在为企业提供大量计算资源,所提供的计算资源可随着AI需求的变化轻松扩展。

“借助NVIDIA AI Foundry,企业可以轻松创建和定制大家想要的最先进的AI服务,并通过NVIDIA NIM进行部署。”Meta创始人兼CEO马克·扎克伯格说。

企业如果需要更多训练数据来创建特定领域的模型,可使用自有数据以及由Llama 3.1 405B和NVIDIA Nemotron Reward模型生成的合成数据,来训练这些超级模型,以提高准确性。拥有自己的训练数据的客户可以使用NVIDIA NeMo对Llama 3.1模型进行自定义,通过领域自适应预训练(DAPT)进一步提高模型的准确性。

NVIDIA和Meta还一起为Llama 3.1提供了一种蒸馏方法,供开发者为生成式AI应用创建更小的自定义Llama 3.1模型。这使企业能够在更多加速基础设施(如AI工作站和笔记本电脑)上运行由Llama驱动的AI应用。

创建自定义模型后,企业就可以构建NVIDIA NIM推理微服务,以便在其首选的云平台和全球服务器制造商提供的NVIDIA认证系统上,使用自己选择的最佳机器学习运维(MLOps)和人工智能运维(AIOps)平台在生产中运行这些模型。


NIM微服务有助于将Llama 3.1模型部署到生产中,其吞吐量最多可比不使用NIM运行推理时高出2.5倍。


从ai.nvidia.com即可了解适用于Llama 3.1模型的NVIDIA NIM推理微服务,以加快将Llama 3.1模型部署到生产级AI的速度。

将Llama 3.1 NIM微服务与全新NVIDIA NeMo Retriever NIM微服务组合使用,就能为AI copilot、助手和数字人虚拟形象搭建先进的检索工作流。


通过使用全新NVIDIA NeMo Retriever NIM推理微服务来实现检索增强生成(RAG),企业可将自定义Llama超级模型和Llama NIM微服务部署到生产中,以提高响应准确性。

当与适用于Llama 3.1 405B的NVIDIA NIM推理微服务结合使用时,NeMo Retriever NIM微服务能为RAG工作流中的开放和商业文本问答带来极高的检索准确性。


NVIDIA AI Foundry结合NVIDIA软件、基础设施和专业知识与开放社区模型、技术和来自NVIDIA AI生态系统的支持。NVIDIA AI Enterprise专家和全球系统集成商合作伙伴与AI Foundry客户一同加快从开发到部署的全过程。


专业服务公司埃森哲率先借助NVIDIA AI Foundry,使用Accenture AI Refinery框架为自己以及希望所部署的生成式AI应用能够反映其文化、语言和行业的客户来创建自定义Llama 3.1模型。

医疗、能源、金融服务、零售、交通、电信等行业的企业已在使用适用于Llama的NVIDIA NIM微服务。首批使用面向Llama 3.1全新NIM微服务的公司有Aramco、AT&T、优步等。

数百家提供企业、数据和基础设施平台的NVIDIA NIM合作伙伴现在能够将这些新的微服务集成到其AI解决方案中,为NVIDIA社区500多万开发者和1.9万家初创公司的生成式AI提供助力。

通过NVIDIA AI Enterprise即可获得Llama 3.1 NIM和NeMo Retriever NIM微服务的生产支持。NVIDIA开发者计划会员将很快能够免费访问NIM微服务,以在他们首选的基础设施上进行研究、开发和测试。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
开始抢人!美国一周挖走4位中国顶尖人才,年薪1亿美金太惊人

开始抢人!美国一周挖走4位中国顶尖人才,年薪1亿美金太惊人

百科密码
2026-04-10 15:56:21
印度摊贩当街斩首货车司机! 提头照网上疯传 群众暴怒围殴酿双亡

印度摊贩当街斩首货车司机! 提头照网上疯传 群众暴怒围殴酿双亡

环球趣闻分享
2026-04-11 14:06:07
重磅!4月9日国防部强硬发声:中国军队必让侵略者付出代价

重磅!4月9日国防部强硬发声:中国军队必让侵略者付出代价

Ck的蜜糖
2026-04-11 02:06:54
回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

素衣读史
2026-03-31 15:11:31
美学者:“如今,除美国外,全球所有国家都已经看清,与美国走得太近只会惹祸上身”

美学者:“如今,除美国外,全球所有国家都已经看清,与美国走得太近只会惹祸上身”

都市快报橙柿互动
2026-04-11 20:10:13
争议?姆巴佩被打脸+流血!主裁拒判点球 皇马官方:西甲暗箱操作

争议?姆巴佩被打脸+流血!主裁拒判点球 皇马官方:西甲暗箱操作

我爱英超
2026-04-11 06:15:26
太复杂了!天津一司机把奔驰开进了中心路的地道…差几步就到平地了…

太复杂了!天津一司机把奔驰开进了中心路的地道…差几步就到平地了…

天津人
2026-04-11 15:34:18
10万亿!中国将成为全世界,乃至人类历史上,首个“电力王国”

10万亿!中国将成为全世界,乃至人类历史上,首个“电力王国”

小熊侃史
2026-04-11 10:38:19
华国锋题字震惊众人!没练书法的人写得竟比高手还好!

华国锋题字震惊众人!没练书法的人写得竟比高手还好!

书画相约
2026-04-10 08:19:50
WTT太原赛最新战报!温瑞博晋级决赛,女乒全出局,还得孙颖莎!

WTT太原赛最新战报!温瑞博晋级决赛,女乒全出局,还得孙颖莎!

曹说体育
2026-04-11 21:26:26
难以置信啊!一餐吃掉562339.80元,上海一张消费清单刷爆网络

难以置信啊!一餐吃掉562339.80元,上海一张消费清单刷爆网络

火山詩话
2026-04-10 06:49:46
4299元!刚发布的这款Pro新机把我整不会了,但好像又有点香

4299元!刚发布的这款Pro新机把我整不会了,但好像又有点香

科技堡垒
2026-04-10 09:16:56
北京亦庄太魔幻了,无人机、机器人满街跑,连鸵鸟都上路了

北京亦庄太魔幻了,无人机、机器人满街跑,连鸵鸟都上路了

每日人物
2026-04-09 09:17:24
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
闹大了!“你不想毕业了,敢威胁我”,导师与学生的聊天炸开锅了

闹大了!“你不想毕业了,敢威胁我”,导师与学生的聊天炸开锅了

火山詩话
2026-04-11 08:55:49
Lululemon憋了3年的鞋,被用户发现能当两双穿

Lululemon憋了3年的鞋,被用户发现能当两双穿

追星雷达站
2026-04-11 08:07:29
情侣在餐厅秀恩爱,女友手部动作不雅被偷拍,目击者:都看习惯了

情侣在餐厅秀恩爱,女友手部动作不雅被偷拍,目击者:都看习惯了

李晚书
2026-04-10 17:13:10
卫健委明确:只要深度睡眠达到这个时长,该干嘛干嘛,别自我焦虑

卫健委明确:只要深度睡眠达到这个时长,该干嘛干嘛,别自我焦虑

路医生健康科普
2026-04-09 11:30:21
单膝跪地敬献鲜花!王毅向志愿军先烈致以最崇高的敬意

单膝跪地敬献鲜花!王毅向志愿军先烈致以最崇高的敬意

军武咖
2026-04-11 12:29:26
特朗普连线绕月飞船:讲话后冷场1分钟,宇航员问NASA局长“通话是否中断”

特朗普连线绕月飞船:讲话后冷场1分钟,宇航员问NASA局长“通话是否中断”

红星新闻
2026-04-09 12:44:22
2026-04-11 22:07:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11556文章数 117027关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

特朗普:美方开始清理霍尔木兹海峡

头条要闻

特朗普:美方开始清理霍尔木兹海峡

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

郑钧回应儿子走路:会监督他挺直腰板

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

家居
本地
亲子
艺术
公开课

家居要闻

复古风格 自然简约

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

亲子要闻

糖果套圈圈想吃哪个套哪个

艺术要闻

花6亿,烂尾12年,福建一处“顶奢别墅”,野草都长到三楼了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版