网易首页 > 网易号 > 正文 申请入驻

基于亚马逊云科技的专用硬件训练和部署生成式AI基础模型

0
分享至

本文字数: 1000, 阅读完需: 5 分钟

导读

在Innovate 2024大会上,Chris Fregli和Philips Schmidt发表了题为”GenAI基础模型成功蓝图”的演讲。他们探讨了如何利用亚马逊云科技的专用硬件,如TRAINIUM和INFERENTIA,来训练和部署生成式AI基础模型。他们阐释道,TRAINIUM用于训练模型,而INFERENTIA则用于在生产环境中服务模型。演讲者还强调了Hugging Face Optimum Neuron库的重要性,该库简化了在亚马逊云科技加速器上编译、训练和部署Transformer和扩散模型的过程。该演讲重点介绍了亚马逊云科技和Hugging Face如何通过专用硬件和开源工具,实现高效训练和部署生成式AI模型、提高性能并节省成本。

演讲精华

以下是小编为您整理的本次演讲的精华,共700字,阅读时间大约是4分钟。

在这场演讲中,亚马逊云科技的首席解决方案架构师 Chris Fregli 和 Hugging Face 的技术主管 Philips Schmidt 深入探讨了用于生成式人工智能的基础模型,以及在云端成功训练和部署这些模型的最佳实践。

首先,Chris 强调了当今生成式人工智能模型的广泛应用,它们被应用于从研究到客户服务、数据分析到数字助理等各个领域。在亚马逊云科技上,这些模型可以直接从 Hugging Face Hub 部署到 SageMaker,或者通过 Amazon Bedrock API 访问许多第三方模型并进行微调。

接下来,Chris 介绍了亚马逊云科技专门用于训练(Trainium)和推理(Inferentia)这些大型模型的硬件,相比标准实例可以显著节省成本并提高性能。许多知名客户如三星、飞利浦和字节跳动已经在使用这些加速器,它们得到了 PyTorch、OctoML、Ray 和 Hugging Face 等广泛生态系统的支持。

用于训练的 Trainium 实例,如 tr_n1.32xlarge 和 tr_n1n.24xlarge,具有高达 1.6 Tb/s 的网络带宽,对于大规模工作负载至关重要。在推理方面,Inferentia 2 实例如 inf2.xlarge 和 inf2.24xlarge 为扩散模型(如 Stable Diffusion)提供高达 90% 的每美元吞吐量提升,同时降低延迟。

为了快速入门,可以通过 SageMaker Studio 或 EC2 启动 Trainium 实例,安装抽象底层硬件的 Neuron SDK,并像往常一样监控和优化工作负载。

接着,来自 Hugging Face 的 Philips Schmidt 介绍了 Optimum Neuron,这是一个建立在 Neuron SDK 之上的库,极大简化了在亚马逊云科技硬件上使用 Transformers 和扩散模型的过程。只需几行代码,就可以从 Hugging Face Hub 加载预编译的模型(如 Stable Diffusion 或 LLaMa),并在亚马逊云科技 Inferentia 上生成图像或文本。

Open LLM Leaderboard 评估不同大型语言模型在各种任务上的表现,而 MTEB Leaderboard 则专注于多语言文本嵌入模型。这些排行榜允许根据模型大小、语言等进行过滤,以找到性能和成本之间的最佳平衡。

最后,Philips 介绍了一个参考架构,用于利用亚马逊云科技服务(SageMaker、Inferentia、OpenSearch 等)和 Hugging Face 模型构建带有检索功能的应用程序。该架构结合了用于文档向量化的嵌入模型、用于最近邻搜索的 OpenSearch,以及用于重新表述用户查询和生成相关回复的大型语言模型。

总之,亚马逊云科技与 Hugging Face 的合作关系,通过 Optimum Neuron、Neuron SDK 和 Trainium/Inferentia 实例等工具,使得在云端训练和部署领先的生成式人工智能模型变得高性能和高成本效益。

总结

这场演讲深入探讨了生成式人工智能基础模型的领域,全面概述了它们在亚马逊云科技上的应用、训练方法和部署策略。首先,演讲强调了这些模型在各个领域的广泛应用,从搜索和客户服务到数据分析和数字助理。随后,演讲者介绍了Amazon Bedrock,这是一个API,可以轻松将第三方模型集成到应用程序中,实现微调和持续预训练。

演讲的核心重点转移到亚马逊云科技上专门为训练和服务生成式人工智能模型而设计的硬件Trainium和Inferentia,这些硬件可以显著节省成本并提供高性能。演讲展示了Hugging Face Optimum Neuron库,它简化了在亚马逊云科技加速器上编译、训练和部署Transformers和扩散模型的过程。并提供了实际示例,演示了如何在亚马逊云科技上轻松生成Stable Diffusion图像,以及在亚马逊云科技Inferentia上部署大型语言模型LLaMa。

此外,演讲者介绍了Open LLM Leaderboard和大规模文本嵌入基准(MTEB) Leaderboard,这些是评估和选择最合适的开源模型的宝贵资源,根据性能、大小和语言要求进行选择。最后,演讲提出了一个参考架构,说明了如何将嵌入模型、语言模型和亚马逊云科技服务(如SageMaker、Inferentia和OpenSearch)集成在一起,构建利用生成式人工智能的强大检索应用程序。

演讲最后呼吁与会者探索所提供的资源,在社交媒体上与演讲者互动,并通过调查问卷提供反馈。

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务,服务全球245个国家和地区的数百万客户。亚马逊云科技致力于成为企业构建和应用生成式AI的首选,通过生成式AI技术栈,提供用于模型训练和推理的基础设施服务、构建生成式AI应用的大模型等工具、以及开箱即用的生成式AI应用。深耕本地、链接全球 -- 在中国,亚马逊云科技通过安全、稳定、可信赖的云服务,助力中国企业加速数字化转型和创新,并深度参与全球化市场。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来他们早已离婚,如今一个在北京当会长,一个发福明显商演谋生

原来他们早已离婚,如今一个在北京当会长,一个发福明显商演谋生

胡一舸南游y
2026-06-25 23:22:59
暴增10000%!A股大牛股,突然刷屏!

暴增10000%!A股大牛股,突然刷屏!

证券时报e公司
2026-06-27 20:15:34
中国菲律宾在黄岩岛发生武装对峙

中国菲律宾在黄岩岛发生武装对峙

凤眼论
2026-06-25 18:45:27
张稀哲重伤,1-0!北京队虽双线3连胜,两大队长却受伤

张稀哲重伤,1-0!北京队虽双线3连胜,两大队长却受伤

北门儿
2026-06-27 22:01:05
新婚两月遭家暴瘫痪失明,婆家转移全部财产,母亲:11年判的太轻

新婚两月遭家暴瘫痪失明,婆家转移全部财产,母亲:11年判的太轻

易玄
2026-06-26 20:12:30
勇士一夜4大动向!猛追41岁詹姆斯+再添2米03内线 梅尔顿预计离队

勇士一夜4大动向!猛追41岁詹姆斯+再添2米03内线 梅尔顿预计离队

锅子篮球
2026-06-27 22:04:59
油价大跌超6毛/升,今年大涨超1.19元/升的油价,7月3日再大跌

油价大跌超6毛/升,今年大涨超1.19元/升的油价,7月3日再大跌

油价早知道
2026-06-26 13:55:51
巴特洪堡站决赛大阪直美因伤退赛!穆霍娃横扫夺冠,可惜了王欣瑜

巴特洪堡站决赛大阪直美因伤退赛!穆霍娃横扫夺冠,可惜了王欣瑜

搏击江湖
2026-06-27 18:46:40
国产AI,永远跑不出Anthropic

国产AI,永远跑不出Anthropic

深水研究
2026-06-25 19:19:33
我爸97岁了,真是个狠人,一看自己站不起来了,100天把自己解决

我爸97岁了,真是个狠人,一看自己站不起来了,100天把自己解决

千秋文化
2026-06-27 19:49:57
人到中年,女人最吃的从来不是甜言蜜语,是走心的偏爱

人到中年,女人最吃的从来不是甜言蜜语,是走心的偏爱

青苹果sht
2026-05-20 05:30:11
莫家蝶速率和体能超吴艳妮,不摔或跑12秒85,若专攻短跨上限极高

莫家蝶速率和体能超吴艳妮,不摔或跑12秒85,若专攻短跨上限极高

杨华评论
2026-06-27 21:44:43
人口大迁徙已成定局?明后年,越来越多的人会举家流入这4座城市

人口大迁徙已成定局?明后年,越来越多的人会举家流入这4座城市

星星会坠落
2026-06-27 22:24:54
上大学才知道:除了给生活费,有远见的父母,都在悄悄做这3件事!

上大学才知道:除了给生活费,有远见的父母,都在悄悄做这3件事!

喵咪文化
2026-06-20 07:10:21
辛芷蕾成第1万台车主 ID.ERA 9X卖到30.98万起了

辛芷蕾成第1万台车主 ID.ERA 9X卖到30.98万起了

固件更新中
2026-06-26 13:47:58
金价重现历史了!要有心理准备,7月初,金价或将重现2015年历史

金价重现历史了!要有心理准备,7月初,金价或将重现2015年历史

别人都叫我阿腈
2026-06-27 18:33:46
今年高考数学传出扎心消息:满分150分得主,居然不是考生

今年高考数学传出扎心消息:满分150分得主,居然不是考生

金哥说新能源车
2026-06-25 11:22:36
网传体制内单身问题已经相当严重了,问题到底出在哪里?

网传体制内单身问题已经相当严重了,问题到底出在哪里?

慧翔百科
2026-06-26 17:29:07
杨女士嗓子肿得吞不下饭,医生说不是上火,是马桶冲水惹的祸

杨女士嗓子肿得吞不下饭,医生说不是上火,是马桶冲水惹的祸

网络易不易
2026-06-26 16:30:19
21岁土耳其女排新星Duru Türkan,高挑貌美尽显运动员风采

21岁土耳其女排新星Duru Türkan,高挑貌美尽显运动员风采

娱你同欢
2026-06-19 19:32:24
2026-06-27 23:32:49
大A小i2024
大A小i2024
小小AI爱好者
366文章数 0关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

张雪公布“东鹏特饮事件”原视频

头条要闻

张雪公布“东鹏特饮事件”原视频

体育要闻

世界杯最火门将,站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

搭载华为乾崑ADS 5 全新猛士M817上市售29.99万起

态度原创

健康
教育
游戏
房产
军事航空

“无糖汤圆”是否隐藏着健康陷阱?

教育要闻

看到高考后这魔幻的一幕, 我终于明白:孩子的内驱力是怎么消失的?

《GTA6》还是没有光盘实体版 此前消息属于误读

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

军事要闻

黎以美达成三方框架协议

无障碍浏览 进入关怀版