网易首页 > 网易号 > 正文 申请入驻

亮出全栈生成式AI架构,亚马逊云科技加速生成式AI应用之旅

0
分享至

如果你是一家电商企业,只要告诉Amazon Bedrock Agents,它是一个要帮客户退货的客服代表,就可以快速构建一个退换货的客服系统。

如果你是企业的IT人员,只需用自然语言描述工作负载的需求,Amazon Q就像一个云计算专家,可以告诉你什么样的EC2实例更适合自身业务。

当很多人认为云计算只是为生成式AI提供基础设施底座时,在2023年re:Invent峰会上,亚马逊云科技的一系列重磅发布,预示着这家云计算巨头已经将生成式AI嵌入到越来越多云服务中,帮助企业在云上便捷、快速地构建生成式AI应用。

一方面,Anthropic、Stability AI这样的头部科技公司始终需要更高效更具性价比的生成式AI基础设施。另一方面,更多企业需要的不是通用的基础大模型,而是如何更快开始借助生成式AI进行业务创新,加速应用落地。

面对这些差异化的需求,亚马逊云科技都能满足,这种能力来自其最新升级的全栈生成式AI三层架构。

最底层是用于基础模型训练和推理的基础设施,包括芯片、软件、网络环境等。

中间层是构建生成式AI的工具层,包括提供丰富的基础大模型选择的Amazon Bedrock平台和Guardrails、Agents等。

最上层是开箱即用的应用程序,包括企业级生成式AI助手Amazon Q、Amazon CodeWhisperer等。

覆盖硬件、软件、网络环境的基础设施底座

在生成式AI的芯片布局中,亚马逊云科技坚持开放合作和自研芯片两大策略。

今年re:Invent上可以看到我们在努力地使自己成为云上提供英伟达GPU最好的云计算厂商。”亚马逊云科技大中华区基础设施产品技术总监郭峰向媒体表示。

亚马逊云科技始终保持着在云上用英伟达芯片进行AI创新的领先地位。今年早些时候,亚马逊云科技是全球第一家将英伟达H100 GPU和Amazon EC2 P5实例推出市场的主要云服务商。

在re:Invent2023,亚马逊云科技与英伟达的合作进一步升级。

亚马逊云科技是首家将全新超级芯片GH200导入云计算的云服务商,首款使用英伟达最新芯片GH200 NVL32 的英伟达DGX云即将登陆亚马逊云科技。同时,双方还将开展“Project Ceiba”合作项目,它将配备1.6万个英伟达GH200超级芯片,并结合亚马逊云科技高性能网络传输服务EFA与虚拟化芯片Nitro,能够达到65 ExaFLOPS的性能,将成为全球最快、基于GPU的AI超级计算机。

自研芯片方面,今年新推出了新一代通用芯片Amazon Graviton4和训练芯片Amazon Trainium2。

Amazon Graviton4的创新可以参考智能进化论此前文章《云上算力进化无止境,Amazon Graviton4已出发》。

相比上代产品,Amazon Trainium2性能提升了四倍,特别针对于千亿甚至万亿参数的大模型训练做了调优。Anthropic 正计划用 Amazon Trainium2 芯片构建模型。

Amazon Graviton芯片的应用越来越广泛,涵盖了Web服务、数据库应用、大数据分析和机器学习。

由于广泛的应用场景,Amazon Graviton已被全球范围各行各业的客户用来降本增效。

全球知名广告服务商FreeWheel在广告推荐场景中广泛使用Amazon Graviton3的实例,在相同成本下,得益于CPU性能的提升,Amazon Graviton3的工作负载量增加了30%。知名游戏公司Habby采用Amazon Graviton3实例,实现性能提升25%。

在算力之外,软件与网络环境也是制约大模型训练推理效率的瓶颈。亚马逊云科技UltraClusters、EFA、Neuron为更高性能的AI训练提供保障。

EC2 UltraClusters是一种超大规模集群,由高性能计算、网络和云存储组成。每个 EC2 UltraCluster 都是一台强大的超级计算机,使客户能够在多个系统上运行最复杂的 AI 训练和分布式 HPC 工作负载。

高性能网络传输服务Amazon EFA提供了高达3.2T的网络互联能力,客户可以在单个集群中部署多达两万个GPU芯片的超级规模集群,提供相当于20个ExaFLOPS的集成能力,等同于一台超级计算机。

数据是决定生成式AI应用差异化的关键

在全栈生成式AI架构中,中间层是以Amazon Bedrock为代表的工具层。

Amazon Bedrock可以让用户通过API的方式调用丰富的基础大模型。目前,Amazon Bedrock支持的最新基础大模型包括200K标记上下文窗口的Claude2.1模型、70B的Llama 2大语言模型等。

数据是决定生成式AI应用差异化优势的关键因素。如何将企业自身数据与基础模型能力更好地结合?亚马逊云科技推出三种基于基础模型进行差异化定制的能力:

首先,对基础模型的微调。

目前,Amazon Bedrock对Cohere Command Lite,Meta Llama 2, Amazon Titan Text Lite & Express的微调能力已经发布,针对Anthropic Claude的微调能力即将推出。

其次,基于检索增强生成(RAG)能力打造企业的内部知识库。

目前,内部知识库依然是企业客户应用生成式AI的核心场景之一。今年推出的Amazon Knowledge Base服务可以快速搭建知识库类应用,它原生支持检索增强生成,并支持多种类型的向量数据库。

第三,如果企业有大量的私域数据,可以基于云上基础模型做持续的预训练。

新推出的Amazon Titan Text Lite和Express,更适合企业客户对行业模型、场景模型进行预训练。

在构建工具层,今年亚马逊云科技一个重磅发布就是可以帮助企业快速创建生成式 AI 应用程序的工具Amazon Bedrock Agents。它可以跨公司系统和数据源执行多步骤任务,开发者只需点击几下,就能创建完全托管的 Agents。

以电商退货场景为例,Amazon Bedrock Agents会通过自己的推理能力来分析和规划任务,自动推算出如果要做退货,后台需要经过几个步骤,需要调用哪些API,什么时候开始调用。然后它就会执行这个计划,采取措施、搜集信息来完成任务。整个过程都是自动执行的,大大加速了创建生成式 AI 应用的进程。

在数据安全方面,客户的任何数据都不会用于训练底层模型。所有数据在传输和静态时均经过加密,用于自定义模型的数据将保留在客户的VPC内。安全监管产品Guardrails for Amazon Bedrock,可以根据应用程序需求和政策定制保障措施,阻止生成式AI应用程序中不需要的话题,根据AI策略过滤有害内容。

提升各个角色生产力的专家助手

在生成式AI应用层,企业级生成式AI助手Amazon Q是最重磅的新产品。

亚马逊云科技大中华区产品部总经理陈晓建介绍,目前Amazon Q有四大应用场景,今后更多的亚马逊云科技的云服务内嵌到Amazon Q的能力。

第一, 作为亚马逊云科技的专家,帮助开发人员更好地选择和使用云服务。

用户可以用自然语言询问Amazon Q任何关于亚马逊科技产品的相关问题,比如什么样的EC2实例更匹配自己的工作负载,或了解故障发生的原因和解决办法。

在亚马逊云科技内部,某团队通过使用Amazon Q,短短两天之内就把一千多项应用做了Java的升级,把Java底层版本从Java8升级到了Java17。

陈晓建还举例说,如果用户想把今年re:Invent的众多视频从YouTube上下载,通过Amazon Transcribe把视频文字摘取出来,然后通过翻译服务把文字从英文转成中文。只要一条简单的自然语言指令,Amazon Q就可以帮助我们生成相应的代码,去完成所有上述一系列操作。

第二, 帮助业务人员更高效地完成工作。

Amazon Q目前可以连接40多种流行的数据源,包括像Amazon S3、Google Drive、Microsoft 365、Gmail、Salesforce、ServiceNow、Slack等,可以为员工的业务问题提供答案。Amazon Q而且严格遵守访问控制全新,仅返回用户角色授权可以查看的信息。

第三, 更强的商业智能BI能力。

将Amazon Q的能力嵌入商业智能工具Amazon QuickSight,可以获得更智能的BI能力。用户仅需通过自然语言提问,就可以自动化生成业务分析图表,辅助用户做出更精准的商业决策。

第四,将生成式AI能力嵌入云呼叫中心Amazon Connect。

Amazon Connect中的Amazon Q可以深入了解客户意图,根据实时的客户问题为坐席提供建议和行动,帮助坐席在与客户实时沟通中做出准确的响应和行动,为客户提供更快速、更准确的支持。

写在最后

可以看出,亚马逊云科技推出的全栈生成式AI架构,为生成式AI时代各个角色的参与者都提供了相对应的解决方案,无论是开发者、架构师、IT人员,或是对大模型相关技术并不了解、只是想使用生成式AI的业务人员。

这也验证了在生成式AI时代,云服务商兼具基础设施底座和加速应用构建的多重价值。

“生成式AI正在以意想不到的方式提升人类的生产力,同时也在激发人类的智慧和创造力,我相信未来生成式AI和各行各业业务的结合会充满着无限的可能性。”陈晓建分享道。

本文为「智能进化论」原创作品。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿根廷“保送”4强?有趣:32强上半区欧洲化,下半区南美非亚化

阿根廷“保送”4强?有趣:32强上半区欧洲化,下半区南美非亚化

足球大腕
2026-06-28 15:32:12
52岁退休母亲给女儿带娃,5个月后小腹变大,女儿得知真相懵了

52岁退休母亲给女儿带娃,5个月后小腹变大,女儿得知真相懵了

秋风专栏
2025-03-05 12:39:26
奉命撞你舰?台海巡和大陆海警东沙对峙,台中舰居然开足马力冲锋

奉命撞你舰?台海巡和大陆海警东沙对峙,台中舰居然开足马力冲锋

阿龙聊军事
2026-06-28 08:27:45
洛塞尔索是梅西德保罗最好的朋友,斯卡洛尼顶住压力征召他

洛塞尔索是梅西德保罗最好的朋友,斯卡洛尼顶住压力征召他

kio鱼
2026-06-28 12:15:41
封神!穆里尼奥一针见血!力挺世界杯无敌的皇马王牌

封神!穆里尼奥一针见血!力挺世界杯无敌的皇马王牌

一隅非生
2026-06-28 08:35:06
中国宁愿向美国购买大量转基因大豆,也不从俄罗斯购买,这是为啥

中国宁愿向美国购买大量转基因大豆,也不从俄罗斯购买,这是为啥

生活新鲜市
2026-06-28 14:46:44
跌入斩杀线的老电车,正在靠充电宝强行续命

跌入斩杀线的老电车,正在靠充电宝强行续命

酷玩实验室
2026-06-26 18:25:07
早点回家!北京又要下雨,局地雨强较大,并伴7级短时大风!具体时段——

早点回家!北京又要下雨,局地雨强较大,并伴7级短时大风!具体时段——

BRTV新闻
2026-06-28 13:09:27
美媒曝3方交易方案:詹姆斯父子回骑士、湖人得墨菲等4将!

美媒曝3方交易方案:詹姆斯父子回骑士、湖人得墨菲等4将!

运筹帷幄的篮球
2026-06-28 15:46:51
2026年7月起死亡证明新规落地!房产存款保险全都受影响?

2026年7月起死亡证明新规落地!房产存款保险全都受影响?

老特有话说
2026-06-27 00:25:03
访华第二天,洪森当众对中国做出一项永久承诺!高市早苗要气炸了

访华第二天,洪森当众对中国做出一项永久承诺!高市早苗要气炸了

小祁谈历史
2026-06-27 16:09:36
央视直播大满贯时间出炉:6月29日CCTV5直播国乒!楚钦首秀迎强敌

央视直播大满贯时间出炉:6月29日CCTV5直播国乒!楚钦首秀迎强敌

凡知
2026-06-28 15:17:08
兰州大学回应“教师杨某某相关论文问题”:已成立专项调查组

兰州大学回应“教师杨某某相关论文问题”:已成立专项调查组

新京报
2026-06-28 11:27:13
金价!大家要有心理准备了,下周,金价或将迎来大风暴

金价!大家要有心理准备了,下周,金价或将迎来大风暴

花小猫的美食日常
2026-06-28 14:40:31
局势恶化,岛内开始备战,台军却发现:解放军的战力,被严重低估

局势恶化,岛内开始备战,台军却发现:解放军的战力,被严重低估

涵豆说娱
2026-06-27 23:34:23
兰州大学回应教师杨某某相关论文问题:成立专项调查组

兰州大学回应教师杨某某相关论文问题:成立专项调查组

界面新闻
2026-06-28 11:00:30
700分以上人数对比,湖北31人,河南48人,浙江“断层式”领先!

700分以上人数对比,湖北31人,河南48人,浙江“断层式”领先!

手工制作阿爱
2026-06-28 00:13:17
苏州市委常委、副市长施嘉泓,任姑苏区委书记

苏州市委常委、副市长施嘉泓,任姑苏区委书记

江南江南
2026-06-28 17:08:47
为什么说不体面的小生意往往赚大钱?网友:一天三千都算少的

为什么说不体面的小生意往往赚大钱?网友:一天三千都算少的

康富贵碎碎念
2026-06-28 11:22:01
世界最有钱国家:收入超中国10倍,一天工作3小时,生活免费

世界最有钱国家:收入超中国10倍,一天工作3小时,生活免费

新时代精神
2026-06-27 23:34:21
2026-06-28 18:40:49
智能进化论 incentive-icons
智能进化论
关注AI产业趋势、场景应用
460文章数 80关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

两只股票撑起的韩国股市,半年熔断 33 次

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

艺术
手机
家居
数码
教育

艺术要闻

赵孟頫比肩王羲之的一幅行书,能达到这种境界的,700年来只有他一人!

手机要闻

与高端、中端有关,荣耀传来三大喜讯

家居要闻

绿意盎然 自然之境

数码要闻

机械师“MJQ25F250P”24.5英寸2K 250Hz显示器开售,899元

教育要闻

赶快检查孩子的手机里有没有这几款违法软件

无障碍浏览 进入关怀版