11月29日消息,在美国时间周二举办的Reinvent大会上,亚马逊旗下的云计算部门AWS发布了新的人工智能(AI)芯片,供客户构建和运行人工智能应用程序,并计划提供英伟达的最新芯片。
AWS正试图以各种高性价比的选择脱颖而出,成为云服务提供商。不过,它不会只销售廉价的亚马逊品牌产品。就像亚马逊的在线零售市场一样,亚马逊的云计算服务也将提供来自其他供应商的顶级产品,包括顶级人工智能芯片制造商英伟达的GPU。
自人工智能初创企业OpenAI去年发布ChatGPT聊天机器人以来,英伟达GPU的需求就不断飙升。ChatGPT聊天机器人具有总结信息和撰写类似真人文本的能力,令人们惊叹不已。这导致英伟达的芯片短缺,因为各家公司都在竞相将类似的生成式人工智能技术整合到自己的产品中。
亚马逊选择了双管齐下战略,既生产自己的芯片,又允许客户使用英伟达的最新芯片,这可能会帮助它对抗云计算领域的头号竞争对手微软。本月早些时候,微软也采取了类似的做法,发布了其首款人工智能芯片Maia 100,并表示Azure云将采用英伟达H200 GPU。
具体来说,AWS表示,它将提供英伟达最新H200人工智能图形处理单元。该公司还发布了新的Trainium2人工智能芯片和通用Graviton4处理器。
新的H200 GPU是H100的升级版,OpenAI曾使用H100来训练其最先进的大语言模型GPT-4。大型公司、初创公司和政府机构都在争夺有限的芯片供应,这意味着从亚马逊等云服务提供商那里租用芯片的需求也很高。英伟达表示,H200的输出速度将是H100的近两倍。
亚马逊自己的Trainium2芯片是为训练人工智能模型而设计的,包括支持OpenAI ChatGPT等人工智能聊天机器人及其竞争对手运行的基础模型。亚马逊表示,初创公司Databricks和OpenAI的竞争对手、亚马逊支持的Anthropic计划用新的Trainium2芯片构建模型,新模型的性能将比原来的模型提高四倍。
Graviton4处理器基于Arm架构,比英特尔或AMD的芯片能耗更低。Graviton4承诺比现有的Graviton3芯片性能提高30%,从而实现AWS所说的更高的价格产出。由于通货膨胀率始终高于往常,这促使央行提高利率,那些希望继续使用AWS,但为降低云服务账单以更好应对经济问题的组织可能希望考虑迁移到Graviton上。
亚马逊表示,超过5万名AWS客户已经在使用Graviton芯片。
最后,作为与英伟达加深合作关系的一部分,AWS表示,它将运营超过16000颗英伟达GH200 Grace Hopper超级芯片,这些芯片包含英伟达GPU和基于Arm架构的通用处理器。英伟达自己的研发团队和AWS客户都将能够利用这一基础设施。
自2006年推出用于计算和存储数据的EC2和S3服务以来,AWS已经推出了200多种云产品。当然,并不是所有服务都大获成功,有些版本已经很长时间没有更新,而少数版本已经停产,从而让亚马逊释放并重新分配资源。然而,该公司仍在继续投资Graviton和Trainium项目,这表明亚马逊已经意识到了需求。
AWS没有宣布搭载英伟达H200芯片的虚拟机实例的发布日期,也没有宣布使用其Trainium2芯片的虚拟机实例的发布日期。不过,客户现在就可以开始测试Graviton4的虚拟机实例,几个月后就可以投入商业使用。(小小)