HPE发布用于机器学习开发的集成一体化系统|hpe|分布式计算|软件包

HPE发布用于机器学习开发的集成一体化系统

2022-05-26 11:37:45　来源: 科技评评

江西举报

分享至

HPE今天公布了自去年收购Delivered AI之后取得的一些成果：一个用于大规模构建和训练机器学习模型的平台。

HPE表示，这个名为HPE Machine Learning Development System的系统结合了HPE Machine Learning Development Environment与计算、加速器和板载网络，可显着加速模型的开发速度。

该系统旨在解决购买和安装大规模并行处理器所涉及的、通常是很复杂的多步骤过程，包括专门的计算、存储、互连和加速器。此次面市的打包产品让企业组织可以立即就开始构建和训练机器学习模型。

HPE公司高性能计算、关键任务解决方案和实验室总经理Justin Hotard表示：“训练深度学习模型不仅复杂、耗时而且是资源密集的，很多工程师把大量时间花费在管理基础设施上，而不是专注于优化模型上，这意味着他们可以专注于业务成果、而不是技术要求。”

该系统将作为基于HPE Apollo 6500 Gen10系统的单个软件包提供给用户，起步配置是8个Nvidia A100 80 GB GPU，管理堆栈使用HPE ProLiant DL325服务器和1Gb Ethernet Aruba CX 6300交换机。

网络和存储则由Nvidia Quantum InfiniBand提供，监控和管理由HPE Performance Cluster Management提供。

Hotard说：“当今市场上普遍存在的是刚性解决方案，在规模上是非常昂贵的，同时对于客户来说这意味着更复杂、需要更长时间才能获得洞察。”而HPE的目标是为客户“在部署模型的位置和部署模型的基础设施方面提供极大的灵活性”。

HPE还通过推出HPE Swarm Learning（一种用于边缘计算或者分布式计算的隐私保护、去中心化机器学习框架）来巩固自己的AI业务。该框架为客户提供的软件容器可以与使用HPE swarm API的AI模型进行集成，让企业组织能够与其他组织共享AI模型的学习成果，而无需共享任何实际数据。

大多数AI模型训练都依赖于集中的、合并的数据集，由于需要移动大量数据，因此这既低效成本又高。在受监管的行业中，此类模型训练也可能受到限制外部数据共享、移动数据隐私以及所有权方面各项规则的约束，结果就会导致AI模型的质量较低，HPE表示。

HPE Swarm Learning让企业组织在源头位置就可以采用分布式数据，增加训练数据集大小的同时，确保遵循数据治理和数据隐私规定。区块链技术则用于保护链中成员、动态选举领导者、合并模型参数等方面。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

HPE发布用于机器学习开发的集成一体化系统

小鹏一季度营收65.5亿，经营亏损16.5亿

美媒:莱希之死基本为小哈梅内伊接替父亲职位铺平道路

美媒:莱希之死基本为小哈梅内伊接替父亲职位铺平道路

兄弟们，为了我，拿下冠军吧！

杨洋乔欣聊天记录曝光！还牵扯张天爱

中植系的销售，不退40亿被抓了

四排八座纯电MPV/续航超过800km 翼真L380开启预订

态度原创

使用判别式法求最大值问题，这方法很好用，考试前复习

生活蜕变 简约理念雕刻理想居所

在中国，到底哪些人在吃“伟哥”？

挖掘艺术界未来的璀璨星辰 | 莱俪青年艺术奖获奖艺术家邓启鹏

美方无理指责中方向俄提供军事装备 中国代表当场回击

生活蜕变简约理念雕刻理想居所

美方无理指责中方向俄提供军事装备中国代表当场回击