网易首页 > 网易号 > 正文 申请入驻

云上机器学习的“引力”

0
分享至

人工智能商业化进程逐步加快,以机器学习为代表的技术快速向各行各业渗透,而云上的机器学习服务正成为推动人工智能商业化落地的重要动力之一。在2020年的亚马逊re:Invent在线峰会上,AWS全球机器学习副总裁Swami Sivasubramanian全面展示了AWS关于机器学习的愿景。

自从2017年AWS上线了机器学习技术堆栈Amazon SageMaker后,在云上形成了强大的“引力”,吸引着越来越多的用户将机器学习工作负载迁移到云端。根据AWS的最新统计,已经有超过10万的客户在短短3年内使用了Amazon SageMaker,其中不乏美国运通、宝马和耐克等这样的行业领军者。

机器学习框架和算力的选择权

长久以来,框架的选择和计算能力都是机器学习的基础。AWS的机器学习服务在底层提供了由框架、计算资源、容器和数据集等构成的“底座”。提供丰富的框架和计算实例让用户根据应用的不同场景,自由选择。

“在AWS机器学习堆栈的底层,我们不断为用户优化深度学习的框架,GPU/CPU,以及我们自研的针对机器学习模型训练和推理的芯片”,Swami说。

开放、包容的框架选择策略,让AWS涵盖了几乎所有的框架。TensorFlow、PyTorch、MXNet、Chainer、Gluon、Horovod和Keras等机器学习框架和接口标准。不论是最知名的Tensorflow,还是后起之秀PyTorch,在AWS上都已经拥有了相当可观的使用规模,目前92%的基于Tensorflow框架的机器学习工作负载,91%的基于PyTorch框架的工作负载都跑在AWS云上。

同样在基础设施上,AWS也将选择权交给了用户,不仅提供基于英伟达、英特尔、AMD、赛灵思等芯片厂商的最新处理器能力,还提供自研的芯片,力争提供最优的性价比,让用户选择。

“每一项机器学习任务对计算能力和成本的需求和颗粒度都不一样,AWS就是要将计算能力的多样性和优化做到极致”,AWS大中华区云服务产品管理总经理顾凡强调。

比如,如果用户要追求性能极致,可以选择基于NVIDIA A100 GPU的P4d实例,它也是AWS首款网络带宽支持400Gbps的机器学习训练实例;如果用户追求最优性价比,可以选择基于AWS自研AWS Inferentia芯片的Inf1实例。

在今年的re:Invent大会上,AWS推出了全新的机器学习训练芯片AWS Trainium,与标准的AWS GPU实例相比,可带来30%的吞吐量提升,以及降低45%的单次引用成本。同时,Trainium支持与Inferentia相同的SDK。

总之,机器学习的框架和算力不断随着用户的应用场景和使用规模演进迭代,AWS始终围绕用户的需求优化性能和成本,将丰富的选项留待用户选择。

机器学习“全流程”的易用性

数据的训练,算法的优化,模型的训练,以及模型的部署、调优是机器学习的核心,Amazon SageMaker平台的每一次迭代都将易用性大幅升级,来消除数据工程师、算法工程师和开发者在机器学习模型构建和训练“全流程”周期中的繁重工作。

在今年的re:Invent大会上,AWS特别针对特征数据集提取、存储和访问进行了重笔墨的优化。

Amazon SageMaker Data Wrangler可大大简化用户的数据准备工作。相比数据标签,数据特征工程的难度更大,而且耗时。

Data Wrangler是一项数据特征的提取器,能将不同来源、格式多样的数据提取,形成规划化的数据字段。Data Wrangler的特别之处在于,可一键导入各种数据源中的数据,不仅全面支持AWS云上的数据仓库、对象存储等数据中的数据,还可对接市场上主流的第三方数据源,比如Snowflake、MongoDB和Databricks。

而且,Data Wrangler内置了300多个数据转换器,用户无需编写任何代码,就能将机器学习需要的特征进行规范化、转换和组合;同时可以在SageMaker Studio的IDE中查看,检查转换是否符合预期。

有效的解决了特征的提取后,用户将面临大量数据特征需要管理的挑战,比如将一组特征用于不同的模型,被多个开发人员和数据科学家使用,需要有效地跟踪、管理这些特征,及时更新,保持一致性;模型训练和利用模型进行推理(也就是实际运用模型),对特征的使用场景也不同。在训练过程中,模型可以离线、批量地访问特征,使用时间长。而对于推理,通常只用到特征库的一部分,不过需要实时访问,几毫秒内返回预测结果。因此,需要对特征库进行管理。

Amazon SageMaker Feature Store是用于更新、检索和共享机器学习特征的专用库。首先,可以解决特征的一致性问题,在训练和预测方面两边用的都是同一套特征;其次,能解决训练和预测中低延迟,以及大批量的加载更多特征数据的需要。

此外,AWS还发布了用于优化自动化工作流的Amazon SageMaker Pipelines,为机器学习构建的、方便易用的CI/CD(持续集成和持续交付)服务;用户优化模型偏差的Amazon SageMaker Clarify;用于大型复杂深度学习分布式训练的Amazon SageMaker Distributed Training等多项机器学习的中间层服务。

“Amazon SageMaker对机器学习的每个步骤的迭代越来越细,帮助客户找到探索机器学习的捷径,从而真正提升数据科学家和算法工程师的核心生产力和生产效率”,顾凡强调。

机器学习的民主化

AWS的机器学习技术堆栈,不仅能够满足拥有完整机器学习知识和技能团队的企业需求,还在机器学习的“民主化”方面不断扩展,毕竟不少的初创企业希望通过机器学习来提升数字化和智能化能力,往往这些企业拥有IT基础,比如有DBA、开发者、数据分析师等,但是缺乏熟悉机器学习的专业人员。

2020年11月21日,国家工业信息安全发展研究中心在《2020人工智能与制造业融合发展白皮书》中指出了目前融合存在的诸多难点,其中人才匮乏问题尤为严重。而人社部官网的报道中测算,目前我国人工智能人才的缺口超过500万,国内的供求比例为1:10,供需比例严重失衡。

针对企业缺少专业AI和机器学习人才的痛点,AWS最新上线了多项针对数据库、数据仓库、数据湖,以及商业智能(BI)方面的机器学习服务。

比如Amazon Redshift ML服务,数据分析师只管SQL查询,Redshift ML可以把数据导入Amazon S3,然后与SageMaker的Autopilot功能结合。Autopilot是一个自动建模的功能。之后,Redshift ML可以自动进行数据清洗、模型训练,选择最优的模型进行预测。

比如,Amazon QuickSight是AWS的一个商业智能(BI)服务,可以轻松地调用各种数据进行分析和展现。AWS于2020年5月推出了QuickSight ML新功能,它也跟SageMaker的Autopilot功能进行了结合,数据分析人员可以用它开展欺诈检测、销售预测等工作。在今年的re:Invent大会上,AWS推出了更酷的机器学习新功能QuickSight Q。通过它,可以用自然语言对数据进行提问,获得想要的数据洞察。例如,直接在查询框中输入“我们的同比增长率是多少?”几秒钟之内就可以得到高度准确的答案。如果按以往的方式,需要在模型中预先定义增长率、更新模型、处理数据,可能需要几天甚至几周时间。

“AWS希望更多的用户能够更加容易的参与机器学习,你只要有创新的主意,不需要懂机器学习,也能够通过机器学习给业务带来价值”,顾凡说。

机器学习的端到端能力

机器学习落地到应用场景中,很重要的一点是能够具备端到端的能力,帮客户解决实际的业务问题。

所以,为了将机器学习更好的落地的工业领域,AWS首次推出了开箱即用的5个工业领域机器学习解决方案。有硬件外设也有与客户解决方案融合的服务。

Amazon Monitron面向没有建立传感器网络的客户,提供由传感器、硬件网关和机器学习服务组成的端到端机器监控系统,来检测异常并预测何时需要维护工业设备;Amazon Lookout for Equipment是面向已经拥有传感器、但不希望自己构建机器学习模型的客户,由AWS为其构建模型并返回预测结果,检测异常设备行为。

AWS Panorama一体机是一个硬件设备,将它连接到工业场所的网络中,它就可以自动识别摄像头数据流,与工业摄像头进行交互。同时,AWS Panorama软件开发套件(SDK),方便工业相机制造商在新相机中嵌入计算机视觉功能。

Amazon Lookout for Vision为工业客户提供高精度、低成本的产品质量异常检测解决方案。它通过机器学习技术,每小时可以处理数千张图像,发现产品缺陷和异常。客户可以将摄像头图像批量或实时发送到Amazon Lookout for Vision,找出异常,例如机器部件的裂纹、面板上的凹痕、不规则形状或产品上的颜色错误等。

目前已经使用AWS工业领域机器学习服务的客户和合作伙伴包括Axis、凌华科技、BP、德勤、Fender芬达、GE医疗和西门子交通等等。

结语

作为目前云端最广泛最具深度的一站式机器学习堆栈,用户对Amazon SageMaker的采用很大程度上都与AWS为机器学习提供的自由选择权,易用性、民主化和端到端能力密不可分。相信,未来将有越来越多的现代化企业应用和行业场景注入云端的机器学习服务来提升效率,降低成本,将数据转化为洞见和生产力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泡沫,要破了

泡沫,要破了

价值罗盘
2026-05-22 21:26:50
只差临门一脚!美伊协议曝光,以色列被踢出局

只差临门一脚!美伊协议曝光,以色列被踢出局

上游新闻
2026-05-24 22:12:11
华天科技,业绩爆了!

华天科技,业绩爆了!

新浪财经
2026-05-24 18:25:43
奉陪到底!中方强势取消3500亿美芯订单,马斯克:这只是个开始

奉陪到底!中方强势取消3500亿美芯订单,马斯克:这只是个开始

荒野科技
2026-05-24 12:00:06
一定要多读书,书读的多了才会明白:“底层无贵人、底层无社交”

一定要多读书,书读的多了才会明白:“底层无贵人、底层无社交”

心理观察局
2026-05-24 06:57:19
MVP的含金量!B费本赛季联赛直接参与30球,21助破英超纪录

MVP的含金量!B费本赛季联赛直接参与30球,21助破英超纪录

懂球帝
2026-05-25 01:06:25
枪击、油断、内讧:本季菲律宾还有啥?

枪击、油断、内讧:本季菲律宾还有啥?

新民周刊
2026-05-24 13:36:59
前Meta员工吐槽:团队90%是华人,7次裁员有6次针对本就少数的非华人

前Meta员工吐槽:团队90%是华人,7次裁员有6次针对本就少数的非华人

西游日记
2026-05-24 18:21:55
68岁丈夫出轨90后女子还生下双胞胎,5年转账4800万元?妻子怒告二人要求还钱,男子承认出轨否认转账:妻子知情同意,从没想过离婚……

68岁丈夫出轨90后女子还生下双胞胎,5年转账4800万元?妻子怒告二人要求还钱,男子承认出轨否认转账:妻子知情同意,从没想过离婚……

都市快报橙柿互动
2026-05-24 16:32:21
iOS 26改了息屏显示,你可能不喜欢这个变化

iOS 26改了息屏显示,你可能不喜欢这个变化

像素与芯片
2026-05-23 02:27:18
剑南春|阿森纳2-1水晶宫联赛85分收官,热苏斯、马杜埃凯建功

剑南春|阿森纳2-1水晶宫联赛85分收官,热苏斯、马杜埃凯建功

懂球帝
2026-05-25 01:06:25
尘埃落定!决赛2-3输球仅1天,日籍主帅下课悬念揭晓,董路怒批!

尘埃落定!决赛2-3输球仅1天,日籍主帅下课悬念揭晓,董路怒批!

大秦壁虎白话体育
2026-05-24 08:54:31
人数都统计不清楚,还能指望他们什么?

人数都统计不清楚,还能指望他们什么?

历史总在押韵
2026-05-24 18:54:04
周冬雨“拔萝卜”的瓜!

周冬雨“拔萝卜”的瓜!

八卦疯叔
2026-05-23 11:01:00
高温连破历史记录,印度政府却将空调压缩机进口比例上限收紧至30%,加剧供需矛盾

高温连破历史记录,印度政府却将空调压缩机进口比例上限收紧至30%,加剧供需矛盾

风向观察
2026-05-24 16:33:31
这5种药不宜长期服用,可能破坏身体免疫力!很多人都不知道

这5种药不宜长期服用,可能破坏身体免疫力!很多人都不知道

芹姐说生活
2026-05-24 14:15:40
黄仁勋与家人台湾省聚餐!爸爸与哥哥都秃顶,因祖籍问题网友破防

黄仁勋与家人台湾省聚餐!爸爸与哥哥都秃顶,因祖籍问题网友破防

裕丰娱间说
2026-05-24 07:58:18
太揪心了!山西煤矿矿难,有博主灵魂拷问:你们是干什么吃的!

太揪心了!山西煤矿矿难,有博主灵魂拷问:你们是干什么吃的!

丫头舫
2026-05-24 10:13:49
中央气象台:江苏、上海、浙江西部、安徽南部、湖北东部和南部等地出现较强雷达回波

中央气象台:江苏、上海、浙江西部、安徽南部、湖北东部和南部等地出现较强雷达回波

大风新闻
2026-05-24 10:26:30
武契奇刚下飞机就去长城了 在纪念品商店买买买

武契奇刚下飞机就去长城了 在纪念品商店买买买

看看新闻Knews
2026-05-24 21:47:25
2026-05-25 01:31:00
云智时代
云智时代
云计算,人工智能的新IT时代
898文章数 5452关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

数码
亲子
本地
艺术
公开课

数码要闻

618游戏本怎么选?ROG魔霸新锐2026来袭,福利秒杀让战力飞

亲子要闻

六一儿童节,用贴纸给女儿化妆,和化妆师的手法一样!

本地新闻

用云锦的方式,打开江苏南京

艺术要闻

砸12亿!中国第一座“星穹大球”,上海人沸腾!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版