网易首页 > 网易号 > 正文 申请入驻

我们为什么构建自己的 serverless 机器学习平台,而非使用 AWS Lambda?

0
分享至

作者 | Caleb Kaiser

译者 | 张卫滨

策划 | 万佳

本文最初发表于 Cortex 网站,经原作者 Caleb Kaiser 许可由 InfoQ 中文站翻译分享。

对于模型部署来讲,AWS Lambda 是一个很有吸引力的方案。从表面上来看,其收益是很明显的。Lambda 可以:

  • 让数据科学家和机器学习工程师在部署时无需管理基础设施

  • 在最大化可用性的同时,能将成本降到最低

  • 为定义预测 API 提供了一个简单的接口

但是,问题在于,尽管这都是 serverless 架构的收益,但是像 Lambda 这样的通用 serverless 平台通常会有一些限制,这些限制使得它并非机器学习的最理想方案。

我们亲身体会到这一点。在着手实现 Cortex 之前,我们曾经尝试通过 Lambda 运行部署。事实上,正是由于 Lambda 的不足,在一定程度上促使我们建立一个专门用于机器学习的 serverless 计算平台。

1Lambda 不能部署大型的模型(比如 Transformer 模型)

现在,你可能已经读过很多关于机器学习模型增长的文章了。可以说,在很多适用于机器学习的领域,尤其是自然语言处理方面,模型正在迅速地变得越来越大。

例如,在过去几年中,Hugging Face 的 Transformers 库成为了最受欢迎的 NLP 库。从传闻中看到,用户经常在生产 API 中使用它。这个库为如下的模型提供了便利的接口:

  • GPT-2:完全训练后大约是 6GB

  • BlenderBot:完全训练后大约是 5GB

  • RoBERTa:完全训练后大于 1GB

而这仅仅是看上去比较合理的模型。有些模型,比如 T5,可能会超过 40GB,不过我承认,自己没有遇到过太多团队大规模地部署这种规模的模型。

适用于现代机器学习需求的 serverless 平台需要能部署大型的模型,但是 Lambda 做不到这一点。Lambda 限制部署包的大小为未压缩的 250MB,并将函数限制到了 30008 MB 的内存。如果你想运行任何一种最先进的语言模型,Lambda 都不是合适的可选方案。

2为进行模型处理,需要 GPU/ASIC 的支持

随着模型变得越来越大,它们的资源需求也会随之增加。对我们前文所讨论的一些大模型来说,使用 GPU 推理是唯一能以接近实时延迟的速度处理它们的方式。

类似的,像 Inferentia 和 TPU 这样的 ASIC 在某些情况下正在改变模型处理的经济效益,并且随着它们的不断成熟,有潜力在更大的范围实现这一点。即使是相对比较年轻的方案,但是我们已经对某些模型的性能进行了基准测试,使用 Inferentia 的效率能提高一个数量级。

在过去,GPU/ASIC 推理被认为是相对小众的场景,但是它正在越来越多地成为机器学习工程的标准。令人遗憾的是,Lambda 并不支持它。

对大量的 Cortex 用户来说,仅凭这一点就让 Lambda 失去了将模型部署到生产环境的机会。

3Lambda 处理模型的效率太低

Lambda 实例能够服务于连续的请求,但不能处理并发的请求。在处理模型的时候,这是一个大问题。

推理是一项计算成本高昂的任务,通常伴随大量的延迟(因此经常需要 GPU/ASIC)。为了防止推理成本的飙升,很重要的一点就是在分配计算资源的时候,要尽可能保持高效,同时不能对延迟产生负面影响。

在 Cortex 中,我们实现这一点的方式是提供预测前和预测后的钩子,它们可以异步执行代码。通常来讲,当一些 IO 请求(比如从数据库中调用用户信息、写入日志等)与推理函数相连接的时候,就会用到它。

这些异步钩子提供的优势在于,它允许我们在预测生成后立即释放推理所需的资源,而不必等到响应发送之后。

然而,在 Lambda 中,这是不可能实现的。

因此,如果使用 Lambda 处理模型的话,很可能会因为每个实例上闲置的资源浪费而导致过度扩展。

4机器学习需要一个专门的 serverless 平台

Serverless 架构天然适合模型部署。但问题在于,我们在适用于 MLOps 的任何场景中都会遇到的问题是,机器学习的需求非常具体,使得流行的 DevOps 工具(如 Lambda)并不适用。

我们构建 Cortex 的部分使命就是构建一个平台,提供我们在 Lambda 中喜爱的易用性,同时解决 ML 基础设施的具体挑战。

原文链接:

https://www.cortex.dev/post/serverless-machine-learning-aws-lambda

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
易梦玲一双金灿灿的大灯,明艳晃眼

易梦玲一双金灿灿的大灯,明艳晃眼

吃瓜党二号头目
2026-02-13 08:13:30
财务自由的感觉是怎样的?网友: 人穷的时候,老想着取悦别人

财务自由的感觉是怎样的?网友: 人穷的时候,老想着取悦别人

另子维爱读史
2026-02-19 22:53:07
"人在做,天在看",人再有本事,也不能做这3件事,会有报应!

"人在做,天在看",人再有本事,也不能做这3件事,会有报应!

金沛的国学笔记
2026-01-30 19:50:45
联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

纪中百大事
2026-02-20 09:20:35
你是啥时候对自家小孩失望的?网友:我要有这儿子,他爱滚哪滚哪

你是啥时候对自家小孩失望的?网友:我要有这儿子,他爱滚哪滚哪

带你感受人间冷暖
2026-02-11 16:00:19
固态电池 比亚迪仰望U9全固态版2026年1月青海首测 技术盈利双突破

固态电池 比亚迪仰望U9全固态版2026年1月青海首测 技术盈利双突破

趣味萌宠的日常
2026-02-20 02:14:34
《飞驰人生3》断崖式第一!春节档破30亿

《飞驰人生3》断崖式第一!春节档破30亿

大象新闻
2026-02-20 08:12:06
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
浙江本轮升温最高飙至28℃!返程天气也来了

浙江本轮升温最高飙至28℃!返程天气也来了

都市快报橙柿互动
2026-02-20 00:36:54
这就是背叛下场,被美欧轮番“吸血”后,如今没有一国愿意帮助它

这就是背叛下场,被美欧轮番“吸血”后,如今没有一国愿意帮助它

近史博览
2026-02-17 01:40:40
欧联淘汰赛附加赛4-1:德甲第4大胜欧冠前冠军,占得先机

欧联淘汰赛附加赛4-1:德甲第4大胜欧冠前冠军,占得先机

俯身冲顶
2026-02-20 07:15:15
苏翊鸣夺金后火速官宣恋情,赛后甜蜜回复花滑运动员朱易:爱你宝贝;教练曾说,苏翊鸣米兰拿坡面障碍金牌前不能谈恋爱

苏翊鸣夺金后火速官宣恋情,赛后甜蜜回复花滑运动员朱易:爱你宝贝;教练曾说,苏翊鸣米兰拿坡面障碍金牌前不能谈恋爱

大象新闻
2026-02-19 13:48:10
杨澜爆料撕下王菲伪装,揭秘谢霆锋拒绝结婚真相

杨澜爆料撕下王菲伪装,揭秘谢霆锋拒绝结婚真相

潘殤旅行浪子
2026-01-03 22:14:17
6-5绝杀!又见赵心童4连鞭逆转,下轮战墨菲时间确定,剑指第6冠

6-5绝杀!又见赵心童4连鞭逆转,下轮战墨菲时间确定,剑指第6冠

球场没跑道
2026-02-19 08:42:23
厕所里丢一把食盐,真的太实用了,一年省下好几百,学会一定试试

厕所里丢一把食盐,真的太实用了,一年省下好几百,学会一定试试

妙招酷
2026-01-18 00:08:23
冲击5金!金牌榜大混战:中国队连夺2冠,亚洲第2,韩媒惨遭打脸

冲击5金!金牌榜大混战:中国队连夺2冠,亚洲第2,韩媒惨遭打脸

观察鉴娱
2026-02-19 13:18:54
1952年郑洞国赴京就任,她嫌弃北京苦寒毅然改嫁富商

1952年郑洞国赴京就任,她嫌弃北京苦寒毅然改嫁富商

磊子讲史
2025-12-29 16:25:39
中方不救美元,游戏已结束,特朗普在空军一号喊话中国,措辞强烈

中方不救美元,游戏已结束,特朗普在空军一号喊话中国,措辞强烈

知鉴明史
2026-02-19 18:37:08
春晚歌舞类收视榜出炉!凤凰传奇第二,成龙第四,第一名都没想到

春晚歌舞类收视榜出炉!凤凰传奇第二,成龙第四,第一名都没想到

观察鉴娱
2026-02-17 16:43:01
你见过最不会点菜的人是什么样子?网友:火锅很清淡啊

你见过最不会点菜的人是什么样子?网友:火锅很清淡啊

夜深爱杂谈
2026-02-19 21:55:22
2026-02-20 10:00:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12066文章数 51756关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

牛弹琴:特朗普开了个前所未有的会 合影美国5人站中心

头条要闻

牛弹琴:特朗普开了个前所未有的会 合影美国5人站中心

体育要闻

宁忠岩4年从第7到摘金,刷新奥运纪录

娱乐要闻

霍启山恋情再添实锤 和娜然同游意大利

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

本地
健康
家居
艺术
教育

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

转头就晕的耳石症,能开车上班吗?

家居要闻

本真栖居 爱暖伴流年

艺术要闻

李白若在世,诺贝尔文学奖会是他的囊中物吗?

教育要闻

圆的直径第2讲,一个视频学会!

无障碍浏览 进入关怀版