网易首页 > 网易号 > 正文 申请入驻

云厂商集体上线DeepSeek,低成本“一键部署”抢企业客户

0
分享至

界面新闻记者 | 肖芳
界面新闻编辑 | 文姝琪

DeepSeek在今年春节期间走红之后,也成为了云计算厂商争夺的重点。

据界面新闻了解,目前已有亚马逊云科技、阿里云、腾讯云、移动云在内的十几家国内外云计算厂商上线了DeepSeek-R1和DeepSeek-V3模型。

实际上,类似的类似的剧情在过去一年中已屡见不鲜,虽然这次的角色身份略有不同,但模型争霸的本质依然没变。在普通用户端,使用新AI很简单,下载APP直接用起来就行了。但在企业端,却并不简单,部署首先需要价格不菲的硬件,其次需要提供稳定的API,再者还需要构建面向用户端的应用并实施托管,更不用说高阶的针对企业私有数据的定制优化了。同时,企业还需要考虑数据和模型的安全问题。

这些问题可以大致归纳为企业部署和使用模型中的工程化问题,具体包括成本、性能、安全以及针对私有数据进行定制优化、不同尺寸的模型和日益增长的各种智能体的复杂调度等。

以DeepSeek为例,其公开的模型V3和R1均有不同的型号。其中,DeepSeek-R1-Distill系列模型参数范围是15亿至700亿,而R1和R1-Zero的参数规模则达到6710亿。一方面,不同参数规模的模型对计算性能的要求不同,企业需要对部署的硬件和软件进行细致的调优,确保模型在实际运行中能够达到最佳的性能;另一方面,企业在应用实践中通常需要平衡“响应速度”与“推理能力”而采用多级模型混合部署模式,还会面临异构计算资源的管理、跨云部署等难题。

在这种情况下,降低企业部署大模型的门槛已经成为云计算厂商获得市场竞争力的又一个关键因素。一位云计算厂商的售前技术人员对界面新闻表示,DeepSeek之后,大模型的迭代速度会加快,云计算厂商想要以更快地速度帮助企业应用性能更好、成本更低的模型,还需要持续降低企业部署大模型的门槛。

低代码、多样化部署成趋势

灵活性和选择多样性企业选择是云平台部署大模型的重要因素之一。在降低企业部署大模型的门槛,云计算厂商依然在灵活性和多样性上进行探索。

在上线DeepSeek-R1和DeepSeek-V3模型之后,阿里云PAI Model Gallery支持了云上一键部署两款模型,无需编写代码即可完成AI模型开发流程。

企业的相关工作人员登陆阿里云PAI控制台,在Model Gallery页面的模型列表中选择想要部署的DeepSeek系列模型,一键部署DeepSeek模型生成服务即可。

目前,DeepSeek-R1支持采用vLLM加速部署,DeepSeek-V3支持vLLM加速部署以及Web应用部署,DeepSeek-R1蒸馏小模型支持采用BladeLLM和vLLM加速部署。简单来说,在不同计算资源和应用场景下,企业都可以更灵活地部署大模型。

同时,阿里云的机器学习平台还为企业提供了自动化的机器学习工具,通过自动搜索模型参数和训练超参数的最优组合、低代码可视化建模等方式降低了企业部署大模型的技术门槛。

亚马逊云着重探索的方向是助力企业客户进行多样化部署,这是基于其在大模型应用初期的洞察而来的。亚马逊CEO Andy Jassy此前已多次在公开场合表达过其对大模型行业发展的判断:不会有一个模型一统天下。在基于大模型构建应用时,不同的应用场景需要的技术指标也各不相同,延迟、成本、微调能力、知识库协调能力、多模态支持能力等等,都会因场景需求的不同而被取舍。

经过几年的发展,企业对大模型的应用越来越印证了这个判断。以快速响应场景为例,DeepSeek R1的深层思考模式显然不太合适,其生成首个token的用时超过30秒,而Amazon Nova则只需要数百毫秒即可生成响应。而目前的DeepSeek-V3模型是文生文模型,并不支持图形等多模态信息的输入,也不是万能的。

其于这一理念,亚马逊云科技上线了DeepSeek、AI21 Labs、Anthropic和poolside等100多个重点领先厂商的模型,并提供多样化的部署方式。比如,在DeepSeek的部署上,亚马逊云科技提供了4种方式,既可以满足一部分企业客户希望通过API快速集成预训练模型的需求,也可以满足另一部分企业客户追求高级定制或者性价比的需求。

从整体的趋势上看,降低模型训练和部署门槛,使企业无需深厚AI经验即可调用大模型,是各家云计算厂商目前都在做的事。

模型蒸馏等AI工具变得越来越重要

DeepSeek-R1-Distill通过蒸馏优化,在推理速度、计算成本、部署灵活性方面具有明显优势,它更适合需要低成本部署大模型的场景。

在DeepSeek-R1-Distill发布之前,亚马逊云科技还在Amazon Bedrock中推出模型蒸馏功能,帮助企业进一步降低大模型的使用成本。根据亚马逊云科技CEO马特・加曼(Matt Garman)在演讲中透露的信息,经过蒸馏的模型相比被蒸馏的模型,运行速度能够快500%,成本还能降低75%。

在上述云计算厂商售前技术人员看来,在DeepSeek走红之后,企业客户通过模型蒸馏降本增效的需求越来越多,模型蒸馏功能对于云计算厂商也越来越重要。

据界面新闻了解,除了亚马逊云科技之外,阿里云、百度云等国内云计算厂商也已支持蒸馏功能。其中,阿里云PAI的模型蒸馏功能支持将大模型的知识迁移到较小的模型中,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求。比如,基于 Qwen2大模型开发的精简语言模型,通过知识蒸馏技术,提升了指令遵循能力,同时保持了较小的参数规模,便于部署和应用。

通过模型蒸馏满足企业客户低成本部署的需求,属于解决大模型落地使用中的工程化问题。如果说基于场景选择合适的模型只是构建应用旅程的第一步,随着构建的深入,解决工程化难题的能力成为能否实现快速创新的关键。

除了模型蒸馏功能之外,云计算厂商在优化效果、减低延迟和成本上还可以通过低延迟优化推理、提示词缓存等功能,大幅提升推理效率。比如,直接返回已缓存的结果比每次都调用大模型计算,推理延迟更短且计算成本更低。

在企业落地大模型的过程中,还有一些需求推动着云计算厂商在更多工程化问题上进行创新,包括基于企业自有数据的定制优化、AI安全和审查以及实现复杂功能的多智能体等。

从实践来看,云计算厂商也在通过降低投入成本和技术门槛的方式来满足企业客户的这些需求。其中,亚马逊云科技把AI工具都集成在了Amazon Bedrock平台上,通过更便于操作的方式让企业经济实用地解决提取自由数据、提升回答问题准确性等问题。

马特・加曼(Matt Garman)在2024 re:Invent上分享亚马逊在部署大模型时的几个关键洞察时,特别强调了计算成本的问题。在他看来,随着生成式AI应用规模的扩大,计算成本变得至关重要,人们非常渴望获得更高的性价比。

这也是驱动云计算厂商在大模型部署上持续创新的关键因素。可以预见,未来,云计算厂商还进一步结合AI硬件加速和自动化优化,推动企业客户使用上更快、更低成本的大模型推理服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

薇说体育
2026-03-26 10:48:02
以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

星辰大海路上的种花家
2026-03-25 13:09:41
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
周杰伦新专辑引吐槽声一片,还牵扯两段绯闻,歌不行只剩炒作?

周杰伦新专辑引吐槽声一片,还牵扯两段绯闻,歌不行只剩炒作?

乐天闲聊
2026-03-26 10:48:17
怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

南风不及你温柔
2026-03-26 14:07:38
毛主席铅笔字揭秘!这7个字震撼人心,真相让人泪目!

毛主席铅笔字揭秘!这7个字震撼人心,真相让人泪目!

书画相约
2026-03-24 08:35:27
雷军晒成绩:小米SU7、YU7双双第一!

雷军晒成绩:小米SU7、YU7双双第一!

快科技
2026-03-26 13:09:04
张雪峰经典名言 100 条(完整版)

张雪峰经典名言 100 条(完整版)

新浪财经
2026-03-25 06:17:25
湖人108-110送大礼,西部首轮对阵浮现,詹皇将遇最爱对手

湖人108-110送大礼,西部首轮对阵浮现,詹皇将遇最爱对手

铿锵格斗
2026-03-26 14:33:21
小伙领证5小时后失踪,新婚妻子继承全部遗产,真相让人不寒而栗

小伙领证5小时后失踪,新婚妻子继承全部遗产,真相让人不寒而栗

碎碎纪实
2026-03-26 11:07:33
中国第三任国家主席,墓碑上不留姓名,碑文仅有二十四个字!

中国第三任国家主席,墓碑上不留姓名,碑文仅有二十四个字!

年代回忆
2026-03-24 20:23:00
全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

Ck的蜜糖
2026-03-26 12:30:25
为啥说小孩子的话总是口无遮拦?网友:妈妈坐在爸爸身上拉屎!

为啥说小孩子的话总是口无遮拦?网友:妈妈坐在爸爸身上拉屎!

三年的老核桃
2026-03-18 07:20:03
张雪峰走了,向太说了句“避谶”,大家突然都沉默了。

张雪峰走了,向太说了句“避谶”,大家突然都沉默了。

天光破云来
2026-03-26 14:57:24
马英九亲自下场后,蓝营大佬集体回应,台媒体人:罪在马英九

马英九亲自下场后,蓝营大佬集体回应,台媒体人:罪在马英九

DS北风
2026-03-25 18:50:17
惊天逆转!伊朗,吹响进攻号角!

惊天逆转!伊朗,吹响进攻号角!

大嘴说天下
2026-03-23 21:32:12
对越反击战期间,越南女兵的诡计有多离谱?敢将自己脱得赤条条的

对越反击战期间,越南女兵的诡计有多离谱?敢将自己脱得赤条条的

抽象派大师
2026-03-26 10:58:00
特朗普故技重施!美国突然大规模增兵,第二个马杜罗即将到来?

特朗普故技重施!美国突然大规模增兵,第二个马杜罗即将到来?

梦在深巷aqa
2026-03-26 13:52:58
48岁赵薇“女儿”因长得太好看,被全网“禁止整容”,如今17岁变化大到不敢认!

48岁赵薇“女儿”因长得太好看,被全网“禁止整容”,如今17岁变化大到不敢认!

背包旅行
2026-03-24 17:09:33
为了给前NBA状元霍华德生孩子,篮球宝贝壮壮究竟付出了多大代价

为了给前NBA状元霍华德生孩子,篮球宝贝壮壮究竟付出了多大代价

罗氏八卦
2026-03-10 18:00:03
2026-03-26 15:32:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1044108文章数 1332017关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
教育
时尚
亲子
军事航空

数码要闻

配件制造商清单泄露:2026款iPad将搭载A18芯片

教育要闻

高考地理中的花海经济

2026年了,最好看的还是“这件针织”!

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版