网易首页 > 网易号 > 正文 申请入驻

云厂商集体上线DeepSeek,低成本“一键部署”抢企业客户

0
分享至

界面新闻记者 | 肖芳
界面新闻编辑 | 文姝琪

DeepSeek在今年春节期间走红之后,也成为了云计算厂商争夺的重点。

据界面新闻了解,目前已有亚马逊云科技、阿里云、腾讯云、移动云在内的十几家国内外云计算厂商上线了DeepSeek-R1和DeepSeek-V3模型。

实际上,类似的类似的剧情在过去一年中已屡见不鲜,虽然这次的角色身份略有不同,但模型争霸的本质依然没变。在普通用户端,使用新AI很简单,下载APP直接用起来就行了。但在企业端,却并不简单,部署首先需要价格不菲的硬件,其次需要提供稳定的API,再者还需要构建面向用户端的应用并实施托管,更不用说高阶的针对企业私有数据的定制优化了。同时,企业还需要考虑数据和模型的安全问题。

这些问题可以大致归纳为企业部署和使用模型中的工程化问题,具体包括成本、性能、安全以及针对私有数据进行定制优化、不同尺寸的模型和日益增长的各种智能体的复杂调度等。

以DeepSeek为例,其公开的模型V3和R1均有不同的型号。其中,DeepSeek-R1-Distill系列模型参数范围是15亿至700亿,而R1和R1-Zero的参数规模则达到6710亿。一方面,不同参数规模的模型对计算性能的要求不同,企业需要对部署的硬件和软件进行细致的调优,确保模型在实际运行中能够达到最佳的性能;另一方面,企业在应用实践中通常需要平衡“响应速度”与“推理能力”而采用多级模型混合部署模式,还会面临异构计算资源的管理、跨云部署等难题。

在这种情况下,降低企业部署大模型的门槛已经成为云计算厂商获得市场竞争力的又一个关键因素。一位云计算厂商的售前技术人员对界面新闻表示,DeepSeek之后,大模型的迭代速度会加快,云计算厂商想要以更快地速度帮助企业应用性能更好、成本更低的模型,还需要持续降低企业部署大模型的门槛。

低代码、多样化部署成趋势

灵活性和选择多样性企业选择是云平台部署大模型的重要因素之一。在降低企业部署大模型的门槛,云计算厂商依然在灵活性和多样性上进行探索。

在上线DeepSeek-R1和DeepSeek-V3模型之后,阿里云PAI Model Gallery支持了云上一键部署两款模型,无需编写代码即可完成AI模型开发流程。

企业的相关工作人员登陆阿里云PAI控制台,在Model Gallery页面的模型列表中选择想要部署的DeepSeek系列模型,一键部署DeepSeek模型生成服务即可。

目前,DeepSeek-R1支持采用vLLM加速部署,DeepSeek-V3支持vLLM加速部署以及Web应用部署,DeepSeek-R1蒸馏小模型支持采用BladeLLM和vLLM加速部署。简单来说,在不同计算资源和应用场景下,企业都可以更灵活地部署大模型。

同时,阿里云的机器学习平台还为企业提供了自动化的机器学习工具,通过自动搜索模型参数和训练超参数的最优组合、低代码可视化建模等方式降低了企业部署大模型的技术门槛。

亚马逊云着重探索的方向是助力企业客户进行多样化部署,这是基于其在大模型应用初期的洞察而来的。亚马逊CEO Andy Jassy此前已多次在公开场合表达过其对大模型行业发展的判断:不会有一个模型一统天下。在基于大模型构建应用时,不同的应用场景需要的技术指标也各不相同,延迟、成本、微调能力、知识库协调能力、多模态支持能力等等,都会因场景需求的不同而被取舍。

经过几年的发展,企业对大模型的应用越来越印证了这个判断。以快速响应场景为例,DeepSeek R1的深层思考模式显然不太合适,其生成首个token的用时超过30秒,而Amazon Nova则只需要数百毫秒即可生成响应。而目前的DeepSeek-V3模型是文生文模型,并不支持图形等多模态信息的输入,也不是万能的。

其于这一理念,亚马逊云科技上线了DeepSeek、AI21 Labs、Anthropic和poolside等100多个重点领先厂商的模型,并提供多样化的部署方式。比如,在DeepSeek的部署上,亚马逊云科技提供了4种方式,既可以满足一部分企业客户希望通过API快速集成预训练模型的需求,也可以满足另一部分企业客户追求高级定制或者性价比的需求。

从整体的趋势上看,降低模型训练和部署门槛,使企业无需深厚AI经验即可调用大模型,是各家云计算厂商目前都在做的事。

模型蒸馏等AI工具变得越来越重要

DeepSeek-R1-Distill通过蒸馏优化,在推理速度、计算成本、部署灵活性方面具有明显优势,它更适合需要低成本部署大模型的场景。

在DeepSeek-R1-Distill发布之前,亚马逊云科技还在Amazon Bedrock中推出模型蒸馏功能,帮助企业进一步降低大模型的使用成本。根据亚马逊云科技CEO马特・加曼(Matt Garman)在演讲中透露的信息,经过蒸馏的模型相比被蒸馏的模型,运行速度能够快500%,成本还能降低75%。

在上述云计算厂商售前技术人员看来,在DeepSeek走红之后,企业客户通过模型蒸馏降本增效的需求越来越多,模型蒸馏功能对于云计算厂商也越来越重要。

据界面新闻了解,除了亚马逊云科技之外,阿里云、百度云等国内云计算厂商也已支持蒸馏功能。其中,阿里云PAI的模型蒸馏功能支持将大模型的知识迁移到较小的模型中,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求。比如,基于 Qwen2大模型开发的精简语言模型,通过知识蒸馏技术,提升了指令遵循能力,同时保持了较小的参数规模,便于部署和应用。

通过模型蒸馏满足企业客户低成本部署的需求,属于解决大模型落地使用中的工程化问题。如果说基于场景选择合适的模型只是构建应用旅程的第一步,随着构建的深入,解决工程化难题的能力成为能否实现快速创新的关键。

除了模型蒸馏功能之外,云计算厂商在优化效果、减低延迟和成本上还可以通过低延迟优化推理、提示词缓存等功能,大幅提升推理效率。比如,直接返回已缓存的结果比每次都调用大模型计算,推理延迟更短且计算成本更低。

在企业落地大模型的过程中,还有一些需求推动着云计算厂商在更多工程化问题上进行创新,包括基于企业自有数据的定制优化、AI安全和审查以及实现复杂功能的多智能体等。

从实践来看,云计算厂商也在通过降低投入成本和技术门槛的方式来满足企业客户的这些需求。其中,亚马逊云科技把AI工具都集成在了Amazon Bedrock平台上,通过更便于操作的方式让企业经济实用地解决提取自由数据、提升回答问题准确性等问题。

马特・加曼(Matt Garman)在2024 re:Invent上分享亚马逊在部署大模型时的几个关键洞察时,特别强调了计算成本的问题。在他看来,随着生成式AI应用规模的扩大,计算成本变得至关重要,人们非常渴望获得更高的性价比。

这也是驱动云计算厂商在大模型部署上持续创新的关键因素。可以预见,未来,云计算厂商还进一步结合AI硬件加速和自动化优化,推动企业客户使用上更快、更低成本的大模型推理服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卡塞米罗再次钦点一人接班,曼联买吗?官网更新名单证实后腰急缺

卡塞米罗再次钦点一人接班,曼联买吗?官网更新名单证实后腰急缺

罗米的曼联博客
2026-07-02 11:52:14
美国大满贯战报,张本智和横扫,小莫逆转,温瑞博遭遇魔鬼赛程

美国大满贯战报,张本智和横扫,小莫逆转,温瑞博遭遇魔鬼赛程

南海浪花
2026-07-02 06:48:57
日本大模型要超过中美?“河豚AI”干翻GPT-5.5比肩Fable5,到底隐藏着什么秘密?

日本大模型要超过中美?“河豚AI”干翻GPT-5.5比肩Fable5,到底隐藏着什么秘密?

PM熊叔
2026-07-01 07:09:37
扎心了!“我生君未富”,一博主举出大厂大量现实案例,评论沸腾

扎心了!“我生君未富”,一博主举出大厂大量现实案例,评论沸腾

火山詩话
2026-06-30 05:52:05
史上唯一被灭绝的民族,因过于凶残被各族联合剿杀,名字很耳熟!

史上唯一被灭绝的民族,因过于凶残被各族联合剿杀,名字很耳熟!

小莜读史
2026-06-24 13:27:56
赖清德称“近期中国海上行动,是假借执法之名,遂行扩张之实”,国台办:民进党当局已沦为外部势力侵害中华民族整体利益的帮凶,必遭唾弃

赖清德称“近期中国海上行动,是假借执法之名,遂行扩张之实”,国台办:民进党当局已沦为外部势力侵害中华民族整体利益的帮凶,必遭唾弃

政知新媒体
2026-07-02 11:03:13
记者:津门虎续约的球员不以保级为前提,表态愿倾尽全力

记者:津门虎续约的球员不以保级为前提,表态愿倾尽全力

懂球帝
2026-07-02 11:26:20
网传失业已蔓延至演艺圈,明星集体失业,包括流量明星无戏可拍…

网传失业已蔓延至演艺圈,明星集体失业,包括流量明星无戏可拍…

慧翔百科
2026-07-01 11:34:31
《问心2》最让人心疼的角色出现了!方筱然的付出,真不值得

《问心2》最让人心疼的角色出现了!方筱然的付出,真不值得

手工制作阿歼
2026-07-02 13:45:26
男子导航搜“移动营业厅”到店却无法补卡,经查系山寨店,自营、合作、山寨如何区分?

男子导航搜“移动营业厅”到店却无法补卡,经查系山寨店,自营、合作、山寨如何区分?

潇湘晨报
2026-07-02 11:56:13
法尔克:奥利塞目前情况对拜仁有点危险,他近期不太可能续约

法尔克:奥利塞目前情况对拜仁有点危险,他近期不太可能续约

懂球帝
2026-07-02 01:40:07
镰田大地:除非足球成为日本的国球,否则很难拿下世界杯冠军

镰田大地:除非足球成为日本的国球,否则很难拿下世界杯冠军

懂球帝
2026-07-01 16:20:23
凯恩高情商回复与梅西姆巴佩竞争金靴!亨利称赞:他技术太出色了

凯恩高情商回复与梅西姆巴佩竞争金靴!亨利称赞:他技术太出色了

听我说球
2026-07-02 07:51:42
“我生了4个孩子,凭什么说我可怜?”宝妈发言,面相真的权威!

“我生了4个孩子,凭什么说我可怜?”宝妈发言,面相真的权威!

熙熙说教
2026-06-30 19:27:15
俄国命运攸关,中国作壁上观?为何俄罗斯被动,中国却不两肋插刀

俄国命运攸关,中国作壁上观?为何俄罗斯被动,中国却不两肋插刀

静夜史君
2026-07-02 03:00:07
民主刚果门将:我们和英格兰队差距不大,没能晋级确实很难受

民主刚果门将:我们和英格兰队差距不大,没能晋级确实很难受

懂球帝
2026-07-02 03:48:08
余承东喊“地球最强悍”、雷军“最好看最好开”、李想“性能最强”!车企大佬都“无视”广告法?

余承东喊“地球最强悍”、雷军“最好看最好开”、李想“性能最强”!车企大佬都“无视”广告法?

大厂财经社
2026-07-02 04:00:10
难以置信,北京协和证实:40岁后男性最优运动,并非跑步撸铁

难以置信,北京协和证实:40岁后男性最优运动,并非跑步撸铁

华庭讲美食
2026-06-21 15:26:10
CCTV5直播西班牙VS奥地利,葡萄牙VS克罗地亚,谁能进世界杯16强

CCTV5直播西班牙VS奥地利,葡萄牙VS克罗地亚,谁能进世界杯16强

体育大学僧
2026-07-02 09:54:34
鲁迪·加西亚戏称:如果我们2-0领先,记得提醒我不要全力死守

鲁迪·加西亚戏称:如果我们2-0领先,记得提醒我不要全力死守

砚底沉香
2026-07-02 08:00:20
2026-07-02 14:32:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1119630文章数 1336549关注度
往期回顾 全部

科技要闻

奥特曼的新算盘:给白宫5%股权 换政策绿灯

头条要闻

媒体:凯恩不说话只一味进球 拯救整个欧洲足球的颜面

头条要闻

媒体:凯恩不说话只一味进球 拯救整个欧洲足球的颜面

体育要闻

世界杯硬核球迷,把自己变成了雕像

娱乐要闻

霍震霆回应霍启山娜然结婚传闻

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

比亚迪26款海鸥,不到7万配激光雷达,官方还包赔?

态度原创

数码
旅游
游戏
房产
军事航空

数码要闻

红魔游戏平板5 PRO评测:RGB水冷灯效 把旗舰游戏体验揣进口袋

旅游要闻

漫步成都高新区,邂逅电影级浪漫

《猫壳机动队》Q4开启抢测 定制机甲战斗自走棋

房产要闻

海南楼市新政:公积金最高可贷192万!

军事要闻

万斯:美伊间接会谈进展顺利

无障碍浏览 进入关怀版