网易首页 > 网易号 > 正文 申请入驻

DeepSeek-V4首发即支持,ZStack AIOS 私有化部署即刻可用

0
分享至

在今天这个重要的日子,我们很高兴地宣布——ZStack AIOS 已率先完成 DeepSeek-V4 系列大模型的私有化部署全面适配,并向企业用户开放体验申请。

在此,云轴科技ZStack 也向 DeepSeek 团队致以诚挚祝贺!DeepSeek-V4 的发布,是中国开源大模型在效率与能力双重维度上的又一次重大突破,我们致敬这份持续推动底层创新的坚持。

DeepSeek-V4:效率与能力的双重跃升

DeepSeek-V4 系列包括DeepSeek-V4-Pro(1.6T 总参数 / 49B 激活)DeepSeek-V4-Flash(284B 总参数 / 13B 激活)。该系列采用CSA + HCA 混合注意力架构,结合 MoE 稀疏激活与 Muon 优化器,首次将原生上下文窗口扩展至100 万 token,并在超长文本场景下实现惊人的效率跃升:

  • 在 1M token 长度下,V4-Pro 的单 token 推理 FLOPs 降至前代 V3.2 的27%,KV Cache 压缩至10%
  • V4-Flash 更进一步,单 token FLOPs 仅10%,KV Cache 仅7%
  • 在代码生成、数学推理、Agent 任务执行与长文本理解等基准测试中,V4 系列达到当前开源大模型的最前列

对整个开源大模型行业来说,DeepSeek-V4的发布可谓是众望所归,单看参数对比已经能够感受到DeepSeek在这一年的厚积薄发,中国科技行业的进步可谓是日新月异,我们也希望用自己的努力,助推这么优秀的大模型能普惠到更多用户。

AIOS 率先完成私有化适配,全面支持国产化算力

ZStack AIOS现已全面支持 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 在自有数据中心的私有化部署。我们特别完成了对国产 AI 芯片的深度适配,确保客户基于国产化算力底座即可运行世界顶尖大模型,实现从芯片、云平台到模型层的全链路自主可控

数据不出域,模型不联网。 训练与推理全程处于企业本地安全环境,满足金融、政务、能源、医疗等关键行业的合规与信创要求。

ZStack AIOS 三层架构为 V4 提供原生企业级支撑:

  • 算力层:异构 GPU 统一调度,支持昇腾、NVIDIA 等多品牌混合部署,1% 粒度 GPU 细分与 95% 直通性能,充分释放 MoE 架构的并行效率
  • 模型层:一键部署 V4 系列模型,针对百万级长上下文优化存储网络与推理流水线,内置RAG与知识库能力,支撑企业快速构建内部 AI 应用
  • 运维层:多租户隔离、弹性容错、敏感数据检测与跨平台计量计费,满足集团级 AI 治理与合规审计要求
小规模起步,生产级扩展

ZStack AIOS 最低 2 个节点 即可启动完整私有 AI 平台能力。已在运行ZStack Cloud、ZStack HCI 的客户,可直接叠加 AIOS,无需推倒重来。

DeepSeek-V4 系列私有化部署验证已完成,现向企业用户开放测试体验申请。我们的工程师团队将提供从算力规划、模型部署到应用落地的全栈技术支持。

下面是完整的部署流程,从下载到调用,最快几分钟即可完成。

三步上手:以 DeepSeek-V4-Flash 为例

DeepSeek-V4-Flash 每次推理仅需激活 13B 参数,推理效率较高,是在有限 GPU 资源下验证 V4 系列能力的合适起点。以下演示如何在 ZStack AIOS 上完成完整部署。

Step 1:下载模型

登录 ZStack AIOS 控制台,进入模型仓库页面,点击添加自定义模型

在 ModelScope 上找到 DeepSeek-V4-Flash 的 Model ID并填入,点击下载,系统将自动根据 Model ID 拉取模型文件至平台模型仓库。下载过程中可在任务列表实时查看进度。





Step 2:部署推理服务

模型下载完成后,点击创建推理服务,进入推理服务配置页面。

根据实际资源情况配置 GPU 节点、显存分配与并发上限,确认后点击提交。系统自动完成推理框架初始化与服务启动,状态变为运行中即部署成功。

V4-Flash 采用 FP4+FP8 混合精度部署,推荐最低显存配置为 H20 (141GB)× 2 或等效规格。





Step 3:在线体验与接入

服务启动后,进入体验界面,即可直接与模型对话,验证服务是否正常运行。



如需将模型能力接入业务系统,ZStack AIOS 支持通过Dify、FastGPT 等应用平台进行调用,适合快速搭建面向实际业务的 AI 应用。

开源模型的每一步,我们都在

从 DeepSeek-R1 到 DeepSeek-V4,开源模型的进化速度超出了大多数人的预期。ZStack AIOS 持续跟进主流开源大模型的最新进展,致力于在每一次模型能力跃升的第一时间,为企业打通从"开源发布"到"私有可用"的最后一步,为企业用户提供安全可控、开箱即用的私有化 AI 推理能力,帮助企业在数据不出域的前提下,快速将最新开源模型能力转化为实际生产力。

新模型不应该等。

如需了解更多部署细节或获取技术支持,欢迎联系 ZStack 团队或访问官方文档。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李诗沣汤杯状态堪忧!韩国男队被丹麦队暴揍!

李诗沣汤杯状态堪忧!韩国男队被丹麦队暴揍!

杨晨大神
2026-04-25 12:14:01
雅迪电动车集体锁死:智能系统的代价

雅迪电动车集体锁死:智能系统的代价

算力游侠
2026-04-23 15:12:24
马刺榜眼轰27+10逆转开拓者!杨瀚森1板,阿夫迪亚15投12铁太辣眼

马刺榜眼轰27+10逆转开拓者!杨瀚森1板,阿夫迪亚15投12铁太辣眼

你的篮球频道
2026-04-25 13:23:48
乌度卡眼神涣散复盘失利!无法理解神奇失误送好局 美记称该解雇

乌度卡眼神涣散复盘失利!无法理解神奇失误送好局 美记称该解雇

颜小白的篮球梦
2026-04-25 12:07:30
火箭绝望的并非出局而是以下三件事!杜兰特被孤立,乌度卡留队

火箭绝望的并非出局而是以下三件事!杜兰特被孤立,乌度卡留队

去山野间追风
2026-04-25 12:12:33
快讯!不等了,菲律宾喊话中国了!

快讯!不等了,菲律宾喊话中国了!

达文西看世界
2026-04-25 09:47:33
拒逆转!布朗25+7,马克西31+6,塔图姆立大功,季后赛走势改变

拒逆转!布朗25+7,马克西31+6,塔图姆立大功,季后赛走势改变

篮球大视野
2026-04-25 09:58:52
58岁江珊差点认不出,膀大腰圆,身材壮硕,满头白发太真实

58岁江珊差点认不出,膀大腰圆,身材壮硕,满头白发太真实

林轻吟
2026-04-25 07:44:35
总部人去楼空!上千家供应商被欠4亿货款,这场骗局精心设计仅7天

总部人去楼空!上千家供应商被欠4亿货款,这场骗局精心设计仅7天

小祁谈历史
2026-04-20 22:09:33
2026年,如果你的家庭存款突破100万,会发现一个惊人的真相!

2026年,如果你的家庭存款突破100万,会发现一个惊人的真相!

蓝色海边
2026-04-24 17:11:02
只觉得Pocket 4拍人好看,是对大疆最大的误解

只觉得Pocket 4拍人好看,是对大疆最大的误解

差评XPIN
2026-04-24 13:28:35
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
污染源找到,负责人被处理!但河北地下水变红的关键问题还未解决

污染源找到,负责人被处理!但河北地下水变红的关键问题还未解决

社会日日鲜
2026-04-24 07:10:17
斯诺克世锦赛:丁俊晖被罚9分逆转失败!赵心童脱险,追到3-3!

斯诺克世锦赛:丁俊晖被罚9分逆转失败!赵心童脱险,追到3-3!

刘姚尧的文字城堡
2026-04-24 23:50:42
人类灭绝大局已定?科学家算出人类灭绝日期,我们能侥幸存活吗?

人类灭绝大局已定?科学家算出人类灭绝日期,我们能侥幸存活吗?

丹妮观
2026-04-25 10:01:55
投入千万打水漂,张庆鹏下课?公开表态,或回归山东,接替邱彪?

投入千万打水漂,张庆鹏下课?公开表态,或回归山东,接替邱彪?

萌兰聊个球
2026-04-25 10:22:55
复旦解剖516名糖尿病逝者,意外发现:得糖尿病的人,大多有5共性

复旦解剖516名糖尿病逝者,意外发现:得糖尿病的人,大多有5共性

坠入二次元的海洋
2026-04-25 12:36:41
连续6个跌停板!股民:一切都结束了!

连续6个跌停板!股民:一切都结束了!

数据挖掘分析
2026-04-25 14:41:44
突然被带走调查:牢记“三不说、四不签”,不吃亏、不踩坑

突然被带走调查:牢记“三不说、四不签”,不吃亏、不踩坑

匹夫来搞笑
2026-04-25 03:19:47
罕见!"双胞胎兄弟残留在咽喉",有脂肪有软骨!6岁男孩夜间打鼾、呼吸困难,上海医生一查惊了

罕见!"双胞胎兄弟残留在咽喉",有脂肪有软骨!6岁男孩夜间打鼾、呼吸困难,上海医生一查惊了

新民晚报
2026-04-25 13:20:00
2026-04-25 15:20:49
ZStack云计算
ZStack云计算
产品化的云基础软件提供商,位居IDC云系统软件市场报告TOP5,独立云厂商第一
702文章数 31关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

"蚊子大军"来袭北极圈也被攻破 各地疾控发出重要预警

头条要闻

"蚊子大军"来袭北极圈也被攻破 各地疾控发出重要预警

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

家居
游戏
教育
健康
亲子

家居要闻

自然肌理 温润美学

PS5实体版仅需180元!这款索尼3A级大作真心不能错过

教育要闻

第11课-Discomfort and difficulties 海外遇到困难怎么办?

干细胞如何让烧烫伤皮肤"再生"?

亲子要闻

当54岁的日本老公有了女儿,每天捧在手心都怕要化了!

无障碍浏览 进入关怀版