网易首页 > 网易号 > 正文 申请入驻

国产飞腾 CPU 实现对 DeepSeek 全系列大模型端到端支持

0
分享至

IT之家 2 月 9 日消息,飞腾信息技术有限公司昨日晚发文宣布,旗下腾云 S5000C 和腾锐 D3000 成功实现对 DeepSeek 全系列大模型的端到端支持,覆盖数据中心和终端场景,本地部署的推理效率与国外同类产品架构解决方案相当


据介绍,DeepSeek-V2.5 236B 大模型于2024 年在飞腾腾云 S5000C 平台实现稳定运行。基于飞腾腾云 S5000C 设备搭配 8 块国产 AI 卡,整体性能可达国外平台性能 80% 左右。DeepSeek-V3 和 R1 版本发布后,飞腾技术团队在腾云 S5000C 平台和腾锐 D3000 上对其进行本地部署验证,形成整体解决方案。

数据中心侧,飞腾腾云 S5000C 服务器可与多款 AI 加速卡配合实现 DeepSeek 蒸馏版和全量版部署。飞腾 AI 实验室在单机 8 卡服务器平台已进行蒸馏版 DeepSeek-R1-Distill-Llama-70B 版本测试,推理速度可达 22tokens / s。完整版 DeepSeek R1 671B 模型采用分布式推理框架,基于四机 32 卡 AI 服务器集群运行可部署成功。


用户终端侧,基于飞腾腾锐 D3000 的台式机可以本地部署 DeepSeek-R1 7B 蒸馏版模型,搭配 1 张国产推理卡,实现 AI PC 能力。


IT之家附飞腾腾云 S5000C和飞腾腾锐 D3000 两款 CPU 的主要信息如下:

腾云 S5000C

飞腾腾云 S5000C 拥有 64 核、32 核、16 核 3 种产品形态,兼容 ARMv8 指令集,支持硬件虚拟化,产品支持商业和工业分级,该产品主要面向计算服务器、存储服务器、AI 服务器、高端网安、行业级业务主机服务器系统、大型互联网数据中心等场景。


腾锐 D3000

飞腾腾锐 D3000 集成 8 个飞腾自主研发的新一代高性能处理器核 FTC862,兼容 64 位 ARMv8 指令集并支持 ARM64 和 ARM32 两种执行模式,支持单精度、双精度浮点运算指令和 ASIMD 处理指令,主频达到 2.5GHz,支持硬件虚拟化,支持商业和工业分级。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
农业新质生产力与现代农业体系重构:技术赋能的产业升级路径研究

农业新质生产力与现代农业体系重构:技术赋能的产业升级路径研究

乡村振兴战略研究院
2025-03-22 07:24:42
2025-03-22 07:48:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
277554文章数 606016关注度
往期回顾 全部

数码要闻

苹果首款电脑 Apple-1 再掀拍卖热潮,成交价达 37.5 万美元

头条要闻

93岁男子强奸幼女被判15年未被收押:已无法自主行走

头条要闻

93岁男子强奸幼女被判15年未被收押:已无法自主行走

体育要闻

辞去“铁饭碗”,她成为创造历史的中国女车手

娱乐要闻

曝秦岚和魏大勋秘密同居,两人似夫妻

财经要闻

李嘉诚出售港口 中国反垄断法能管吗

科技要闻

揭秘!这四巨头如何吃掉AI芯片每一分钱?

汽车要闻

智驾升级还支持"隔空开门" 新款问界M9售46.98万起

态度原创

数码
本地
教育
艺术
军事航空

数码要闻

华为Pura X维修配件价格公布:柔性屏组件3019元

本地新闻

用AI唤醒花花世界|锡城春光正当时,一半花开一半诗

教育要闻

校长推门听课,老师用考试应对,这打了谁的脸?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

军事要闻

五角大楼考虑对美军高层机构进行重大裁撤

无障碍浏览 进入关怀版