网易首页 > 网易号 > 正文 申请入驻

DeepSeek,又有大消息!

0
分享至

DeepSeek又有大消息。

3月1日,DeepSeek发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。

最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。

根据DeepSeek官方披露,DeepSeek V3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch 传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。

另外,由于白天的服务负荷高,晚上的服务负荷低,因此DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。

在最近24小时(2025年2月27日12:00至28日12:00)的统计周期内:GPU租赁成本按2美元/小时计算,日均成本为87072美元;若所有输入/输出token按R1定价(输入1元/百万token、输出16元/百万token)计算,单日收入可达562027美元,成本利润率高达545%。

不过,DeepSeek官方坦言,实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

DeepSeek的高利润率源于其创新的推理系统设计,核心包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱:专家并行(EP)提升吞吐与响应速度,针对模型稀疏性(每层仅激活8/256个专家),采用EP策略扩展总体批处理规模(batch size),确保每个专家获得足够的计算负载,显著提升GPU利用率;部署单元动态调整(如Prefill阶段4节点、Decode阶段18节点),平衡资源分配与任务需求。

计算与通信重叠隐藏延迟,Prefill阶段通过“双batch交错”实现计算与通信并行,Decode阶段拆分attention为多级流水线,最大限度掩盖通信开销。

全局负载均衡避免资源浪费,针对不同并行模式(数据并行DP、专家并行EP)设计动态负载均衡器,确保各GPU的计算量、通信量及KVCache占用均衡,避免节点空转。

简单来说,EP就像是“多人协作”,把模型中的“专家”分散到多张GPU上进行计算,大幅提升Batch Size,榨干GPU算力,同时专家分散,降低内存压力,更快响应。

DeepSeek在工程层面进一步压缩成本。昼夜资源调配:白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练,最大化硬件利用率;缓存命中率达56.3%:通过KVCache硬盘缓存减少重复计算,在输入token中,有3420亿个(56.3%)直接命中缓存,大幅降低算力消耗。

综合自券商中国

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终于,Claude Code 封号的原因被曝光了!竟然针对中国用户,植入隐形代码?!

终于,Claude Code 封号的原因被曝光了!竟然针对中国用户,植入隐形代码?!

程序员鱼皮
2026-07-01 14:22:53
400年沉船惊现22磅银条:近30年首次发现,估值10万美元

400年沉船惊现22磅银条:近30年首次发现,估值10万美元

我是一个粉刷匠2
2026-07-01 02:48:41
重庆荒山上发现大量废弃电车,整整齐齐停满山坡,到底是什么原因

重庆荒山上发现大量废弃电车,整整齐齐停满山坡,到底是什么原因

混沌录
2026-07-01 18:31:18
杨紫庆功宴一张照片上了热搜!

杨紫庆功宴一张照片上了热搜!

最美的笔触
2026-07-02 07:07:34
立刻删掉自选股蹭概念!长鑫10个拿实单硬核厂商

立刻删掉自选股蹭概念!长鑫10个拿实单硬核厂商

流苏晚晴
2026-07-01 18:08:14
字节要拿中层“开刀”了

字节要拿中层“开刀”了

蚂蚁大喇叭
2026-07-01 17:16:10
头号帮手已被中国镇住!日高层暴怒,送中国5个字:绝不能容许!

头号帮手已被中国镇住!日高层暴怒,送中国5个字:绝不能容许!

南风不及你温柔
2026-07-02 08:36:42
为什么老片重映难获年轻人共鸣?

为什么老片重映难获年轻人共鸣?

小眼睛小世界
2026-07-02 06:37:02
“臭名昭著”的390所大学,毕业证=废纸!

“臭名昭著”的390所大学,毕业证=废纸!

谭老师地理大课堂
2026-06-30 01:35:05
✨庆功宴乱象频发!150件小将签名藏品失窃!女嘉宾拿走7瓶茅台

✨庆功宴乱象频发!150件小将签名藏品失窃!女嘉宾拿走7瓶茅台

记录生活日常阿蜴
2026-07-01 21:24:44
3年5100万!继伦纳德后,又一个快船大将宣告离开

3年5100万!继伦纳德后,又一个快船大将宣告离开

篮球大视野
2026-07-01 21:30:12
何谋保已任甘肃省政府党组成员、省政府办公厅党组书记

何谋保已任甘肃省政府党组成员、省政府办公厅党组书记

澎湃新闻
2026-07-01 22:58:27
更神奇的让二追三!比利时“黄金一代”虽未能兑现天赋,但硕果仅存的几位仍然能打

更神奇的让二追三!比利时“黄金一代”虽未能兑现天赋,但硕果仅存的几位仍然能打

红星新闻
2026-07-02 08:25:01
性质已变!菲军舰军事入侵黄岩岛,中国还要继续克制忍让下去吗?

性质已变!菲军舰军事入侵黄岩岛,中国还要继续克制忍让下去吗?

黑翼天使
2026-07-02 08:13:08
事发上海高速!一辆特斯拉撞护栏后起火,司机瘫软在车前,一路过车主拼命将人拖离燃烧的车辆

事发上海高速!一辆特斯拉撞护栏后起火,司机瘫软在车前,一路过车主拼命将人拖离燃烧的车辆

新民晚报
2026-07-01 20:10:12
心有不满?谢尔基赛后拒绝与法国队主帅德尚握手 豪言要“横扫所有对手”的他4战仅出场55分钟

心有不满?谢尔基赛后拒绝与法国队主帅德尚握手 豪言要“横扫所有对手”的他4战仅出场55分钟

红星新闻
2026-07-01 13:38:12
新加坡放弃135平方公里圣诞岛,为何死守0.002平方公里的白礁岛?

新加坡放弃135平方公里圣诞岛,为何死守0.002平方公里的白礁岛?

世界纵横说
2026-06-30 22:09:35
丢脸丢到世界杯!阿森纳水货坑惨英格兰,开场直接送大礼!

丢脸丢到世界杯!阿森纳水货坑惨英格兰,开场直接送大礼!

澜归序
2026-07-02 03:08:03
周涛看彭冠英眼神太直白,少女藏都藏不住

周涛看彭冠英眼神太直白,少女藏都藏不住

手工制作阿歼
2026-07-02 04:22:14
南极传来两个消息,科学家集体沉默:人类的努力,正在失去意义

南极传来两个消息,科学家集体沉默:人类的努力,正在失去意义

小豫讲故事
2026-06-29 06:00:19
2026-07-02 09:08:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
936542文章数 239319关注度
往期回顾 全部

科技要闻

可灵AI上市前夜,快手想给它融30亿美元

头条要闻

牛弹琴:普京可能都没想到 有一天俄要从印度进口汽油

头条要闻

牛弹琴:普京可能都没想到 有一天俄要从印度进口汽油

体育要闻

世界杯硬核球迷,把自己变成了雕像

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

耐克,继续等待复苏的好消息

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

数码
亲子
本地
手机
公开课

数码要闻

M7芯片首秀:古尔曼称苹果酝酿新入门级MacBook Pro

亲子要闻

趣味游戏

本地新闻

强烈建议,全国高校都向这所大学看齐!

手机要闻

CounterPoint称苹果iPhone Ultra改写2026全球折叠面板供应格局

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版