网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

英伟达杀疯了！DeepSeek V4推理成本狂砍80%

2026-07-02 15:29:51　来源: 侃故事的阿庆

福建举报

0

分享至

快科技7月2日消息，英伟达宣布其Blackwell平台通过全栈推理软件优化，DeepSeek V4模型的单Token成本在一个月内最多降至五分之一。

随着企业从AI试点走向生产型AI工厂，基础设施决策已从芯片规格峰值转向每元、每瓦特及延迟目标内能交付多少有用Token。

英伟达通过三层架构实现Token成本的大幅下降。生产运营层负责分布式服务编排与自动扩缩容，应用加速层通过计算通信重叠和内核融合进行运行时优化，基础设施访问层则直接调用GPU、网络与系统能力。

多项技术叠加后，Blackwell平台单GPU的Token吞吐量最高可提升20倍。这些技术包括分离式服务、基于NVLink的大规模专家并行、NVFP4精度以及多Token预测。

英伟达将单Token成本列为AI总拥有成本的核心指标，Blackwell平台已将其降至行业最低水平。

多家推理服务商已从中获益。Baseten利用TensorRT-LLM开源库在Blackwell上服务DeepSeek V4 Pro，每秒Token输出量提升高达50%。

Cognition借助Dynamo推理框架管理GPU，无需从零构建即可扩展强化学习工作负载。Together AI用TensorRT-LLM帮助Cursor加速从模型优化到生产终端的路径。

开源生态进一步放大了全栈优势。PyTorch等主流框架原生基于CUDA构建，使新研究成果能立即在NVIDIA GPU上运行。

DeepSeek V4发布后，vLLM和SGLang等框架随即为Blackwell提供部署方案，一个月内性能提升高达5倍。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

当Meta开始卖算力

华尔街见闻官方 2026-07-02 11:23:25
6 跟贴 6
具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了

量子位 2026-07-01 17:32:08
0 跟贴 0

Meta下场卖算力，引发新云厂商和AI硬件股集体大跌！算力过剩了？GPU租赁持续涨价

每日经济新闻 2026-07-02 18:00:36
0 跟贴 0

Nvidia都在点赞的LoopWM世界模型

机器之心Pro 2026-06-29 15:21:48
0 跟贴 0
破天荒！DeepSeek V4正式版居然要涨价，而且翻着倍地涨

量子位 2026-06-30 12:07:03
11 跟贴 11

SemiAnalysis创始人：推理或超越石油成全球最大市场，2040年太空数据中心将主导全球算力

华尔街见闻官方 2026-07-01 11:50:20
9 跟贴 9

精打细算的AI时代到来了

钛媒体APP 2026-07-02 10:55:18
2 跟贴 2
我们以为在和不同AI聊天，其实它们越来越像

DeepTech深科技 2026-07-02 18:39:09
0 跟贴 0

ATHENA将影响函数扩展到十亿参数VLA，313×加速筛选高价值数据

机器之心Pro 2026-07-02 18:18:44
0 跟贴 0
满分的「差」，Qwen与复旦等揭示编程智能体奖励设计的结构性困境

机器之心Pro 2026-07-02 18:16:12
0 跟贴 0
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0
硅胶娃娃+AI，优必选就想卖宅男88万

钛媒体APP 2026-07-02 18:30:24
0 跟贴 0
英伟达CEO黄仁勋：Token就是资产、已经成为获利的营收单位

每日经济新闻 2026-06-02 06:05:39
0 跟贴 0
英伟达要开始分云厂商的钱了

华尔街见闻官方 2026-07-02 14:27:28
0 跟贴 0
野村反驳“半导体见顶论”：“史诗级缺口”将至，涨价与盈利上修仍是最大催化剂

华尔街见闻官方 2026-07-01 20:35:22
23 跟贴 23
VCSEL CPO还是硅光？英伟达光互连核心人才的出走ams OSRAM，赛道格局已然生变

华尔街见闻官方 2026-07-02 15:10:28
0 跟贴 0
英伟达机器人团队中国内地开启大规模招聘北京上海深圳三地设置岗位

每日经济新闻 2026-07-01 05:49:14
0 跟贴 0
领先于Transformer！

机器之心Pro 2026-05-06 17:01:48
0 跟贴 0
活力中国调研行｜汽车智驾“大脑”中国自造，从英伟达体系里领先跑出来：“比海外厂商提前很久实现量产”

界面新闻 2026-07-01 16:52:24
0 跟贴 0
英伟达x清华Gamma World迅速登顶抱抱脸多智能体世界模型γ-World

量子位 2026-05-30 20:18:29
0 跟贴 0
黄仁勋：AI时代“孩子学什么专业并不重要”

财联社 2026-05-28 10:54:03
0 跟贴 0
英伟达开源个量子AI

机器之心Pro 2026-04-15 12:05:50
0 跟贴 0
黄仁勋全世界穿皮衣，唯独在中国换上了大花袄

雷科技 2026-01-27 17:19:30
0 跟贴 0
【美股盘前】Meta下场“卖算力”，闪迪跌超4%，美光、西部数据跌3%；美国6月非农今晚发布；马斯克暗示人形机器人或已进入量产准备阶段；光通信板块走低

每日经济新闻 2026-07-02 17:37:09
0 跟贴 0
媒体：凯恩不说话只一味进球拯救整个欧洲足球的颜面

澎湃新闻 2026-07-02 11:58:18
1599 跟贴 1599
泰山景区回应修建滚筒式刀片刺绳隔离铁丝网：与正常游览路线不交叉不重叠

北京日报客户端 2026-07-02 08:55:17
11177 跟贴 11177
媒体：乌军更能打了掌握"有效打法"跟俄打得有来有回

中国新闻周刊 2026-07-01 22:57:06
6409 跟贴 6409
广西17岁少年清晨5点起床拔花生，拔到一半发现错拔别人家的地，发帖求助却被疯狂点赞，当事人：对方没有怪我，还说要请我吃饭

大象新闻 2026-07-01 22:46:58
4412 跟贴 4412
图形推理，复杂的字母能找出规律吗

公考客栈店小二 2026-07-01 18:00:00
0 跟贴 0
美媒罕见承认：中国歼-36急转爬升，攻克无尾布局技术

温柔度 2026-07-02 02:31:39
0 跟贴 0
最多8人无身份开局，这款推理新游有点野

晚星归航2 2026-07-01 09:24:59
0 跟贴 0
英伟达 & 普渡大学用agent闭环实现文生3D

机器之心Pro 2026-05-08 17:39:43
0 跟贴 0
《Deadly Trick》7月13日抢先体验生死推理冒险

3DM游戏 2026-07-01 09:29:10
0 跟贴 0
史上最贵“卖飞”，世嘉给英伟达投了500万后，丢了一万亿

机器之心Pro 2025-12-10 14:33:10
0 跟贴 0
英伟达x清华丨Gamma World迅速登顶抱抱脸日榜第一

量子位 2026-05-30 18:12:31
0 跟贴 0
开了一次就“头晕”？看到机器上的英文单词，他觉得自己被骂了

北青网-北京青年报 2026-06-28 14:48:24
1827 跟贴 1827
涡扇20技术落后一代，为何不采用最新技术？

隐龙天下 2026-07-02 02:30:20
0 跟贴 0
《灰烬之城》PC配置需求引发争议最低要求32G内存

3DM游戏 2026-07-02 11:45:17
5 跟贴 5
7月1日起，江苏最低生活保障标准上调！

环球网 2026-07-02 10:47:00
369 跟贴 369
点球绝杀比利时3-2塞内加尔晋级16强

央视新闻客户端 2026-07-02 06:54:57
1563 跟贴 1563

143分钟一刀未剪！这部动作片杀进20国前十，院线观众亏大了

143分钟一刀未剪！这部动作片杀进20国前十，院线观众亏大了

热搜摘要官

2026-07-02 01:23:00

佛得角总统：佛得角完全有能力1比0击败阿根廷，迎战梅西是我们的“宿命”，奇迹可能发生

佛得角总统：佛得角完全有能力1比0击败阿根廷，迎战梅西是我们的“宿命”，奇迹可能发生

鲁中晨报

2026-07-02 15:14:03

125分钟点球绝杀！世界杯最伟大的反转：罪人变英雄，全队膜拜

125分钟点球绝杀！世界杯最伟大的反转：罪人变英雄，全队膜拜

体坛小李

2026-07-02 09:17:44

富婆龚心如（小甜甜）留给吕良伟的1400亿遗产，被人截胡了？

富婆龚心如（小甜甜）留给吕良伟的1400亿遗产，被人截胡了？

南万说娱26

2026-07-01 09:22:49

中国空调在欧洲卖爆，欧洲空调商预警：打不过中国制造，就改规则

中国空调在欧洲卖爆，欧洲空调商预警：打不过中国制造，就改规则

泠泠说史

2026-07-01 11:31:38

最让蒋介石头痛的军阀：独霸一省14年，连军统电台都敢没收

最让蒋介石头痛的军阀：独霸一省14年，连军统电台都敢没收

微野谈写作

2026-07-01 06:45:05

与美国彻底翻脸，乌克兰九个州要归普京，俄罗斯吃下就不会吐出来

与美国彻底翻脸，乌克兰九个州要归普京，俄罗斯吃下就不会吐出来

流史岁月

2026-07-01 18:40:03

美国朝野痛哭流涕，伊朗战争是美国有史以来第一次割地赔款的战争

美国朝野痛哭流涕，伊朗战争是美国有史以来第一次割地赔款的战争

农夫史记

2026-06-30 20:43:08

日本防卫大臣将要求中国就将防卫研究所列入出口管制名单一事作出解释

日本防卫大臣将要求中国就将防卫研究所列入出口管制名单一事作出解释

俄罗斯卫星通讯社

2026-07-01 16:05:30

下场首发？戈登是首位在世界杯替补登场助攻双响的英格兰球员

下场首发？戈登是首位在世界杯替补登场助攻双响的英格兰球员

懂球帝

2026-07-02 02:44:25

多地医院陆续关停门诊输液大厅，“全民输液”时代正在画上句号

多地医院陆续关停门诊输液大厅，“全民输液”时代正在画上句号

白宸侃片

2026-07-02 09:38:53

一位江苏常州企业女干部，从业34.92年，养老金待遇是什么

一位江苏常州企业女干部，从业34.92年，养老金待遇是什么

今日搞笑分享

2026-07-02 17:20:29

1950 年，四川地主拿出朱德欠条，朱总司令：马上把他接到北京来

1950 年，四川地主拿出朱德欠条，朱总司令：马上把他接到北京来

纪实文录

2025-06-21 14:47:10

网红程序员靠AI写歌2个月赚18万，自曝炒股1年亏130万，本人回应：不要幻想靠做自媒体一夜暴富

网红程序员靠AI写歌2个月赚18万，自曝炒股1年亏130万，本人回应：不要幻想靠做自媒体一夜暴富

大风新闻

2026-07-01 20:00:21

理性看待新疆部分种植大户主动退地：不是种地不赚钱，是回归理性

理性看待新疆部分种植大户主动退地：不是种地不赚钱，是回归理性

爱下厨的阿椅

2026-07-02 06:54:29

特朗普换新专机：太兴奋了，这是波音造过最好的747飞机；该机由卡塔尔赠送，改造后奢华程度前所未见，价值4亿美元

特朗普换新专机：太兴奋了，这是波音造过最好的747飞机；该机由卡塔尔赠送，改造后奢华程度前所未见，价值4亿美元

大风新闻

2026-07-02 11:02:45

500亿交了昂贵学费！京东的外卖败局，给所有企业敲了警钟？

500亿交了昂贵学费！京东的外卖败局，给所有企业敲了警钟？

新浪财经

2026-06-30 13:36:58

依旧防守机器，万-比萨卡整届世界杯0次被对手成功过人

依旧防守机器，万-比萨卡整届世界杯0次被对手成功过人

懂球帝

2026-07-02 04:20:07

某大厂员工：小组裁员35%，一个人扛三个人的活。累得心绞痛发作

某大厂员工：小组裁员35%，一个人扛三个人的活。累得心绞痛发作

蚂蚁大喇叭

2026-07-02 16:41:08

美国下令驱逐哥大挺巴学生活动者：拿绿卡十多年，可能被送去约旦

美国下令驱逐哥大挺巴学生活动者：拿绿卡十多年，可能被送去约旦

桂系007

2026-07-01 22:49:10

侃故事的阿庆

几分钟看完一部影视剧，诙谐幽默的娓娓道来

823文章数 8870关注度

往期回顾全部

科技要闻

马斯克不承认，但SpaceX就该造AI手机

头条要闻

冒死救出起火特斯拉女司机的理想车主找到了本人发声

头条要闻

冒死救出起火特斯拉女司机的理想车主找到了本人发声

体育要闻

韩国人，为什么恨透了洪明甫？

娱乐要闻

众星祝福祖国，曾沛慈原形毕露？

财经要闻

千亿茶市场无赢家:澜沧巨亏八马停"蹄"

汽车要闻

小鹏MONA L03 智能化水平拉满还有玩法多样的巧思大空间

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

亲子

房产

数码

公开课

本地新闻

这场穿越酉阳的光影之旅，张张都是壁纸！

亲子要闻

分年龄段选购儿童被子指南：不同成长阶段核心需求与选型方向梳理

房产要闻

稀缺预警！海岸线200米+限墅令下，海南「绝版硬通货」来了！

数码要闻

消息称10-12-13-14代全系英特尔CPU供货将明显放量

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版