网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1发布波澜不惊,为何寒武纪股价却一飞冲天?

0
分享至


DeepSeek V3.1的发布本是一场低调的技术迭代,作为一款大模型的升级版本,其性能提升稳健但未引发行业热潮。业内评价中规中矩,用户反馈也未见狂热。然而,资本市场却掀起波澜:国产AI芯片厂商寒武纪的股价如同点燃的火箭,迅速蹿升。这看似矛盾的现象背后,隐藏着怎样的逻辑?我们来拆解DeepSeek V3.1的技术亮点、其与国产算力的关联,以及为何寒武纪成为市场焦点,看懂这场AI与资本的“化学反应”。

DeepSeek V3.1:一场低调的技术升级

DeepSeekV3.1相比前代,性能有所提升,但在技术圈内并未引发颠覆性反响。圈内评价其为“稳扎稳打”,用户体验上也无“非换不可”的惊艳感。就像一部新款智能手机,硬件升级了,但对已有用户吸引力有限。

发布会上,DeepSeek提到支持两种数据格式:FP8和UE8M0,并特别强调后者是为“未来国产算力芯片”量身定制。这句话看似平常,却点燃了资本市场的热情,尤其是寒武纪的股价。寒武纪作为国产AI芯片的领军企业之一,专注为大模型提供计算支持。为什么一个低调的模型发布,能让一家芯片公司成为焦点?答案藏在UE8M0这个技术细节里。

UE8M0:AI世界的“马赛克”魔法

UE8M0是一种极端低精度的数值表示方式,全称是“无符号(Unsigned)、8位指数(Exponent 8)、0位尾数(Mantissa 0)”。听起来复杂,但可以用一个比喻解释:想象你在看一部网络视频,网速慢时画面变成马赛克,细节模糊但大轮廓还在。UE8M0就像AI计算中的“马赛克”,它把复杂的数据简化成粗颗粒的“台阶式”数字,比如2、4、8、16等,舍弃了小数部分的精细变化。

为什么要这么做?AI模型的核心是矩阵乘法,处理海量数据。数据精度越高,计算越精确,但占用的内存和带宽也越大,就像用高清相机拍照片,文件大、传输慢。UE8M0则像把照片压缩成低分辨率,文件小了,传输快了,计算效率大幅提升。DeepSeek V3.1的实现方式并非从头用UE8M0训练,而是在较高精度(FP16/FP8)基础上,通过混合精度和误差控制,量身定制了UE8M0版本,确保模型在“马赛克”状态下仍能保持可用性。

好处显而易见:数据量减少一半,内存和带宽压力骤降,模型运行速度更快,尤其适合推理阶段(即模型实际应用时)。这对大规模部署AI应用来说,是性价比的飞跃——普通设备也能跑大模型,不再是土豪专属。


AI计算的“瘦身”进化史

要理解UE8M0的意义,先看看AI计算的“瘦身”历史。AI模型的运算核心是矩阵乘法,像工厂流水线处理数字洪流。早期用FP32(32位浮点),精度高但资源消耗大,像是用大卡车运小包裹。后来,FP16和BF16(16位)成为主流,资源占用减半。如今,FP8(8位)是推理阶段的标配,效率更高。

UE8M0是FP8的一种变体,属于“微缩放”(Microscaling,MX)格式家族。MX的巧妙之处在于,将数据分成小块,每块共享一个“缩放因子”,像给一群人配一个放大镜,确保低精度也能覆盖大范围数值。UE8M0更极端:8位全用于指数,没有尾数,计算逻辑简化到极致——硬件只需做位移操作,像搭乐高积木,省时省力。这不仅降低功耗,还减轻硬件设计负担。

DeepSeek V3.1提供FP8和UE8M0两种版本。FP8适合英伟达、AMD等主流芯片,稳妥通用;UE8M0则为国产芯片量身优化,尤其在带宽受限的场景下,能显著提升效率。

国产算力的“及时雨”

UE8M0为何让市场兴奋?因为它与国产算力的需求高度契合。中国AI产业快速发展,但高端芯片受限于国际供应链,国产厂商如华为昇腾、寒武纪等需另辟蹊径。国际主流路线是从FP8走向更低的MXFP4,硬件支持完善。相比之下,国产芯片在显存带宽和容量上稍显不足,而UE8M0的低数据量特性正好补齐短板

以华为昇腾为例,其MindSpore软件栈(类似AI的操作系统)针对UE8M0进行了全链路优化,从训练到推理都适配。在带宽紧张的服务器上,UE8M0能让模型吞吐量(处理速度)翻倍。DeepSeek的“为国产算力芯片适配”信号,意味着模型与硬件的深度协同,像一对默契搭档,共同发挥最大效能。

更重要的是生态意义。过去,国产芯片多是“被动适配”国际模型,处于产业链下游。如今,DeepSeek主动优化UE8M0,相当于从软件端向上游硬件喊话:我们一起定义规则!这可能推动UE8M0成为国产AI的“事实标准”,减少技术碎片化,提升产业链协同效率。

寒武纪:从幕后到台前的逆袭

寒武纪为何成为资本市场宠儿?作为国产AI芯片的先锋,其思元系列芯片(如MLU370、思元690)早已支持FP8计算,最新产品更是“训练+推理”一体,完美匹配大模型需求。UE8M0的硬件实现门槛低,寒武纪的技术积累让它能迅速承接这一格式,发挥带宽和效率优势。

DeepSeek的发布像一封“邀请函”,暗示寒武纪可能是“下一代国产芯片”的重要玩家。这不仅关乎卖芯片,而是打造“模型+芯片+软件”的整体方案。比喻成做饭:DeepSeek提供菜谱(模型),寒武纪提供厨具(芯片),MindSpore是烹饪技巧,三者配合,做出高性价比的“AI大餐”。

市场嗅到了这种潜力。过去,寒武纪被视为“进口替代品”,估值受限于与英伟达的差距。如今,它被重新定义为国产AI生态的“核心枢纽”,与DeepSeek等头部模型深度绑定。投资者不再只看“能用”,而是看到“好用且独家”的未来。这种从“配角”到“主角”的叙事转变,推高了寒武纪的估值空间。

数据支持这一逻辑:传统格式下,显存占用高,国产芯片吃力;UE8M0下,占用减半,算力效率翻倍,功耗和成本降低。这对商业化部署是利好,尤其在国内带宽受限的环境下。DeepSeek和华为不上市,市场情绪自然流向寒武纪等可交易标的,股价暴涨成为必然。


UE8M0的双面性:机遇与隐忧

UE8M0虽是“神器”,但也有局限。它的“马赛克”特性要求模型从训练阶段就适配,就像从小练习走窄路,临时改容易摔跤。已有国际模型(如Llama)若硬量化到UE8M0,性能可能崩盘。DeepSeek的成功靠的是混合精度和误差控制,但这需要高昂的工程成本和失败风险。

生态上,UE8M0可能造成“锁定”。国际主流框架如PyTorch对UE8M0支持有限,模型用后难迁移。而国际路线(FP8到MXFP4)更通用,生态成熟。行业内有声音认为,UE8M0是“战术武器”,适合特定场景,但不宜作为主战略,否则可能导致工具链分裂和人才短缺。

争议也随之而来:UE8M0是国产AI的创新突破,还是“弯道超车”的冒险?成功则独立门户,失败则资源浪费。DeepSeek的尝试值得点赞,但推广需谨慎。

面向未来的启示

DeepSeek V3.1的发布看似平静,却点燃了国产AI生态的希望。UE8M0让国产算力扬长避短,寒武纪则从幕后走向台前,估值逻辑从“替代品”变为“生态核心”。这不仅是技术的进步,更是战略的跃升:中国AI开始从“跟跑”转向“自定规则”

对从业者,建议模型开发从训练期考虑低精度,工程部署时评估UE8M0的性价比优势。对投资者,关注“算法+硬件+框架”的一体化潜力,而非追逐短期热点。对普通人,这场变革意味着AI将更普惠,未来你的手机、电脑可能跑着国产芯片和模型,轻松搞定复杂任务。

(本文基于公开信息整理,仅为科普,不构成投资建议。)


*本文由MOE大模型辅助完成。图片创意ChatGPT、豆包、Comfyui。

All rights reserved. Copyright © 2025


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
难度再升级?神舟二十二号将载满货物发射,无人对接难度有多大?

难度再升级?神舟二十二号将载满货物发射,无人对接难度有多大?

策前论
2025-11-17 15:09:55
李连杰的事,越来越玄乎了

李连杰的事,越来越玄乎了

听风听你
2025-11-15 00:00:50
正式官宣!CBA争议外援加盟广东宏远,携手徐杰,冲击总冠军

正式官宣!CBA争议外援加盟广东宏远,携手徐杰,冲击总冠军

体坛瞎白话
2025-11-17 08:29:10
廖元赫:夺世冠后没啥想法盼成都围甲登顶 到韩国下联赛有助赢小申

廖元赫:夺世冠后没啥想法盼成都围甲登顶 到韩国下联赛有助赢小申

劲爆体坛
2025-11-17 18:42:07
夺冠还不到24小时,恶心的事出现了,原来樊振东和陈梦的处境一样

夺冠还不到24小时,恶心的事出现了,原来樊振东和陈梦的处境一样

深析古今
2025-11-17 12:24:05
日防卫大臣小泉进次郎上再次表示,台湾有事日本必定出击

日防卫大臣小泉进次郎上再次表示,台湾有事日本必定出击

我心纵横天地间
2025-11-17 11:19:01
山西摔狗反杀案,为何检方认为防卫过当?被告律师一语道破真相

山西摔狗反杀案,为何检方认为防卫过当?被告律师一语道破真相

慢半拍sir
2025-11-15 21:23:31
17号收评:三大指数低开低走,所有人都注意,大盘后市开始这样看

17号收评:三大指数低开低走,所有人都注意,大盘后市开始这样看

春江财富
2025-11-17 15:20:59
不是玄学!明日九月二十九,最旺自己的4件事,别忘了告诉家人

不是玄学!明日九月二十九,最旺自己的4件事,别忘了告诉家人

阿龙美食记
2025-11-17 04:39:03
24岁小伙爱上51岁大妈,大妈性欲高还虐待他,结果被小伙砍成5段

24岁小伙爱上51岁大妈,大妈性欲高还虐待他,结果被小伙砍成5段

胖胖侃咖
2024-04-22 08:00:09
解放军算总账,轰炸机编队出征,美军增兵南海,菲媒定调岛礁主权

解放军算总账,轰炸机编队出征,美军增兵南海,菲媒定调岛礁主权

时时有聊
2025-11-17 19:42:53
北京首度以“侵略”定性,中俄合围下高市早苗何以折戟

北京首度以“侵略”定性,中俄合围下高市早苗何以折戟

单手搓核弹
2025-11-17 15:36:09
义无反顾5:强行突围

义无反顾5:强行突围

金昔说故事
2025-11-17 14:57:28
玄学炒股再下一城!抗日概念呼声极高:灭苗,草甘膦专治早苗...

玄学炒股再下一城!抗日概念呼声极高:灭苗,草甘膦专治早苗...

金石随笔
2025-11-17 00:09:15
《七龙珠》全球首店落地东京,立像震撼却被吐槽画风粗糙

《七龙珠》全球首店落地东京,立像震撼却被吐槽画风粗糙

积木圈子
2025-11-16 18:45:26
好莱坞要拍LABUBU大电影!泡泡玛特再破圈!

好莱坞要拍LABUBU大电影!泡泡玛特再破圈!

中国品牌
2025-11-17 19:36:36
奔驰最强 AMG SUV 即将登场!3 电机 900 马力,性能看齐保时捷

奔驰最强 AMG SUV 即将登场!3 电机 900 马力,性能看齐保时捷

爱范儿
2025-11-17 20:04:55
iOS 26.2 低调带来新功能,舒服!

iOS 26.2 低调带来新功能,舒服!

花果科技
2025-11-17 10:50:23
2-0,10分钟2球,乌克兰积10分进世预赛附加赛,冰岛无缘世界杯

2-0,10分钟2球,乌克兰积10分进世预赛附加赛,冰岛无缘世界杯

侧身凌空斩
2025-11-17 06:21:25
被逼迫辞职后,高市体面认输,再也不敢叫板中国,洪秀柱一语成谶

被逼迫辞职后,高市体面认输,再也不敢叫板中国,洪秀柱一语成谶

时时有聊
2025-11-16 19:53:15
2025-11-17 20:35:00
创新文化促进会
创新文化促进会
组织开展中关村创新文化研究
464文章数 37关注度
往期回顾 全部

财经要闻

高市早苗的算计,将让日本割肉5000亿

头条要闻

韩国向日本表示强烈抗议 中方表态

头条要闻

韩国向日本表示强烈抗议 中方表态

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

科技要闻

有了通义和夸克,阿里为何再推千问App?

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

本地
房产
教育
数码
军事航空

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

教育要闻

疗愈躺平孩子的心,妈妈要做的出乎意料的简单!

数码要闻

Valve Steam Machine性能遭质疑:8GB显存能带动3A大作吗

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版