网易首页 > 网易号 > 正文 申请入驻

DeepSeek V3.1发布波澜不惊,为何寒武纪股价却一飞冲天?

0
分享至


DeepSeek V3.1的发布本是一场低调的技术迭代,作为一款大模型的升级版本,其性能提升稳健但未引发行业热潮。业内评价中规中矩,用户反馈也未见狂热。然而,资本市场却掀起波澜:国产AI芯片厂商寒武纪的股价如同点燃的火箭,迅速蹿升。这看似矛盾的现象背后,隐藏着怎样的逻辑?我们来拆解DeepSeek V3.1的技术亮点、其与国产算力的关联,以及为何寒武纪成为市场焦点,看懂这场AI与资本的“化学反应”。

DeepSeek V3.1:一场低调的技术升级

DeepSeekV3.1相比前代,性能有所提升,但在技术圈内并未引发颠覆性反响。圈内评价其为“稳扎稳打”,用户体验上也无“非换不可”的惊艳感。就像一部新款智能手机,硬件升级了,但对已有用户吸引力有限。

发布会上,DeepSeek提到支持两种数据格式:FP8和UE8M0,并特别强调后者是为“未来国产算力芯片”量身定制。这句话看似平常,却点燃了资本市场的热情,尤其是寒武纪的股价。寒武纪作为国产AI芯片的领军企业之一,专注为大模型提供计算支持。为什么一个低调的模型发布,能让一家芯片公司成为焦点?答案藏在UE8M0这个技术细节里。

UE8M0:AI世界的“马赛克”魔法

UE8M0是一种极端低精度的数值表示方式,全称是“无符号(Unsigned)、8位指数(Exponent 8)、0位尾数(Mantissa 0)”。听起来复杂,但可以用一个比喻解释:想象你在看一部网络视频,网速慢时画面变成马赛克,细节模糊但大轮廓还在。UE8M0就像AI计算中的“马赛克”,它把复杂的数据简化成粗颗粒的“台阶式”数字,比如2、4、8、16等,舍弃了小数部分的精细变化。

为什么要这么做?AI模型的核心是矩阵乘法,处理海量数据。数据精度越高,计算越精确,但占用的内存和带宽也越大,就像用高清相机拍照片,文件大、传输慢。UE8M0则像把照片压缩成低分辨率,文件小了,传输快了,计算效率大幅提升。DeepSeek V3.1的实现方式并非从头用UE8M0训练,而是在较高精度(FP16/FP8)基础上,通过混合精度和误差控制,量身定制了UE8M0版本,确保模型在“马赛克”状态下仍能保持可用性。

好处显而易见:数据量减少一半,内存和带宽压力骤降,模型运行速度更快,尤其适合推理阶段(即模型实际应用时)。这对大规模部署AI应用来说,是性价比的飞跃——普通设备也能跑大模型,不再是土豪专属。


AI计算的“瘦身”进化史

要理解UE8M0的意义,先看看AI计算的“瘦身”历史。AI模型的运算核心是矩阵乘法,像工厂流水线处理数字洪流。早期用FP32(32位浮点),精度高但资源消耗大,像是用大卡车运小包裹。后来,FP16和BF16(16位)成为主流,资源占用减半。如今,FP8(8位)是推理阶段的标配,效率更高。

UE8M0是FP8的一种变体,属于“微缩放”(Microscaling,MX)格式家族。MX的巧妙之处在于,将数据分成小块,每块共享一个“缩放因子”,像给一群人配一个放大镜,确保低精度也能覆盖大范围数值。UE8M0更极端:8位全用于指数,没有尾数,计算逻辑简化到极致——硬件只需做位移操作,像搭乐高积木,省时省力。这不仅降低功耗,还减轻硬件设计负担。

DeepSeek V3.1提供FP8和UE8M0两种版本。FP8适合英伟达、AMD等主流芯片,稳妥通用;UE8M0则为国产芯片量身优化,尤其在带宽受限的场景下,能显著提升效率。

国产算力的“及时雨”

UE8M0为何让市场兴奋?因为它与国产算力的需求高度契合。中国AI产业快速发展,但高端芯片受限于国际供应链,国产厂商如华为昇腾、寒武纪等需另辟蹊径。国际主流路线是从FP8走向更低的MXFP4,硬件支持完善。相比之下,国产芯片在显存带宽和容量上稍显不足,而UE8M0的低数据量特性正好补齐短板

以华为昇腾为例,其MindSpore软件栈(类似AI的操作系统)针对UE8M0进行了全链路优化,从训练到推理都适配。在带宽紧张的服务器上,UE8M0能让模型吞吐量(处理速度)翻倍。DeepSeek的“为国产算力芯片适配”信号,意味着模型与硬件的深度协同,像一对默契搭档,共同发挥最大效能。

更重要的是生态意义。过去,国产芯片多是“被动适配”国际模型,处于产业链下游。如今,DeepSeek主动优化UE8M0,相当于从软件端向上游硬件喊话:我们一起定义规则!这可能推动UE8M0成为国产AI的“事实标准”,减少技术碎片化,提升产业链协同效率。

寒武纪:从幕后到台前的逆袭

寒武纪为何成为资本市场宠儿?作为国产AI芯片的先锋,其思元系列芯片(如MLU370、思元690)早已支持FP8计算,最新产品更是“训练+推理”一体,完美匹配大模型需求。UE8M0的硬件实现门槛低,寒武纪的技术积累让它能迅速承接这一格式,发挥带宽和效率优势。

DeepSeek的发布像一封“邀请函”,暗示寒武纪可能是“下一代国产芯片”的重要玩家。这不仅关乎卖芯片,而是打造“模型+芯片+软件”的整体方案。比喻成做饭:DeepSeek提供菜谱(模型),寒武纪提供厨具(芯片),MindSpore是烹饪技巧,三者配合,做出高性价比的“AI大餐”。

市场嗅到了这种潜力。过去,寒武纪被视为“进口替代品”,估值受限于与英伟达的差距。如今,它被重新定义为国产AI生态的“核心枢纽”,与DeepSeek等头部模型深度绑定。投资者不再只看“能用”,而是看到“好用且独家”的未来。这种从“配角”到“主角”的叙事转变,推高了寒武纪的估值空间。

数据支持这一逻辑:传统格式下,显存占用高,国产芯片吃力;UE8M0下,占用减半,算力效率翻倍,功耗和成本降低。这对商业化部署是利好,尤其在国内带宽受限的环境下。DeepSeek和华为不上市,市场情绪自然流向寒武纪等可交易标的,股价暴涨成为必然。


UE8M0的双面性:机遇与隐忧

UE8M0虽是“神器”,但也有局限。它的“马赛克”特性要求模型从训练阶段就适配,就像从小练习走窄路,临时改容易摔跤。已有国际模型(如Llama)若硬量化到UE8M0,性能可能崩盘。DeepSeek的成功靠的是混合精度和误差控制,但这需要高昂的工程成本和失败风险。

生态上,UE8M0可能造成“锁定”。国际主流框架如PyTorch对UE8M0支持有限,模型用后难迁移。而国际路线(FP8到MXFP4)更通用,生态成熟。行业内有声音认为,UE8M0是“战术武器”,适合特定场景,但不宜作为主战略,否则可能导致工具链分裂和人才短缺。

争议也随之而来:UE8M0是国产AI的创新突破,还是“弯道超车”的冒险?成功则独立门户,失败则资源浪费。DeepSeek的尝试值得点赞,但推广需谨慎。

面向未来的启示

DeepSeek V3.1的发布看似平静,却点燃了国产AI生态的希望。UE8M0让国产算力扬长避短,寒武纪则从幕后走向台前,估值逻辑从“替代品”变为“生态核心”。这不仅是技术的进步,更是战略的跃升:中国AI开始从“跟跑”转向“自定规则”

对从业者,建议模型开发从训练期考虑低精度,工程部署时评估UE8M0的性价比优势。对投资者,关注“算法+硬件+框架”的一体化潜力,而非追逐短期热点。对普通人,这场变革意味着AI将更普惠,未来你的手机、电脑可能跑着国产芯片和模型,轻松搞定复杂任务。

(本文基于公开信息整理,仅为科普,不构成投资建议。)


*本文由MOE大模型辅助完成。图片创意ChatGPT、豆包、Comfyui。

All rights reserved. Copyright © 2025


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
意外?朝鲜计划去日本参加亚运会!日本政府原则上禁止朝鲜人入境

意外?朝鲜计划去日本参加亚运会!日本政府原则上禁止朝鲜人入境

念洲
2025-09-19 07:47:51
我刚从台湾回来:说实话很难听,但这就是真实的台湾省现状了

我刚从台湾回来:说实话很难听,但这就是真实的台湾省现状了

媛来这样
2025-06-01 00:20:57
蒋雯丽起诉散布其“包养男大学生”博主,获赔12.5万

蒋雯丽起诉散布其“包养男大学生”博主,获赔12.5万

都市快报橙柿互动
2025-09-19 13:43:55
组织多名未成年失足女飞多地卖淫,让女友管起居发避孕套,男子获刑10年11个月

组织多名未成年失足女飞多地卖淫,让女友管起居发避孕套,男子获刑10年11个月

红星新闻
2025-09-19 14:55:59
【2025.9.19】扒酱料不停:那些你不知道的八卦一二三

【2025.9.19】扒酱料不停:那些你不知道的八卦一二三

娱乐真爆姐
2025-09-19 23:26:28
四川省纪委监委通报:2人任上被查

四川省纪委监委通报:2人任上被查

鲁中晨报
2025-09-19 19:09:05
一北京飞俄罗斯客机因大雾天气备降 无人受伤

一北京飞俄罗斯客机因大雾天气备降 无人受伤

财联社
2025-09-19 18:52:11
数十亿美元!GE医疗或出售中国业务

数十亿美元!GE医疗或出售中国业务

医疗器械经销商联盟
2025-09-19 14:56:44
“早晚刷牙”是错的?医生叮嘱:过了60岁,最好改掉4个刷牙习惯

“早晚刷牙”是错的?医生叮嘱:过了60岁,最好改掉4个刷牙习惯

荷兰豆爱健康
2025-09-02 12:44:24
美专家:中国两艘航母都不行!但福建舰扼杀了美日最后一丝希望​

美专家:中国两艘航母都不行!但福建舰扼杀了美日最后一丝希望​

瞻史
2025-09-16 19:25:20
貂蝉献舞董卓府首夜,董卓创下一项记录,后世君主无一人能突破

貂蝉献舞董卓府首夜,董卓创下一项记录,后世君主无一人能突破

雅俗共赏1
2025-08-28 12:03:22
镇政府回应男子“崖下洞居”5年,给疲惫灵魂一个出口

镇政府回应男子“崖下洞居”5年,给疲惫灵魂一个出口

白浅娱乐聊
2025-09-19 21:47:07
女子即将回校崩溃大哭,男朋友在一旁哭笑不得:你可是老师啊

女子即将回校崩溃大哭,男朋友在一旁哭笑不得:你可是老师啊

唐小糖说情感
2025-08-26 10:08:56
努力就有回报!年底财运最好的3大幸运生肖,收入稳步上涨

努力就有回报!年底财运最好的3大幸运生肖,收入稳步上涨

毅谈生肖
2025-09-18 11:48:18
3:1!天津女排开门红,李盈莹首发8分,却缺席合照,王艺竹高效

3:1!天津女排开门红,李盈莹首发8分,却缺席合照,王艺竹高效

跑者排球视角
2025-09-19 07:21:22
上海交大医学院,将迎来第14个附属医院

上海交大医学院,将迎来第14个附属医院

医学界
2025-09-19 11:32:37
可3000万买断!罗马诺:巴萨对拉什福德很满意,不会提前终止租借

可3000万买断!罗马诺:巴萨对拉什福德很满意,不会提前终止租借

直播吧
2025-09-19 18:40:02
梁晓声:草根子弟沉迷娱乐4小时,高干子弟22岁已能主持百人会议

梁晓声:草根子弟沉迷娱乐4小时,高干子弟22岁已能主持百人会议

清风拂心
2025-08-31 14:15:03
斯诺克最新战报!周跃龙救赛点,3-4落后布雷切尔,逆转又来了?

斯诺克最新战报!周跃龙救赛点,3-4落后布雷切尔,逆转又来了?

刘姚尧的文字城堡
2025-09-19 21:38:09
一觉醒来,西贝的天塌了!新华社:不怕你预制,就怕你不告诉我

一觉醒来,西贝的天塌了!新华社:不怕你预制,就怕你不告诉我

卷史
2025-09-14 12:55:57
2025-09-20 02:32:49
创新文化促进会
创新文化促进会
组织开展中关村创新文化研究
432文章数 36关注度
往期回顾 全部

财经要闻

习近平同美国总统特朗普通电话

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

头条要闻

山东入室被抢男婴到15岁没见过汽车 养家从不让他出门

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

时尚
本地
艺术
房产
教育

卡其裤+蓝衬衫,简单高级

本地新闻

大学生军训哪家强,广西申请“出战”!

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

全民撑广州,不止于赛场!与“有态度”者共筑城市骄傲

教育要闻

外国新闻史重点背诵清单。

无障碍浏览 进入关怀版