网易首页 > 网易号 > 正文 申请入驻

DeepSeek的一串“符号”背后:对国产芯片意味着什么?

0
分享至

21世纪经济报道记者赵云帆 上海报道“UE8M0 FP8是针对即将发布的下一代国产芯片设计。”

这是深度求索公司8月份在新发布新模型DeepSeek V3.1的文档中所留下的一个关键信息。

整个8月下旬,这串“符号”成为国产芯片与算力行业在资本市场狂欢的“财富密码”。然而,对于非行业专业投资者来说,只有一头雾水,很难明白这串略显晦涩的代码到底意味着什么,可以让市场如此兴奋。

“UE8M0 FP8”到底是什么意思?为什么它能引发资本市场对国产芯片的高度关注?而我们又需注意哪些不确定性?21世纪经济报道记者采访了数位AI和算力行业人士,并尝试为这三个问题找到一些解答。

极致的效率追求

首先“UE8M0 FP8”是什么意思?

“FP”即“浮点”,是计算机二进制计算的基础单位,与“INT”整数计算相对应,常以科学计数法表达数据,适用于图形处理、科学计算、深度学习等应用场景。“FP8”即代表8位浮点,以此类推,FP16、FP32分别代表16位和32位浮点。而每个浮点位又分别用于记录符号(+、-)、“E”阶数(指数)、“M”尾数(小数)等关键数据信息,“通过科学计数法计算的方式”来记录数据。

所以,“UE8M0 FP8”,即代表无符号、8位指数、0位尾数的参数格式。

一个恰如其分的比喻是,“指数位E”是人工智能丈量世界的尺的刻度,它既能测量微观世界的尘埃,也能丈量宏观世界的山河——但是,它需要符号位和尾数“M”来帮它确认精度。而在主流的参数格式FP8、FP16、FP32等中,其主流参数格式对应的指数位分别为4位、5位和8位。

其中,“FP32”是科学计算、模型训练和推理的金标准,但因浮点位数高,计算资源耗费巨大,常用“混合”了FP16、FP8的混合精度进行高效化替代。

而“UE8M0”,就仿佛一个“百招会不如一招鲜”的高手,将自己所有的技能点全部聚焦到自己的量程之上,由此达到和FP32同样的数据范围。

“E8M0是用8位表示指数部分,尾数部分为0,所以Scale(标度)的值范围上和FP32差不多,因为FP32也是8位表示指数部分,可以保证量化范围大,有利于模型训练的数值稳定。”前全球头部数据库企业高管许天(化名)告诉记者:“所以我理解E8M0对比FP32速度更快,对比E5M2类的FP8数值范围更大,训练更稳定。”

当然,纯粹的“UE8M0”,自然会以舍弃精度作为代价。但是,由于Transformer架构(一种采用注意力机制的深度学习架构)下的AI大模型,其关键自注意力机制原本就依赖于浮点的大量程,因此 “UE8M0”创造了一种“牺牲局部精度,换取全局稳定”的人工智能计算格式。

“UE8M0 FP8指的是一种为中国市场而特别定制的模型格式,能有效降低计算功耗,基于芯片规格的限制,此格式对中国的芯片厂商比较友好。”Omdia首席分析师苏廉节告诉记者。“相比之下,海外的厂商是直接采用标准的FP,如E3M4或E5M2等。”

为“中国AI+”而生

那么“UE8M0 FP8”为何适用于国产芯片?

毫无疑问,受制于技术积淀时间较短,而基于中国标准的算力生态建设还需完善,因此,国产算力硬件在制程、速率、电耗等标准上存在较大的提升空间。

而采用“UE8M0 FP8”格式深度适配国产芯片,并不仅仅是一项技术上的选择,更是基于国产芯片的发展现状、实际产业需求以及特定应用场景所共同推动的结果。本质上是一次用算法创新弥补硬件短板,用生态协同构建自主路线的战略考量。

比如,国产芯片在先进制程(如7nm及以下)的制造和封装技术上与国际顶尖水平存在差距,直接影响了芯片的算力密度。主流的矩阵乘法和卷积等编码方式需要耗费极大算力以保留精度,而UE8M0的纯指数编码格式,将计算简化为指数移位和加法操作,大幅降低了大量算力负荷。

与此同时,长期以来AI领域由英伟达CUDA生态主导,导致国产芯片往往需要兼容CUDA,且难以充分发挥自身硬件特性,也很难开拓性地建立自己的生态系统。

而“UE8M0”作为一种更加开源、未被单一厂商绑定的格式,可能成为国产芯片重建生态体系的关键。

无独有偶,虽然未来“UE8M0 FP8”仍然会基于混合精度模式驱动语言类大模型应用,但是广义的人工智能又绝非“大语言模型”这么简单。比如,在今年年初DeepSeekV2问世之后,不仅人们在生活之中开始处处使用大语言模型交互,而且更多的企事业单位也对DeepSeek进行本地化、私有化部署,并通过语料后训练等用于各种专用用途。

事实上,除大语言模型之外,明确定义的专用用途AI大模型更需具备大量程、高稳定、高效率的算力特点。

比如,常被应用于自动驾驶和人形机器人具身智能的多模态VLA模型,满足高效计算、大内存带宽和极大动态范围的需求,特别是在处理多模态、大规模数据且部署在计算资源受限的边缘设备时,优势明显;而在工业质检、政务文档处理等场景,往往需要低延迟、高准确率的AI模型,并且对成本敏感。

简而言之,在明确定义的专用场景之中,“UE8M0 FP8”能够发挥其高效、稳定的特点,在配合混合参数精度的情况下,很可能是更适合“中国速度”,以及千行百业“AI+”的参数格式。

留意“不确定性”

当然,这个“UE8M0”背后仍然蕴藏着不确定性,如人形机器人精确操作依赖高精度的VLA架构,如原生的中文大语言模型,也需要高精度来显得更为“智慧”。

8月以来,随着DeepSeekV3.1的发布,AI芯片企业寒武纪股价8月涨幅高达110%。

资料显示,寒武纪的算力芯片思元590及可能于未来发布的690系列芯片均原生支持FP8计算,而沐曦、燧原等国产AI芯片厂商也均表态其适配FP8计算。

8月末,阿里巴巴公司也宣称,其即将推出自研的AI算力芯片,并且会适配英伟达的CUDA生态,但未明确其是否适配FP8参数格式。

那么,DeepSeek所预言的下一代FP8芯片究竟归属哪家?21世纪经济报道记者咨询多位业内人士之后,仍未获得进一步的信息。记者获得的绝大部分说法是:各家均没有明确的迹象,显示其使用了“UE8M0 FP8”混合参数模型。

“我认为这是DeepSeek在向国产芯片行业提出自己的标准,”另一位中资全球化数字科技企业高管告诉记者:“这一逻辑的根源是,DeepSeek已经在中国获得了绝对的行业地位和市占率,因此它有能力让芯片厂商根据自己的生态系统去定义芯片设计。”

这位不具名高管还向记者透露,虽然国产芯片对英伟达Hooper架构系列芯片的追赶已初见成效,如寒武纪等公司宣称其新品能力在专用场景下的能力达到H100的80%,但随着英伟达Blackwell系列芯片的推出(其甚至采用了FP4的混合精度架构),以及特供中国B30a系列芯片的发货,国产芯片追赶国际一流芯片能力上仍有较长的路要走。

不过,多数受访专家认为,国内企业芯片最终将获得成功,这需要仰赖其性能具备充分竞争优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
印度暴发尼帕病毒疫情!医生提醒:侵袭呼吸系统和中枢神经系统,可能人传人,春节出行非必要不前往疫区

印度暴发尼帕病毒疫情!医生提醒:侵袭呼吸系统和中枢神经系统,可能人传人,春节出行非必要不前往疫区

封面新闻
2026-01-27 03:27:03
老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

快科技
2026-02-01 11:55:44
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

胡一舸南游y
2026-02-01 18:43:56
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
NBA三方大交易评级出炉!公牛A骑士B+ 国王引进亨特仅评C

NBA三方大交易评级出炉!公牛A骑士B+ 国王引进亨特仅评C

罗说NBA
2026-02-01 13:16:11
细节令人发指!爱泼斯坦在厨房追逐女孩,安德鲁跪伏在女性身上,马斯克问“最疯狂的派对”……

细节令人发指!爱泼斯坦在厨房追逐女孩,安德鲁跪伏在女性身上,马斯克问“最疯狂的派对”……

新民周刊
2026-02-01 15:53:41
现场画面:柬埔寨对一电诈园区展开最大规模行动,抓捕2044人;缅甸出动空军运输机押729人回国

现场画面:柬埔寨对一电诈园区展开最大规模行动,抓捕2044人;缅甸出动空军运输机押729人回国

扬子晚报
2026-02-01 15:59:57
长江存储三期项目极速量产,借超级周期改变全球NAND竞争格局

长江存储三期项目极速量产,借超级周期改变全球NAND竞争格局

风向观察
2026-02-01 17:04:38
刘强东光送年货没发钱,60岁村民被问是否失望,老人家回答太戳心

刘强东光送年货没发钱,60岁村民被问是否失望,老人家回答太戳心

冷紫葉
2026-01-31 23:42:34
《名侦探柯南》与辱华漫画联动,紧急声明!

《名侦探柯南》与辱华漫画联动,紧急声明!

极目新闻
2026-02-01 10:34:47
iPhone 18 Pro新外观曝光,全系12GB运存

iPhone 18 Pro新外观曝光,全系12GB运存

科技堡垒
2026-02-01 12:19:03
爱泼斯坦鸡腿人照片炸锅!案板火鸡旁疑似人腿,官方辟谣难平众怒

爱泼斯坦鸡腿人照片炸锅!案板火鸡旁疑似人腿,官方辟谣难平众怒

眼光很亮
2026-02-01 17:15:19
杨紫这身材是真实存在的吗,薄薄的一片好瘦呀,极致自律太牛了!

杨紫这身材是真实存在的吗,薄薄的一片好瘦呀,极致自律太牛了!

TVB的四小花
2026-01-31 16:00:58
周一,世界连“犯小错”的权利都没有

周一,世界连“犯小错”的权利都没有

新浪财经
2026-02-01 07:36:02
知道不好骗了,所以开始硬抢了!

知道不好骗了,所以开始硬抢了!

胖胖说他不胖
2026-01-31 13:36:22
中超“恒大系”复燃?曝郑智刚上任,就招募多名前恒大队友加盟!

中超“恒大系”复燃?曝郑智刚上任,就招募多名前恒大队友加盟!

罗掌柜体育
2026-02-01 10:52:47
国投白银LOF:本基金将于2月2日开市起至当日10:30停牌 价格涨跌幅限制比例为10%

国投白银LOF:本基金将于2月2日开市起至当日10:30停牌 价格涨跌幅限制比例为10%

每日经济新闻
2026-02-01 19:36:53
深夜利空,46股业绩暴雷,机器人龙头暴降250%,化工龙暴降2007%

深夜利空,46股业绩暴雷,机器人龙头暴降250%,化工龙暴降2007%

鹏哥投研
2026-02-01 11:10:33
以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

极目新闻
2026-02-01 16:43:12
1岁幼童喂兔子被咬断手指,家长为找断指将兔子开膛破肚……医生提醒→

1岁幼童喂兔子被咬断手指,家长为找断指将兔子开膛破肚……医生提醒→

纵相新闻
2026-02-01 15:09:04
2026-02-02 01:47:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
231657文章数 743649关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

家居
本地
房产
时尚
公开课

家居要闻

蓝调空舍 自由与个性

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

“多巴胺风”又又又火了!这样穿时髦又减龄

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版