网易首页 > 网易号 > 正文 申请入驻

OpenAI采用新数据类型MXFP4,推理成本降低75%

0
分享至

无论OpenAI的新开放权重模型性能如何,其采用的相对较新的数据类型MXFP4可能更为重要,尤其是如果这种技术在OpenAI的竞争对手中得到推广的话。

相比大语言模型传统使用的数据类型,MXFP4格式承诺能够大幅节省计算成本,允许云服务提供商或企业仅用四分之一的硬件来运行模型。

**什么是MXFP4?**

如果你从未听说过MXFP4,这是因为虽然它已经开发了一段时间,但OpenAI的gpt-oss模型是首批利用这一技术的主流大语言模型之一。

MXFP4是由开放计算项目(OCP)定义的4位浮点数据类型。OCP是由Facebook于2011年发起的超大规模数据中心联盟,旨在让数据中心组件更便宜、更易获得。具体来说,MXFP4是一种微缩放块浮点格式,因此名称是MXFP4而不是简单的FP4。

这种微缩放功能相当重要,因为FP4本身无法提供太多精度。仅有四位——一位符号位、两位指数位和一位尾数位——它只能表示16个不同的值:8个正值和8个负值。相比之下,BF16可以表示65,536个值。

通过巧妙的数学运算,MXFP4能够表示更广泛的数值范围。MXFP4量化的工作原理是取一个高精度值块(默认为32个),并用8位二进制指数形式的公共缩放因子对其进行乘法运算。

在推理过程中,这些数值会通过将其4位浮点值的倒数与缩放因子相乘来实时反量化。虽然仍会遇到舍入误差,但精度仍比标准FP4高得多。

**MXFP4的重要性**

MXFP4之所以重要,是因为权重越小,运行模型所需的显存、内存带宽和计算量就越少。换句话说,MXFP4让生成式AI变得更加便宜。

与目前大语言模型最常用的数据类型BF16相比,MXFP4可将计算和内存需求减少约75%。根据gpt-oss模型卡片,OpenAI对约90%的模型权重应用了MXFP4量化。这使得他们能够将1200亿参数的模型装入仅有80GB显存的GPU中,或将200亿参数的较小版本装入仅有16GB内存的GPU中。

通过将gpt-oss量化为MXFP4,该大语言模型不仅比同等规模的BF16训练模型占用的内存少4倍,Token生成速度也可以提升4倍。

**OpenAI引领潮流**

量化并不是新概念。模型开发者已经发布FP8甚至4位量化版本的模型有一段时间了。然而,这些量化版本通常被视为一种妥协,因为较低的精度必然伴随着质量损失。

研究反复表明,对于大语言模型而言,从16位降到8位的质量损失基本可以忽略不计。事实上,一些模型构建者如DeepSeek已经开始原生使用FP8训练模型。

虽然MXFP4比标准FP4好得多,但它并不一定是万能的解决方案。英伟达认为,该数据类型与FP8相比仍可能出现质量下降,部分原因是其32值块大小不够精细。为解决这个问题,这家GPU巨头推出了自己的微缩放数据类型NVFP4,旨在通过使用16值块和FP8缩放因子来提高质量。

对于gpt-oss,OpenAI已经做出了选择。没有BF16或FP8版本的模型,只有MXFP4版本。鉴于OpenAI在市场中的重要地位,他们基本上在说:如果MXFP4对我们来说足够好,那对你们也应该足够好。

这无疑是为负责服务这些模型的基础设施提供商带来的好消息。在那之前,OpenAI可以宣传其开放模型比其他人的模型更容易运行,以及如何利用支持FP4数据类型的英伟达和AMD新芯片。

Q&A

Q1:MXFP4数据类型是什么?它有什么优势?

A:MXFP4是由开放计算项目定义的4位浮点数据类型,是一种微缩放块浮点格式。相比大语言模型传统使用的BF16数据类型,MXFP4可将计算和内存需求减少约75%,让生成式AI运行成本大幅降低,同时Token生成速度可提升4倍。

Q2:OpenAI的gpt-oss模型为什么只提供MXFP4版本?

A:OpenAI在gpt-oss模型中只提供MXFP4版本,没有BF16或FP8版本。鉴于OpenAI在市场中的重要地位,他们通过这种做法向业界传达信息:如果MXFP4对OpenAI来说足够好,那对其他人也应该足够好,从而推动这一技术标准的普及。

Q3:使用MXFP4会不会影响模型质量?

A:虽然较低精度通常伴随质量损失,但研究表明从16位降到8位的质量损失基本可以忽略不计。MXFP4虽然比标准FP4好得多,但与FP8相比仍可能出现一定的质量下降,这主要是因为其32值块大小不够精细造成的。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国公开赛战报:中国4胜5负!世界冠军4-6爆冷一轮游,王信伯3-6

中国公开赛战报:中国4胜5负!世界冠军4-6爆冷一轮游,王信伯3-6

球场没跑道
2026-06-11 08:23:53
仁爱礁坐滩军舰遭遇强震,赖了 27 年,这回真悬了

仁爱礁坐滩军舰遭遇强震,赖了 27 年,这回真悬了

华山穹剑
2026-06-11 21:20:53
老胡这次彻底刷新了坏的下限!

老胡这次彻底刷新了坏的下限!

胖胖说他不胖
2026-06-08 11:50:14
无缘世界杯正赛球员身价榜:KK以1.4亿欧领衔,4位亿元先生

无缘世界杯正赛球员身价榜:KK以1.4亿欧领衔,4位亿元先生

懂球帝
2026-06-12 00:50:28
我感觉大的危机要来了

我感觉大的危机要来了

曹多鱼的财经世界
2026-06-11 15:19:39
高校女领导出轨人夫,近照曝光,细节不堪入目,校方最新回应来了

高校女领导出轨人夫,近照曝光,细节不堪入目,校方最新回应来了

知法而形
2026-06-11 19:39:41
白鹿新剧,已经乱成一锅粥了!

白鹿新剧,已经乱成一锅粥了!

八卦南风
2026-06-10 17:35:54
大利好!央行、证监会、财政部等密集发布!

大利好!央行、证监会、财政部等密集发布!

新浪财经
2026-06-11 11:50:51
内蒙古一超市被传“即将倒闭”致大部分货架被抢空,商务局辟谣:谣言!超市资金状况良好,已开展相关工作;超市方:已报警

内蒙古一超市被传“即将倒闭”致大部分货架被抢空,商务局辟谣:谣言!超市资金状况良好,已开展相关工作;超市方:已报警

极目新闻
2026-06-11 18:50:30
大批主播跑路,辛巴、小杨哥扛不住了

大批主播跑路,辛巴、小杨哥扛不住了

电商派Pro
2026-06-11 10:39:52
慌了!留学生还没拿到签证,世界杯游客先安排上了?

慌了!留学生还没拿到签证,世界杯游客先安排上了?

留学咖啡馆
2026-06-10 08:40:07
董路说:我最缺钱的时候,是武磊掏出80000块钱,资助足球小将…

董路说:我最缺钱的时候,是武磊掏出80000块钱,资助足球小将…

童叔不飙车
2026-06-11 11:12:20
橘色追踪卡:比AirTag薄2.5毫米,却砍掉了苹果一项关键功能

橘色追踪卡:比AirTag薄2.5毫米,却砍掉了苹果一项关键功能

我是一个粉刷匠2
2026-06-11 04:19:10
四川考生第一个离场,说数学拿满分,光看长相就知道是个学霸!

四川考生第一个离场,说数学拿满分,光看长相就知道是个学霸!

辉哥说动漫
2026-06-12 00:04:55
一直被误会的动作!研究发现:每天叹气5分钟,5个好处不请自来

一直被误会的动作!研究发现:每天叹气5分钟,5个好处不请自来

人民日报健康客户端
2026-06-10 20:20:38
今天白天多云转阴,最高气温32℃,傍晚至明天有明显雷阵雨

今天白天多云转阴,最高气温32℃,傍晚至明天有明显雷阵雨

北青网-北京青年报
2026-06-12 07:19:02
事实证明,已经“消失”7年的周立波,早已走上一条不归路

事实证明,已经“消失”7年的周立波,早已走上一条不归路

素衣读史
2026-04-16 19:41:20
菲律宾变脸比翻书快,马科斯发贺信求缓和,中国大使送回一句话

菲律宾变脸比翻书快,马科斯发贺信求缓和,中国大使送回一句话

夏末moent
2026-06-10 22:22:42
一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

一碗隔夜米饭毒死7人?医生警告:米饭尽量别这样吃,比砒霜还毒

路医生健康科普
2026-05-31 20:15:03
莫斯科突发炸弹攻击!俄罗斯弹药主管达维多夫遇袭身亡

莫斯科突发炸弹攻击!俄罗斯弹药主管达维多夫遇袭身亡

项鹏飞
2026-06-10 21:54:02
2026-06-12 09:19:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19265文章数 49711关注度
往期回顾 全部

科技要闻

SpaceX IPO募资750亿美元,马斯克身家万亿

头条要闻

世界杯揭幕战单场发3红牌 几乎追平上届全部红牌纪录

头条要闻

世界杯揭幕战单场发3红牌 几乎追平上届全部红牌纪录

体育要闻

比起总冠军,更大的悬念成了FMVP?

娱乐要闻

《花少8》阵容大揭秘!秒杀前一季

财经要闻

欧洲忍不住了,全球加息潮再起?

汽车要闻

将搭云辇-M智能磁流变悬架 方程豹方程S系列信息曝光

态度原创

时尚
教育
旅游
健康
手机

一个高考状元的崩塌:全职陪读 18 年,女儿进了精神科

教育要闻

"A year's plan starts with spring"竟然不是英语谚语?

旅游要闻

山西原平斥资近亿元建景观小镇,为何“用不起来”

为什么不建议晚上吃粽子?

手机要闻

iPhone 17标准版无缘高阶Siri AI;第13版《新华字典》发布

无障碍浏览 进入关怀版