网易首页 > 网易号 > 正文 申请入驻

微软的“1-bit” AI模型仅用CPU运行,性能媲美更大系统

0
分享至

在存储驱动大语言模型底层神经网络的数值权重时,大多数现代AI模型依赖于16位或32位浮点数的精度。但这种精度往往会导致巨大的内存占用(最大模型可能需要数百GB内存)以及在响应提示时所需处理复杂矩阵乘法所消耗的大量运算资源。

现今,Microsoft 的 General Artificial Intelligence 团队的研究人员发布了一种全新的神经网络模型,该模型只使用三个不同的权值:-1、0 或 1。在此前 Microsoft Research 于2023年发表的工作基础上,新模型的“ternary”架构降低了整体复杂性,并带来了显著的计算效率优势,使其能够在简单的桌面CPU上高效运行。尽管权重精度大幅降低,研究人员仍宣称该模型“能够在广泛任务中实现与同等规模先进开放权重、全精度模型相媲美的性能”。

关注你的权重

简化模型权重的概念在AI研究中并非全新。多年来,研究人员一直在尝试利用量化技术将神经网络权重压缩至更小的内存空间。近年来,最极端的量化尝试集中于所谓的 “BitNets”,这种方法将每个权重表示为一个Bit ( 表示 +1 或 -1 )。

新的 BitNet b1.58b 模型没有达到那种极端——这种三元系统被称为 “1.58-bit”,因为这是表示三个数值所需的平均位数 ( log(3)/log(2) )。但它通过成为“首个以原生方式、在大规模训练下实现1-bit大语言模型的开源模型”而与以往的研究区别开来,研究人员写道,该模型基于包含4万亿 tokens 的训练数据集构建了一个拥有20亿 tokens 的模型。

这里的“原生”至关重要,因为许多以往的量化尝试只是对使用全精度大浮点数预先训练好的模型进行事后尺寸缩减。研究人员写道,这种训练后量化可能会导致与原始模型相比出现“显著的性能下降”。与此同时,其他原生训练的 BitNet 模型规模较小,“可能尚未达到大型全精度模型的能力”。

规模是否重要?

减少模型内部权重复杂度最明显的优势是降低内存需求。与同等参数规模的其他开放权重模型需要大约2到5GB内存不同,BitNet b1.58 模型仅需0.4GB内存即可运行。

但这种简化的权重系统也使得模型在推理时运行更为高效,其内部操作更多地依赖简单的加法指令,而较少使用计算成本高昂的乘法指令。研究人员估计,这些效率提升使得 BitNet b1.58 模型相比类似的全精度模型,能耗下降了85%到96%。

通过使用专为 BitNet 架构设计的高度优化内核,BitNet b1.58 模型的运行速度也比标准全精度 Transformer 上运行的相似模型快了数倍。研究人员写道,该系统足够高效,单个CPU即可达到“媲美人类阅读速度(每秒5至7个Token)”的速度(你可以在多款ARM和x86 CPU上下载并运行这些优化内核,或通过该网络演示进行体验)。

关键的是,研究人员表示这些改进并未以牺牲在各种测试推理、数学及“知识”能力的基准测试中的性能为代价(尽管这一说法尚未被独立验证)。在多个常见基准测试上的平均结果表明,BitNet“在能力上几乎与同类领先模型持平,同时提供了显著提高的效率”。

尽管内存占用更小,BitNet 在许多基准测试中的表现仍与“全精度”权重模型相似。

尽管这一“概念验证”型 BitNet 模型取得了显著成功,研究人员写道,他们尚未完全理解为什么这种极简化的权重设定能使模型表现如此出色。“深入探讨大规模1-bit训练为何能奏效的理论基础仍然是一个未解之谜,”他们写道。而且,仍需要更多研究使这些 BitNet 模型在整体规模和上下文窗口“记忆”方面与当今最大的模型竞争。

尽管如此,这项新研究展示了一种潜在的替代方案,适用于那些因运行在昂贵且强大的GPU上而面临硬件及能耗飙升问题的AI模型。或许现今的“全精度”模型就像浪费大量能量和资源的肌肉车,而一款精致的小型车也许就能交付类似的效果。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5月29日,人社部公布关于2026年调整退休人员养老金的通知了吗?

5月29日,人社部公布关于2026年调整退休人员养老金的通知了吗?

虎哥闲聊
2026-05-29 14:40:54
今晚,数百人准备在南京路排通宵!消费者:“预想到火爆,没想到比预想的更火爆”

今晚,数百人准备在南京路排通宵!消费者:“预想到火爆,没想到比预想的更火爆”

上海黄浦
2026-05-29 21:57:47
范蠡52岁悟道:和任何人打交道,只要流露出这三点,结局已成定局

范蠡52岁悟道:和任何人打交道,只要流露出这三点,结局已成定局

梦史
2026-05-26 09:52:57
新加坡香会取消了中国专场!李显龙没想到,这次中方不陪他们玩了

新加坡香会取消了中国专场!李显龙没想到,这次中方不陪他们玩了

林子说事
2026-05-30 02:16:09
罚球比投篮多!季后赛只有他两!

罚球比投篮多!季后赛只有他两!

柚子说球
2026-05-29 22:47:45
新加坡香会取消了中国专场!李显龙没料到,这次中方不陪他们玩了

新加坡香会取消了中国专场!李显龙没料到,这次中方不陪他们玩了

娱乐小可爱蛙
2026-05-29 19:46:51
“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

妍妍教育日记
2026-05-29 07:55:13
“女人两个坎,熬过就高寿”“两坎”是指哪两年?男女都要多关注

“女人两个坎,熬过就高寿”“两坎”是指哪两年?男女都要多关注

芹姐说生活
2026-05-29 20:58:00
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
偷走网红狗后续:村民围堵狗主,派人守村口,偷狗人真容曝光社死

偷走网红狗后续:村民围堵狗主,派人守村口,偷狗人真容曝光社死

奇思妙想草叶君
2026-05-28 19:17:55
1969年许世友为王近山求情,毛主席打趣:放虎归山,哪个军区敢要

1969年许世友为王近山求情,毛主席打趣:放虎归山,哪个军区敢要

磊子讲史
2026-05-26 18:56:24
第31届白玉兰惹众怒!赵丽颖再次陪跑,李庚希黄晓明全被无视

第31届白玉兰惹众怒!赵丽颖再次陪跑,李庚希黄晓明全被无视

子芫伴你成长
2026-05-28 00:05:34
股市大跌歌 笑出眼泪 股民真哭晕

股市大跌歌 笑出眼泪 股民真哭晕

姜子说书
2026-05-29 16:25:24
A股:紧急提醒2.5亿股民!从6月1日起,下周A股或将来迎牛低头行情?

A股:紧急提醒2.5亿股民!从6月1日起,下周A股或将来迎牛低头行情?

风风顺
2026-05-30 00:35:03
江苏通报“幼儿园教师用热熔胶烫伤小女孩”:涉事教师已被停职

江苏通报“幼儿园教师用热熔胶烫伤小女孩”:涉事教师已被停职

闪电新闻
2026-05-29 19:33:40
2亿灵活就业者,正在集体放弃社保:不是不想养老,是真的赌不起

2亿灵活就业者,正在集体放弃社保:不是不想养老,是真的赌不起

职场资深秘书
2026-05-29 15:54:56
海参崴军装闹剧:谁在借“红军符号”操弄历史?幕后黑手必须揪出

海参崴军装闹剧:谁在借“红军符号”操弄历史?幕后黑手必须揪出

律法刑道
2026-05-27 15:12:23
师奶大波浪,接棒省花,看谁像像,我顶了!

师奶大波浪,接棒省花,看谁像像,我顶了!

贵圈真乱
2026-05-29 15:02:16
在埃及的7天,我终于明白了:为什么都是埃及是“地狱”

在埃及的7天,我终于明白了:为什么都是埃及是“地狱”

复转这些年
2026-05-27 16:37:32
金融危机要来?专家预测,2026到2027上半年,世界将爆发金融风暴

金融危机要来?专家预测,2026到2027上半年,世界将爆发金融风暴

洛川融媒科技
2026-05-29 17:40:06
2026-05-30 04:40:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18867文章数 49707关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

游戏
手机
时尚
旅游
军事航空

Sky&Infi领衔参赛!2026 GG全能王赛重磅开启,7月线下决战

手机要闻

自研OS+玄戒+AI大模型,小米18系列,稳了!

推广中奖名单-更新至2026年4月28日推广

旅游要闻

云南文旅数智升级,旅游小镇游客满意度提升超过30%

军事要闻

中方公布参加香会阵容 几大议题受到关注

无障碍浏览 进入关怀版