网易首页 > 网易号 > 正文 申请入驻

微软推出仅需CPU运行的"1位"AI模型,性能比肩大型系统

0
分享至

未来AI或无需超级计算机,BitNet b1.58 2B4T模型开启新可能

当前主流AI模型普遍采用16位或32位浮点数存储神经网络权重参数,但这种高精度方案需要付出巨大代价:最大模型的存储需求可达数百GB,响应查询时复杂的矩阵运算更需消耗海量算力。

微软通用人工智能研究组最新发布的神经网络模型颠覆了这一范式,仅用-1、0、1三个整数值存储权重。这项基于微软研究院2023年成果的"三元"架构不仅大幅降低计算复杂度,更在计算效率上实现"质的飞跃",研究人员表示该模型"在普通桌面CPU上即可高效运行"。尽管权重精度急剧下降,但团队宣称其"在多数任务中能与同规模全精度开源模型平分秋色"。

权重精简之路

权重简化并非全新概念。过去数年,量化技术持续探索如何将神经网络权重压缩至更小内存空间。近年来,最激进的量化尝试聚焦于"BitNet"架构,用单比特(+1/-1)表示每个权重。

新型BitNet b1.58模型虽未采用单比特方案,但其三元系统被称作"1.58位"(因log(3)/log(2)=1.58)。该模型的突破性在于:作为"首个开源原生1位大语言模型",其基于4万亿token训练集构建出20亿参数规模。研究人员强调"原生"特质——传统量化技术仅对全精度预训练模型进行后处理压缩,往往导致"性能显著劣化";而原生训练的BitNet模型此前规模有限,"尚无法与大型全精度模型抗衡"。

小身材大能量

权重简化最直观优势在于内存占用:BitNet b1.58仅需0.4GB内存,而同等参数规模的全精度模型需2-5GB。

简化的权重体系还带来推理效率革命。模型运算更多依赖加法指令,而非计算密集型乘法。研究人员估算,相比全精度模型,BitNet b1.58能耗降低85%-96%。通过专为BitNet架构优化的内核程序,其运行速度可达传统全精度transformer的数倍。团队表示,在单CPU环境下,模型"可达到接近人类阅读速度(每秒5-7个token)"(用户可下载针对ARM/x86 CPU的优化内核程序,或通过网页演示体验)。

在数学推理、知识测试等基准评估中,BitNet平均表现"接近同规模顶尖模型"。不过该结论尚未获得独立验证。

未解之谜

尽管概念验证成功,研究人员坦言尚未完全理解三元权重体系的理论基础:"大规模1位训练的有效性机制仍是未解之谜。"要让BitNet模型在参数量级和上下文窗口上比肩当今最大模型,仍需深入研究。

这项研究为应对GPU硬件与能耗成本飙升提供了新思路。当前全精度模型如同高油耗肌肉跑车,而BitNet或许预示着"经济型轿车"时代——用更少能耗实现相近性能。未来AI模型的演进方向,或将因这项突破发生根本性转变。

关注【黑客联盟】带你走进神秘的黑客世界

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他是水浒中最早看穿宋江的人,借探母之名离开,成结局最圆满的人

他是水浒中最早看穿宋江的人,借探母之名离开,成结局最圆满的人

如烟若梦
2025-11-11 16:43:55
山东队夺得全运会乒乓球女团冠军,孙颖莎收获两银,“人生总要留有遗憾”

山东队夺得全运会乒乓球女团冠军,孙颖莎收获两银,“人生总要留有遗憾”

上观新闻
2025-11-20 04:57:07
叫嚣要出兵台海后,高市早苗迎来外援,解放军一定要做好万全准备

叫嚣要出兵台海后,高市早苗迎来外援,解放军一定要做好万全准备

老黯谈娱
2025-11-20 03:15:48
部门裁员50人匿名互投,我投自己想拿钱走人,结果另外49票都是我

部门裁员50人匿名互投,我投自己想拿钱走人,结果另外49票都是我

二十一号故事铺
2025-11-17 18:00:09
韩星红毯眼前一黑!孙艺珍不仙了,玄彬像被牛舔了,宋慧乔不演了

韩星红毯眼前一黑!孙艺珍不仙了,玄彬像被牛舔了,宋慧乔不演了

可乐谈情感
2025-11-20 06:10:41
我们忘了汉语,但唯独不敢忘祖先是中国人,琉球亡国146年血泪史

我们忘了汉语,但唯独不敢忘祖先是中国人,琉球亡国146年血泪史

文史道
2025-11-19 13:02:02
特朗普举办白宫晚宴,特意留步拍马斯克肚子打招呼,并大夸赴宴的C罗:光是介绍你,我就觉得特别荣幸

特朗普举办白宫晚宴,特意留步拍马斯克肚子打招呼,并大夸赴宴的C罗:光是介绍你,我就觉得特别荣幸

极目新闻
2025-11-19 12:14:11
上位靠睡、赶走原配!刚拿金鸡奖影后的宋佳,私生活传闻有多离谱

上位靠睡、赶走原配!刚拿金鸡奖影后的宋佳,私生活传闻有多离谱

萧鑟科普解说
2025-11-18 10:02:39
终于有个日本将军,把窗户纸给捅破了:再打仗,日本可能就没了

终于有个日本将军,把窗户纸给捅破了:再打仗,日本可能就没了

李子橱
2025-11-06 21:30:03
台军老兵叮嘱儿子:如果两岸开战,一枪干掉让你冲锋的长官!

台军老兵叮嘱儿子:如果两岸开战,一枪干掉让你冲锋的长官!

浩渺青史
2025-11-17 16:56:51
小泉进次郎最新表态

小泉进次郎最新表态

环球时报新闻
2025-11-19 14:57:20
章泽天婚变传闻仅10天,31岁高调官宣喜讯,喜结良缘终成真

章泽天婚变传闻仅10天,31岁高调官宣喜讯,喜结良缘终成真

何嗀爱捕渔
2025-11-18 19:00:17
45金!41金!39金!19日凌晨全运会最新金牌榜:山东+江苏单日3金

45金!41金!39金!19日凌晨全运会最新金牌榜:山东+江苏单日3金

大秦壁虎白话体育
2025-11-19 09:41:19
福建一事业单位,改制更名!

福建一事业单位,改制更名!

海峡网
2025-11-19 21:38:35
顶流小生人设崩塌!私底下竟是圈内玩咖,手段惊人……

顶流小生人设崩塌!私底下竟是圈内玩咖,手段惊人……

毒舌八卦
2025-11-17 23:05:50
王清海教授:陈皮和它是绝配!常喝血脂降了,斑块没了,血管通了

王清海教授:陈皮和它是绝配!常喝血脂降了,斑块没了,血管通了

蜡笔小小子
2025-11-08 14:18:03
禁止所有中国外交官入境,不让两岸统一,这个国家比美国还要嚣张

禁止所有中国外交官入境,不让两岸统一,这个国家比美国还要嚣张

文史旺旺旺
2025-11-19 20:52:03
意外!U22国足已对汪士钦进行内部处罚,本人为此做出重要决定

意外!U22国足已对汪士钦进行内部处罚,本人为此做出重要决定

无意争春
2025-11-19 16:54:42
我国收回南海最大岛礁,面积8000平方公里,曾被美、菲合力抢夺

我国收回南海最大岛礁,面积8000平方公里,曾被美、菲合力抢夺

博览历史
2025-09-26 21:10:45
贵州广东高校大洗牌,名字改得让人摸不着头脑,背后全是地方算盘

贵州广东高校大洗牌,名字改得让人摸不着头脑,背后全是地方算盘

特特农村生活
2025-11-20 00:34:01
2025-11-20 06:51:00
黑客联盟I
黑客联盟I
免费、开源、自由……
347文章数 1064关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

艺术
房产
游戏
公开课
军事航空

艺术要闻

周恩来夫妇珍贵合影集,太难得一见!

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

我的小众XP,在“玩法正确”面前一无是处?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版