网易首页 > 网易号 > 正文 申请入驻

微软推出仅需CPU运行的"1位"AI模型,性能比肩大型系统

0
分享至

未来AI或无需超级计算机,BitNet b1.58 2B4T模型开启新可能

当前主流AI模型普遍采用16位或32位浮点数存储神经网络权重参数,但这种高精度方案需要付出巨大代价:最大模型的存储需求可达数百GB,响应查询时复杂的矩阵运算更需消耗海量算力。

微软通用人工智能研究组最新发布的神经网络模型颠覆了这一范式,仅用-1、0、1三个整数值存储权重。这项基于微软研究院2023年成果的"三元"架构不仅大幅降低计算复杂度,更在计算效率上实现"质的飞跃",研究人员表示该模型"在普通桌面CPU上即可高效运行"。尽管权重精度急剧下降,但团队宣称其"在多数任务中能与同规模全精度开源模型平分秋色"。

权重精简之路

权重简化并非全新概念。过去数年,量化技术持续探索如何将神经网络权重压缩至更小内存空间。近年来,最激进的量化尝试聚焦于"BitNet"架构,用单比特(+1/-1)表示每个权重。

新型BitNet b1.58模型虽未采用单比特方案,但其三元系统被称作"1.58位"(因log(3)/log(2)=1.58)。该模型的突破性在于:作为"首个开源原生1位大语言模型",其基于4万亿token训练集构建出20亿参数规模。研究人员强调"原生"特质——传统量化技术仅对全精度预训练模型进行后处理压缩,往往导致"性能显著劣化";而原生训练的BitNet模型此前规模有限,"尚无法与大型全精度模型抗衡"。

小身材大能量

权重简化最直观优势在于内存占用:BitNet b1.58仅需0.4GB内存,而同等参数规模的全精度模型需2-5GB。

简化的权重体系还带来推理效率革命。模型运算更多依赖加法指令,而非计算密集型乘法。研究人员估算,相比全精度模型,BitNet b1.58能耗降低85%-96%。通过专为BitNet架构优化的内核程序,其运行速度可达传统全精度transformer的数倍。团队表示,在单CPU环境下,模型"可达到接近人类阅读速度(每秒5-7个token)"(用户可下载针对ARM/x86 CPU的优化内核程序,或通过网页演示体验)。

在数学推理、知识测试等基准评估中,BitNet平均表现"接近同规模顶尖模型"。不过该结论尚未获得独立验证。

未解之谜

尽管概念验证成功,研究人员坦言尚未完全理解三元权重体系的理论基础:"大规模1位训练的有效性机制仍是未解之谜。"要让BitNet模型在参数量级和上下文窗口上比肩当今最大模型,仍需深入研究。

这项研究为应对GPU硬件与能耗成本飙升提供了新思路。当前全精度模型如同高油耗肌肉跑车,而BitNet或许预示着"经济型轿车"时代——用更少能耗实现相近性能。未来AI模型的演进方向,或将因这项突破发生根本性转变。

关注【黑客联盟】带你走进神秘的黑客世界

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江苏科技大学被骗惨了:高中生成头牌教授,还想参评院士

江苏科技大学被骗惨了:高中生成头牌教授,还想参评院士

上峰视点
2025-11-19 11:04:22
6亿成本拖了8年,《美人鱼2》烂尾,华谊连亏5年,周星驰也很无奈

6亿成本拖了8年,《美人鱼2》烂尾,华谊连亏5年,周星驰也很无奈

电影票房预告片
2025-11-19 23:17:51
没想到,高市早苗涉华言论风波没完,矢野浩二因一个举动口碑暴涨

没想到,高市早苗涉华言论风波没完,矢野浩二因一个举动口碑暴涨

负面黑洞
2025-11-19 15:04:06
日本电视台:中方罕见举动,清楚表明“14亿中国人很愤怒”

日本电视台:中方罕见举动,清楚表明“14亿中国人很愤怒”

互联网大观
2025-11-19 14:46:51
南极游发全员信引吐槽,俞敏洪乘坐的邮轮被曝入住价最高约148万元

南极游发全员信引吐槽,俞敏洪乘坐的邮轮被曝入住价最高约148万元

界面新闻
2025-11-19 10:20:20
善恶终有报,57岁央视女主持王小丫,原来早已经走上另一条大路

善恶终有报,57岁央视女主持王小丫,原来早已经走上另一条大路

梦录的西方史话
2025-10-29 15:48:51
已确认是张颂文!从车祸现场离去后被官媒报道,高群书果然没说错

已确认是张颂文!从车祸现场离去后被官媒报道,高群书果然没说错

鹿楠
2025-11-18 22:45:03
前日军退将曾扬言:若不考虑弹道导弹,日本海自一周全歼中国舰队

前日军退将曾扬言:若不考虑弹道导弹,日本海自一周全歼中国舰队

不掉线电波
2025-11-19 16:31:08
近一年5.1万家咖啡店倒闭!刚入冬就有大批门店“阵亡”

近一年5.1万家咖啡店倒闭!刚入冬就有大批门店“阵亡”

赢商网新媒体
2025-11-18 21:19:09
社评:日方若不纠正错误,必将承受更重代价

社评:日方若不纠正错误,必将承受更重代价

环球网资讯
2025-11-20 00:50:11
杀疯了!特斯拉起诉30多家中国企业:只讲法律不讲情?

杀疯了!特斯拉起诉30多家中国企业:只讲法律不讲情?

雷科技
2025-11-19 22:42:35
越南高颜值女子柬埔寨劫狱引关注

越南高颜值女子柬埔寨劫狱引关注

扬子晚报
2025-11-19 22:37:57
中方舰队刚进钓鱼岛,日本采取行动,不到24小时,美方下场搅局

中方舰队刚进钓鱼岛,日本采取行动,不到24小时,美方下场搅局

博览历史
2025-11-19 18:36:57
“内部信”风波后,疯狂英语创始人李阳喊话俞敏洪:灌鸡汤不如“一句鸡汤给员工100块钱”

“内部信”风波后,疯狂英语创始人李阳喊话俞敏洪:灌鸡汤不如“一句鸡汤给员工100块钱”

极目新闻
2025-11-19 12:57:02
重磅:四川男篮联名讨薪引发热议:全运会为何一掷千金

重磅:四川男篮联名讨薪引发热议:全运会为何一掷千金

姜大叔侃球
2025-11-19 12:06:07
重磅:莫斯科再遭大规模空袭!俄罗斯最大机场被迫关闭

重磅:莫斯科再遭大规模空袭!俄罗斯最大机场被迫关闭

项鹏飞
2025-11-19 19:27:42
严重违纪违法,张富伦被开除党籍

严重违纪违法,张富伦被开除党籍

鲁中晨报
2025-11-20 07:51:04
国家有难时,请交出你的美元和黄金

国家有难时,请交出你的美元和黄金

霹雳炮
2025-11-19 22:39:39
还想淡化?日媒最新爆料

还想淡化?日媒最新爆料

环球时报国际
2025-11-19 22:09:33
世界太魔幻,高中学历骗子成我国大学首席科学家,学术圈怎么了?

世界太魔幻,高中学历骗子成我国大学首席科学家,学术圈怎么了?

李将平老师
2025-11-18 20:28:43
2025-11-20 08:31:01
黑客联盟I
黑客联盟I
免费、开源、自由……
347文章数 1064关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日本首次出口具有杀伤力武器 专家:危险信号

头条要闻

日本首次出口具有杀伤力武器 专家:危险信号

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

家居
游戏
艺术
公开课
军事航空

家居要闻

水岸美学 书香人文生活

我的小众XP,在“玩法正确”面前一无是处?

艺术要闻

周恩来夫妇珍贵合影集,太难得一见!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版