网易首页 > 网易号 > 正文 申请入驻

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

0
分享至

BiLLM团队 发自 凹非寺
量子位 | 公众号 QbitAI

极限量化,把每个参数占用空间压缩到1.1bit

IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。

通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。如何把模型变得小巧经济实惠,能塞进手机等设备中?

BiLLM解决的正是这样的一个问题。它使用1bit来近似网络中的大多数参数,使用2bit来表示一些对性能最有影响的权重。

实验测试中,研究人员对OPT模型、Llama系列进行了二值化。

在OPT模型家族上,BiLLM以1.1bit的平均权重大小实现了目前最极限的LLM训练后压缩;在Llama系列模型上,BiLLM在1.08bit下的表现甚至超过了使用全精度的OPT-66B模型。

效率方面,BiLLM能够在单个GPU上半小时内完成7B LLM的二值化。

BiLLM发布当天,便引发了网友对大模型优化的热议,有网友就表示:

量化不是没有代价。Llama3模型的量化效果比Llama2模型要差,量化过程中的质量损失更大。
直觉是,一个训练不足的模型受到量化的影响较小,因为其训练过程并没有充分利用每一个权重。关于Llama的一个关键发现,以及它为何能在其大小范围内表现出色,是因为它们在比文献中所谓的“最佳”状态更大的数据集上训练了更长时间。
综合这些因素,似乎可以得出以下结论:小型模型、大量数据、长时间训练>大型模型+量化。基本上,量化是一种用于缩短长时间训练的损失性的捷径。数据的数量和质量,一如既往是所有这些中最重要。

这项研究由香港大学、苏黎世联邦理工学院、北京航空航天大学联合推出,目前已被ICML 2024接收。

量子位也联系到了作者,给大伙儿解读一下。

LLM权重分布探究

为了应对超低位宽下大语言模型的能力崩溃问题,研究人员对多个预训练大语言模型的权重和其Hessian矩阵(损失的二阶梯度)分布情况进行了初步研究,得到以下观察:

首先,研究人员发现大语言模型的Hessian矩阵表现出极端的长尾分布特性

这也意味着大多数位置权重的变化对模型的输入输出并不敏感,而少部分元素对于权重的输出非常敏感。

其次,大语言模型中的权重密度遵循不均匀的钟形分布形式

这种钟形分布在特征方面与高斯分布或拉普拉斯分布非常相似,即大多数权重集中在0附近,整体呈现非均匀的钟形分布。

上述观察表明大多数权重在LLM当中是冗余的,而少部分权重发挥着极其重要的作用;同时,在极端的二值化压缩场景下,这种非均匀钟形分布会产生更大的量化误差。

对此,研究人员对少部分显著权重和大部分非显著权重分别提出了二阶残差逼近和最优钟形分组方法进行量化,在1.1bit的权重下首次实现了LLM的性能保证。

△LLM权重分布现象

显著权重:二阶残差逼近

研究人员发现,显著权重往往积聚在特定的通道当中。

因此, BiLLM采用一种通道级别的分组方式来区分显著权重和非显著权重。这种结构化划分相比于非结构化处理引入的开销可以忽略不计,对硬件部署十分友好。

△显著通道权重二阶残差逼近示意图

由于显著权重的重要性,先前工作往往直接将这部分权重保存为原精度或量化到8-bit来保证LLM的性能。然而,这种方式会导致整体位宽的增加。

为此,研究人员开发了一种用二值化残差逼近方法作用于显著通道的权重。

这一方法通过直接二值化和残差二值化有效降低了显著权重的极端量化误差。与直接保留显着权值为16位或者8位相比,该方法仅通过2位开销存储显着权值,同时有效保护了权重中的重要元素。

非显著权重:最优钟形划分

由于显着通道数量极低,剩余的大部分权重仍然保持着钟形分布。

同时,在排除显着权重影响的情况下变得更加对称。由于二进制量化代表均匀量化的极端形式,直接将钟形分布下的权重舍入到二值权重会带来巨大的的量化误差。

因此研究人员对这部分权重采用了分组二值化的方式,通过自动搜索策略寻找最优的分割点。

此外,研究结果表明,尽管非显着权重并非理想的高斯分布或拉普拉斯分布,但搜索函数的误差曲线仍然表现出凸性,证实了最佳分割点的存在。

△非显著权重分布搜索(左),搜索误差曲线的凸性(右)

同时由于外侧分组的数值方差较大,搜索中总是以较小的比例出现(0.5%~3%)。可以进一步采用稀疏行压缩的策略来进行分组标识,进一步提升细粒度分组方案下的硬件友好性。

实验结果

研究团队在OPT和Llama系列模型上验证了BiLLM性能。此外,考虑到LLM通常需要基于指令进行微调以适应不同的应用环境,实验还报告了Vicuna-7B和Vicuna-13B的量化结果。

BiLLM在平均1.1bit权重时,在多个评价指标上实现了超过GPTQ,PB-LLM等方法在2-bit时的性能,同时在部分模型体积上接近3-bit权重的性能。

结果表明, BiLLM 率先在接近1位的平均比特率下实现了LLM性能保证,推动了LLM无训练量化的边界。

△opt系列困惑度对比结果

△Llama系列困惑度对比结果

△Zero-Shot评测数据集对比结果

BiLLM在Llama-13B和Vicuna-7B上实现了更好对话效果。

论文链接:https://arxiv.org/abs/2402.04291

参考链接:
[1]https://spectrum.ieee.org/1-bit-llm
[2]https://news.ycombinator.com/item?id=40529355

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
出生人口只剩792万,巨大的连锁反应,才刚刚开始

出生人口只剩792万,巨大的连锁反应,才刚刚开始

贩财局
2026-01-19 21:10:54
李亚鹏直播间被“砸场子”!砸场的不是别人,是他亲闺女窦靖童!

李亚鹏直播间被“砸场子”!砸场的不是别人,是他亲闺女窦靖童!

乐悠悠娱乐
2026-01-19 10:00:18
纳尼:C罗就算去世界最低级别联赛,也会踢到1000球为止!

纳尼:C罗就算去世界最低级别联赛,也会踢到1000球为止!

氧气是个地铁
2026-01-19 20:19:27
CCTV5直播!中国队大战越南前,获一个好消息,有利于晋级决赛

CCTV5直播!中国队大战越南前,获一个好消息,有利于晋级决赛

侃球熊弟
2026-01-19 10:45:17
机龄超30年!俄罗斯启老旧飞机修复计划,波音747拟重投使用

机龄超30年!俄罗斯启老旧飞机修复计划,波音747拟重投使用

老马拉车莫少装
2026-01-19 23:42:41
央视曝光“毒铁锅”,用它炒菜,美食变“毒药”,很多人还在用!

央视曝光“毒铁锅”,用它炒菜,美食变“毒药”,很多人还在用!

阿纂看事
2026-01-17 09:41:12
香港最乖富二代邓兆尊,27年不动本金,利息滚到17亿,太清醒

香港最乖富二代邓兆尊,27年不动本金,利息滚到17亿,太清醒

牛牛叨史
2026-01-18 22:43:20
狠戳美国肺管子!中国留学生72小时极限逃亡,西方彻底破防...

狠戳美国肺管子!中国留学生72小时极限逃亡,西方彻底破防...

毛豆论道
2026-01-17 17:45:48
“富婆”李湘栽了:这20年的钱,她到底赚得有多野?

“富婆”李湘栽了:这20年的钱,她到底赚得有多野?

红大娘娱乐
2026-01-18 17:20:47
为什么现在大佬的饭局,后半场不去KTV,而是要打掼蛋?

为什么现在大佬的饭局,后半场不去KTV,而是要打掼蛋?

时尚的弄潮
2026-01-19 00:15:51
为什么外国人不怕冷?网友:一桶3000片的布洛芬见过吗?

为什么外国人不怕冷?网友:一桶3000片的布洛芬见过吗?

夜深爱杂谈
2026-01-18 19:47:44
“i茅台”连续19天秒空,代抢软件出现了,黄牛称可“提前入场”

“i茅台”连续19天秒空,代抢软件出现了,黄牛称可“提前入场”

第一财经资讯
2026-01-19 15:52:13
269元!小米新品又卖爆了,一个搞定华为、苹果全家桶

269元!小米新品又卖爆了,一个搞定华为、苹果全家桶

雷科技
2026-01-19 16:21:53
曝U23国足进决赛可获8100万奖金:正式比赛从未输越南 曾2场赢7-0

曝U23国足进决赛可获8100万奖金:正式比赛从未输越南 曾2场赢7-0

风过乡
2026-01-19 20:55:41
李湘被质疑利用王诗龄洗钱,其画成为她工具,与大和尚黑历史被挖

李湘被质疑利用王诗龄洗钱,其画成为她工具,与大和尚黑历史被挖

花哥扒娱乐
2026-01-19 20:15:26
经纪人回应梁小龙去世原因:他不喝酒,不是睡梦中心梗

经纪人回应梁小龙去世原因:他不喝酒,不是睡梦中心梗

红星新闻
2026-01-19 21:36:00
北京下了死命令,2027年底前,所有中小学必须告别“校外配餐”

北京下了死命令,2027年底前,所有中小学必须告别“校外配餐”

古事寻踪记
2026-01-19 07:09:23
美专家:中国人不可怕,可怕的是他们买光刻机却不是用来生产芯片

美专家:中国人不可怕,可怕的是他们买光刻机却不是用来生产芯片

肖兹探秘说
2026-01-14 20:41:32
护士长曝光李亚鹏感人细节!医院早没钱了,却硬不裁员,不停手术

护士长曝光李亚鹏感人细节!医院早没钱了,却硬不裁员,不停手术

谈史论天地
2026-01-18 13:23:55
女儿发文悼念聂卫平!他一次能喝4斤白酒,女儿帮他戒酒

女儿发文悼念聂卫平!他一次能喝4斤白酒,女儿帮他戒酒

北纬的咖啡豆
2026-01-17 19:24:39
2026-01-20 00:23:00
量子位 incentive-icons
量子位
追踪人工智能动态
12032文章数 176360关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

除吴孟达、梁小龙外 十多位周星驰电影中的配角已离世

头条要闻

除吴孟达、梁小龙外 十多位周星驰电影中的配角已离世

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

手机
本地
数码
公开课
军事航空

手机要闻

REDMI官宣Turbo 5 Max续航耐力赛,升级9000mAh电池

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

数码要闻

荣耀手表GS 5发布:行业独家防猝筛查、23天蓝牙续航,699元

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

古美关系高度紧张 古巴启动"战争状态"

无障碍浏览 进入关怀版