网易首页 > 网易号 > 正文 申请入驻

PrismML发布1-bit LLM模型家族,走出隐身模式

0
分享至

随着内存限制和能源成本正考验着AI扩展的极限,压缩正成为业界最活跃的研究领域之一。谷歌最新发布的TurboQuant针对的是键值缓存——推理过程中最耗内存的组件之一(延展阅读:)。而现在,一家新创公司正致力于压缩模型本身。


PrismML由加州理工学院研究人员创立,已走出隐身模式,获得1625万美元种子轮融资,并开源发布了其所谓的"1-bit"大语言模型家族。公司称其方法可以显著减少模型大小和能耗,同时保持与标准16-bit模型相当的性能。

Bonsai模型家族的旗舰模型是Bonsai 8B,一个在谷歌v4 TPU上训练的80亿参数模型。据PrismML介绍,该模型在MMLU Redux、MuSR、GSM8K、HumanEval+、IFEval和BFClv3等基准测试套件中表现不俗,但内存占用仅约1GB,而同等规模的典型16-bit模型约需16GB。PrismML还发布了1-bit Bonsai 4B和1.7B模型,内存占用分别为0.5GB和0.24GB。

PrismML表示,其模型实现了端到端的完全二值化,所有权重在嵌入层、注意力层和MLP块中都被约束为单个比特,"没有任何高精度逃生通道"。虽然量化技术已被广泛使用,但将整个网络推至1-bit历来会降低模型质量,尤其是在推理任务上。公司将其成果归功于在加州理工学院开发的新数学框架,但尚未详细说明训练方法或稳定技术。


PrismML CEO、加州理工学院计算机科学家和数学家Babak Hassabi将这种方法描述为AI的新范式,能够适应多样化的硬件环境。"我们花了数年时间开发压缩神经网络而不损失推理能力所需的数学理论,"Hassibi在一份声明中说,"我们将1-bit视为起点,而非终点。"

公司声称其1-bit模型在现有硬件上可实现高达8倍的加速,能耗降低75-80%。PrismML还预测,未来针对1-bit操作优化的硬件可通过用更简单的算术运算替代复杂的乘法,进一步提高效率。

参与种子轮的Khosla Ventures公司的Vinod Khosla将这项工作描述为"数学突破",有潜力重塑AI系统的部署方式。"AI的未来不由谁能建造最大的数据中心来定义,而将由谁能以单位能源和成本提供最多智能来定义。PrismML代表了这种突破,"他在声明中说。

这一观点反映了AI不会局限在数据中心,而是将部署在边缘设备和本地环境的理念。PrismML表示其模型设计用于在消费级和边缘设备上运行,可能在智能手机、可穿戴设备和机器人中实现更强大的AI应用,而无需依赖云端基础设施。

PrismML关于全1-bit模型能匹敌高精度系统能力的声明,尚需在公司自有基准结果之外得到验证。极端量化技术历来难以在复杂推理任务中保持准确性。独立的第三方基准测试和实际部署将是判定PrismML方法代表真正突破还是有限优化的关键。

在一篇博客文章中,PrismML描述了所谓的"智能密度",这一指标试图衡量模型在单位大小下提供多少能力。公司表示,其1-bit模型重新定义了模型大小与性能之间的权衡,以极小的占用保持了竞争力。不过,该指标取决于公司的基准选择和定义本身,尚未得到独立验证。


目前,此次发布是效率驱动AI设计的又一个例子,业界正在寻找模型规模和基础设施成本不断攀升的替代方案。虽然谷歌TurboQuant等近期研究专注于压缩推理的特定组件,但PrismML雄心勃勃的模型压缩可能大大扩展AI模型可以实际运行的范围及其部署方式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
iPhone 17 Pro Max拍回1.2亿公里外的地球

iPhone 17 Pro Max拍回1.2亿公里外的地球

Ping值焦虑
2026-04-06 00:00:12
郑丽文访陆受高规格礼待,随行的13人,各个身份不简单

郑丽文访陆受高规格礼待,随行的13人,各个身份不简单

石江月
2026-04-07 17:09:01
两段婚姻,半生传奇:女首富陈丽华的风雨人生与跨界坚守

两段婚姻,半生传奇:女首富陈丽华的风雨人生与跨界坚守

华夏女子图鉴治愈自己
2026-04-07 20:50:21
陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

陈丽华公司曝离世内幕!对迟重瑞称呼暴露真实关系,遗言看哭众人

一盅情怀
2026-04-07 16:21:17
王府井东方新天地上新“全球排队王”,开业还送黄金?有店曾排10小时

王府井东方新天地上新“全球排队王”,开业还送黄金?有店曾排10小时

北京商报
2026-04-07 14:59:55
热火连续四年附加赛!召开内部会议气氛紧张 热巴3单斯波直言沮丧

热火连续四年附加赛!召开内部会议气氛紧张 热巴3单斯波直言沮丧

颜小白的篮球梦
2026-04-08 11:26:41
大陆最高规格礼遇,郑丽文接下鲜花,坐高铁到南京前,她喊出12字

大陆最高规格礼遇,郑丽文接下鲜花,坐高铁到南京前,她喊出12字

共工之锚
2026-04-08 00:12:42
太美了!张雪机车女员工与老板合影走红网络,称入职就是为他而来

太美了!张雪机车女员工与老板合影走红网络,称入职就是为他而来

火山詩话
2026-04-07 09:10:03
23岁郑钦文再受伤!宣布退赛+归期未定 已跌至世界37名+排国内第2

23岁郑钦文再受伤!宣布退赛+归期未定 已跌至世界37名+排国内第2

风过乡
2026-04-08 05:36:29
22岁女学生被拐到深山乡村里,看到买她那户人家时,人贩子傻眼了

22岁女学生被拐到深山乡村里,看到买她那户人家时,人贩子傻眼了

卡西莫多的故事
2025-12-07 10:41:11
女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

另子维爱读史
2026-03-10 22:56:08
不说话,不吃植入零食,偶像包袱又重,他上《五哈6》干嘛来了?

不说话,不吃植入零食,偶像包袱又重,他上《五哈6》干嘛来了?

往史过眼云烟
2026-04-05 16:45:07
《拯救大兵瑞恩2026版》中的那些“百思不得其解”

《拯救大兵瑞恩2026版》中的那些“百思不得其解”

百味朱砂
2026-04-07 10:54:47
第3位被追加禁赛的中超巨星:米特里策停赛或损失超300万!

第3位被追加禁赛的中超巨星:米特里策停赛或损失超300万!

邱泽云
2026-04-07 23:31:47
截胡!曼联转会神操作,4400 万捡世界级中场

截胡!曼联转会神操作,4400 万捡世界级中场

澜归序
2026-04-08 05:19:04
反转!张雪机车LOGO 陷相似争议,网友神评:难怪说LOGO是送的!

反转!张雪机车LOGO 陷相似争议,网友神评:难怪说LOGO是送的!

LOGO研究所
2026-04-06 11:40:58
王励勤动真格的!已敲定伦敦参赛名额,樊振东、陈梦最终去向彻底揭晓

王励勤动真格的!已敲定伦敦参赛名额,樊振东、陈梦最终去向彻底揭晓

慢歌轻步谣
2026-04-08 07:09:08
郑丽文去慈湖谒陵,两地距离40公里有高速有高铁,她出行方便

郑丽文去慈湖谒陵,两地距离40公里有高速有高铁,她出行方便

老呶侃史
2026-04-02 18:56:58
985女大学生嫁农民工,婚礼亲戚无一到场,生下双胞胎后崩溃发疯

985女大学生嫁农民工,婚礼亲戚无一到场,生下双胞胎后崩溃发疯

就一点
2026-04-07 16:02:35
库里FMVP率全历史垫底?25%扎心数字撕开NBA最大黑幕

库里FMVP率全历史垫底?25%扎心数字撕开NBA最大黑幕

茅塞盾开本尊
2026-04-07 13:50:54
2026-04-08 12:36:49
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1701文章数 511关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

午评:创业板指半日涨4.81% 全市场超5000只个股上涨

头条要闻

午评:创业板指半日涨4.81% 全市场超5000只个股上涨

体育要闻

皇马1.5亿巨星浪费超级单刀 丢球摊手抱怨

娱乐要闻

杨颖邓超低调现身观众席 支持陈赫话剧

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

汽车要闻

5门5座/新复古造型 缤果Pro将于4月14日开启预售

态度原创

游戏
家居
房产
时尚
公开课

星露谷制作人称深受塞尔达启发:现代3A难寻创意!

家居要闻

自在恣意 侘寂风别墅

房产要闻

千亿双国企,定序主城第一大盘!三亚买房逻辑变了!

阔腿裤失宠了?今年这几条裤子最时髦!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版