网易首页 > 网易号 > 正文 申请入驻

加州理工学院研究人员声称可对高保真AI模型进行颠覆性压缩

0
分享至

来源:环球市场播报

  加州理工学院的电脑科学家兼数学家巴巴克·哈西比(Babak Hassibi)领导的一个研究团队表示,他们已经创建了一款大语言模型,可以在不影响性能的情况下大幅压缩模型大小。

  这家名为PrismML的公司周二结束隐身模式,并将其1-bit技术模型开源,供他人使用。

  哈西比表示,PrismML开发了一种极致的压缩技术,既能让AI在手机、笔记本电脑和其他设备上本地运行,也能助力数据中心的建设,使其能用更少的资源完成更多任务,并避免能源成本的急剧膨胀。

  该公司的首席执行官哈西比说:“我们花费了数年时间来发展压缩神经网络而不损失其推理能力所需的数学理论。”他还说:“我们正在为AI创造一种新的范式:一种能够适应不同硬件环境,并在每单位计算和能源下提供最大智能的范式。”

  其他同样来自加州理工学院的联合创始人包括萨欣·拉莱(Sahin Lale)、奥米德·普拉赞迪(Omead Pooladzandi)和雷扎·萨德里(Reza Sadri),后者同时也是公司战略副总裁。

  哈西比说,该知识产权归加州理工学院所有,PrismML是唯一的独家被许可方。

  该公司在SAFE和种子轮融资中筹集了1625万美元,投资者包括Khosla Ventures、Cerberus Capital和加州理工学院。SAFE即未来股权简单协议(Simple Agreement for Future Equity),指投资者向初创公司提供资金,以换取未来获得股权的权利。

  投资人维诺德·科斯拉(Vinod Khosla)认为,AI的未来不由谁能建起最大的数据中心来定义,而是由谁能在每单位能源和成本下提供最大的智能来决定。科斯拉说:“所以这并非一次小小的迭代,而是一项重大的技术突破。这是一项数学上的突破,而不仅仅是又一个小模型。”

  科斯拉说,PrismML满足了市场对快速、小巧但高性能模型的需求,这些模型可服务于从语音对话到金融某些领域的广泛应用。

  PrismML开发的模型旨在智能手机和笔记本电脑等消费设备以及工业边缘设备上运行。该公司表示,其理念是让机器人、可穿戴设备和个人计算等领域的应用成为可能,而这些应用在以前是不切实际的。

  科斯拉说:“你可以在手机上装下一个好得多的模型。这一点意义重大。当然,在手机或移动设备上,能耗是一个非常、非常重要的问题。”

  PrismML表示,同样的效率提升不仅能实现本地部署,还能让数据中心更有效地运行。

  哈西比称,尽管更广泛的科技行业在激烈辩论AI的未来在于Transformer、扩散模型还是更新的概念,但PrismML的数学框架可以应用于其中任何一种。

  运作原理

  描述AI模型的一种方式是使用“比特”(bit),它指的是用计算机语言“1”和“0”来表示一个数值所需的代码量。大多数AI模型以16-bit的精度编写,不过也有些方法采用4-bit或更低精度。据哈西比称,PrismML取得了一项数学突破,实现了1-bit模型,且不影响全精度模型的推理、编码和通用知识能力。哈西比表示,虽然相关数学原理是专有技术,但其效果很像在不损失视觉保真度的情况下压缩数码照片。

  在运行AI模型时,被称为“延迟”的延时和能耗都与内存中数据的移入移出有关。哈西比说,通过将数据单位(即模型权重)减少到用+1或-1表示的单个比特,PrismML的旗舰1-bit模型Bonsai 8B的处理速度可比16-bit模型提高多达八倍。哈西比还说,在现有硬件平台上,该模型还能将能耗降低最多75%至80%。他表示,如果未来的硬件专为1-bit模型设计,将完全无需进行复杂的数学乘法运算。哈西比认为,届时硬件将只需执行简单的加减法,这将进一步降低能耗和延迟。

  Cerberus Capital Management的高级董事总经理阿米尔·萨莱克(Amir Salek)表示,他确信PrismML取得了一项重大的数学突破,有望改善AI的经济效益。

  PrismML称,采用1-bit架构后,一个2TB的模型会瞬间变成150GB。萨莱克说:“你的带宽需求会大幅下降,内存大小会大幅下降,移动数据所消耗的能量……也会大幅减少。”他曾是谷歌技术基础设施和Google Cloud业务的创始人兼芯片负责人。在此之前,他还是英伟达片上系统(System-on-a-Chip)设计部门的创始人和负责人。

  开发者、研究人员和其他用户可以免费下载PrismML开源的1-bit模型Bonsai 8B。

  Bonsai 8B是一款80亿参数的大语言模型,使用谷歌v4 TPU进行训练。

  据PrismML称,该模型实现了可与16-bit模型相媲美的高保真推理和语言理解能力,但内存占用仅为1GB,而后者为16GB。高保真推理是指成功执行复杂推理的能力。

  该公司表示,还将发布1-bit的Bonsai 40亿参数模型和17亿参数模型,其内存占用分别为0.5GB和0.24GB,且智能密度更高。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
媒体人:陈涛从冬训到现在瘦了20多斤,刘建业瘦了也有白发了

媒体人:陈涛从冬训到现在瘦了20多斤,刘建业瘦了也有白发了

懂球帝
2026-04-07 15:46:08
第91分钟绝杀,阿森纳送给葡体本赛季欧冠主场首败

第91分钟绝杀,阿森纳送给葡体本赛季欧冠主场首败

懂球帝
2026-04-08 05:15:06
美以伊战事第39天:特朗普恐吓伊朗“4小时”恐怖式摧毁,震惊联合国;伊朗称“打穿”海法未见导弹拦截

美以伊战事第39天:特朗普恐吓伊朗“4小时”恐怖式摧毁,震惊联合国;伊朗称“打穿”海法未见导弹拦截

上观新闻
2026-04-07 16:10:19
欧冠染黄罕见发飙!琼阿梅尼:我啥也没干就跑了个步,太冤了

欧冠染黄罕见发飙!琼阿梅尼:我啥也没干就跑了个步,太冤了

仰卧撑FTUer
2026-04-08 07:20:11
吉利要杀死合资!长超5米2,续航1505km,双叉臂+6座,才卖13万

吉利要杀死合资!长超5米2,续航1505km,双叉臂+6座,才卖13万

生活魔术专家
2026-04-08 03:22:06
王宝强和女友开京牌大G到青岛,冯清人高马大,衬得宝强像小娇夫

王宝强和女友开京牌大G到青岛,冯清人高马大,衬得宝强像小娇夫

八怪娱
2026-04-07 15:02:12
张姩菡妈妈李丽婧更新:辟谣假消息,孩子爸很强大,他承受了太多

张姩菡妈妈李丽婧更新:辟谣假消息,孩子爸很强大,他承受了太多

老吴教育课堂
2026-04-08 03:09:03
为啥说最好不要送孩子出国?网友:希望你的孩子跟你眼界一样

为啥说最好不要送孩子出国?网友:希望你的孩子跟你眼界一样

解读热点事件
2026-04-03 00:05:08
上海二胎家庭真相:不是多双筷子,是全家资源被掏空的一场硬仗

上海二胎家庭真相:不是多双筷子,是全家资源被掏空的一场硬仗

复转这些年
2026-04-07 12:25:34
脱口秀演员思文官宣当妈,介绍丈夫是“不愿意透露姓名的人很nice的普通人”

脱口秀演员思文官宣当妈,介绍丈夫是“不愿意透露姓名的人很nice的普通人”

动物奇奇怪怪
2026-04-08 00:33:26
伊朗哈尔克岛传出爆炸声,疑是美军发起攻击?

伊朗哈尔克岛传出爆炸声,疑是美军发起攻击?

凤眼论
2026-04-07 18:45:51
乱成一锅粥!释永信风波扯出多位女星,比王林“床上开光”还恶心

乱成一锅粥!释永信风波扯出多位女星,比王林“床上开光”还恶心

火之文
2025-07-29 14:23:48
开车致女友截瘫,男方首次发声,正面照被扒,社交账号曝光!

开车致女友截瘫,男方首次发声,正面照被扒,社交账号曝光!

眼光很亮
2026-04-07 13:20:41
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
紧急通知!公安部修改疲劳驾驶认定标准,6月1日落地,司机必看

紧急通知!公安部修改疲劳驾驶认定标准,6月1日落地,司机必看

黑哥讲现代史
2026-04-08 05:27:48
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

有范又有料
2026-04-07 16:45:46
伊朗公布对执行营救美军机开火画面

伊朗公布对执行营救美军机开火画面

环球网资讯
2026-04-07 14:32:39
万万没想到!孙颖莎夺得冠军后,颁奖嘉宾竟是她,四字让莎莎暖心

万万没想到!孙颖莎夺得冠军后,颁奖嘉宾竟是她,四字让莎莎暖心

青橘罐头
2026-04-07 17:10:32
跌破3999!华为Mate80大降价,2026年入手是捡漏还是踩雷

跌破3999!华为Mate80大降价,2026年入手是捡漏还是踩雷

辉哥说动漫
2026-04-05 18:11:45
就在所有人以为,大战即将结束的时候,伊朗突然打出了最猛导弹雨

就在所有人以为,大战即将结束的时候,伊朗突然打出了最猛导弹雨

古事寻踪记
2026-04-08 07:34:12
2026-04-08 08:12:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2782077文章数 6483关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

伊朗接受停火提议

头条要闻

伊朗接受停火提议

体育要闻

楚阿梅尼:第二个丢球对我们打击很大;次回合会有人站出来

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

本地
家居
艺术
公开课
军事航空

本地新闻

跟着歌声游安徽,听古村回响

家居要闻

雅致惬意 感知生活之美

艺术要闻

14幅 当代俄罗斯青年画家——伊万·安德烈耶夫油画选

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

文化符号当“弹药” 美伊将信息战带入新阶段

无障碍浏览 进入关怀版