网易首页 > 网易号 > 正文 申请入驻

主打一个快!腾讯开源0.3B端侧模型,手机耳机都能跑

0
分享至


智东西
作者 李水青
编辑 心缘

智东西2月10日报道,今日,腾讯混元开源一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参数量仅有0.3B,内存占用仅600MB,比常用的一些手机应用还小,可本地化部署于手机、耳机智能家居等设备应用。


该模型基于首个产业级2比特(Bit)端侧量化方案,通过对此前混元的小尺寸语言模型HY-1.8B-Instruct进行2比特量化感知训练(QAT)产出。这一模型对比原始精度模型等效参数量降低6倍,沿用原模型全思考能力,可根据任务复杂度切换长/短思维链;同时在真实端侧设备上生成速度提升2-3倍


▲ HY-1.8B原始精度模型生成效果


▲HY-1.8B-2Bit模型生成效果,2bit量化后的模型速度明显更快

比特是计算机存储的最小单位,一般模型的精度有2比特、4比特、8比特、32比特等表示方法,数值越大模型的精度更高,所占的内存就越大。虽然2比特量化的精度损失较大,但通过QAT和先进的量化策略,团队已经能让2比特模型接近全精度模型的性能,对比4比特PTQ模型版本数学、代码、科学等指标上表现相当。

对于原始模型大小只有1.8B,量化bit数只有2bit的HY-1.8B-2Bit,混元团队采用了量化感知训练策略,从而显著提升了量化后模型的性能。腾讯混元还通过数据优化、弹性拉伸量化以及训练策略创新三个方法,来提升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的gguf-int2格式的模型权重与bf16伪量化权重,对比原始精度模型,HY-1.8B-2Bit实际模型大小直降6倍,仅有300MB,能够灵活用于端侧设备上。该模型也已在Arm等计算平台上完成适配,可部署于启用Arm SME2技术的移动设备上。

MacBook M4芯片上,HY-1.8B-2Bit固定了线程数为2测试了不同窗口大小下的首字时延和生成速度,模型选定fp16、Q4、HY-1.8B-2Bit三种gguf格式作为对比,首字时延在1024输入内能够保持3~8倍的加速,生成速度上常用窗口下对比原始模型精度,HY-1.8B-2Bit能够实现至少2倍稳定加速。


天玑9500上同样进行了测试,对比HY-1.8B-Q4格式首字时延能够加速1.5~2倍,生成速度加速约1.5倍


项目链接:
https://github.com/Tencent/AngelSlim
模型地址:
https://huggingface.co/AngelSlim/HY-1.8B-2Bit
https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF
技术报告:
https://huggingface.co/AngelSlim/HY-1.8B-2Bit/blob/main/AngelSlim_Technical_Report.pdf

结语:模型“瘦身”,加速端边侧智能发展

HY-1.8B-2Bit的推出标志着腾讯在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。

从去年中阿里的Qwen-Embedding-0.6B、谷歌的0.27B的Gemma 3、0.3B的EmbeddingGemma,再到今年初腾讯0.3B的HY-1.8B-2Bit,越来越多的小尺寸模型可供开发者选择,推动RAG、语义搜索等应用不断下沉至个人设备。

当前,HY-1.8B-2Bit的能力仍受限于监督微调(SFT)的训练流程,以及基础模型本身的性能与抗压能力。针对这一问题,混元团队未来将重点转向强化学习与模型蒸馏等技术路径,以期进一步缩小低比特量化模型与全精度模型之间的能力差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老板娘说她屁股太大了,我该怎么回答?

老板娘说她屁股太大了,我该怎么回答?

太急张三疯
2026-03-19 09:16:16
WTT太原赛:温瑞博兵败如山倒!第3局连输6分,1-2落后吉村真晴!

WTT太原赛:温瑞博兵败如山倒!第3局连输6分,1-2落后吉村真晴!

刘姚尧的文字城堡
2026-04-12 19:09:32
美伊谈判没有成功,但分出了输赢,过程比结果更精彩

美伊谈判没有成功,但分出了输赢,过程比结果更精彩

明人明察
2026-04-12 13:14:54
18!预测第18顺位啊!中国男篮下一个首轮秀

18!预测第18顺位啊!中国男篮下一个首轮秀

篮球实战宝典
2026-04-12 17:19:01
湖人最后一场藏了3个主力,爵士首发名单只剩5个活人

湖人最后一场藏了3个主力,爵士首发名单只剩5个活人

赛场速报局
2026-04-12 22:35:12
iPhone 17 突然降价,4月12日,现货开卖!

iPhone 17 突然降价,4月12日,现货开卖!

科技堡垒
2026-04-12 11:43:16
泽连斯基:不入北约、不进欧盟、不驻外军皆可谈,只一原则不退让

泽连斯基:不入北约、不进欧盟、不驻外军皆可谈,只一原则不退让

z千年历史老号
2026-04-12 15:15:06
AI语聊软件暗藏大尺度色情内容 境外涉黄AI软件绕过监管流入国内

AI语聊软件暗藏大尺度色情内容 境外涉黄AI软件绕过监管流入国内

财联社
2026-04-12 20:28:24
亚足联点评中国U20女足主帅贝尔:如释重负与欣喜

亚足联点评中国U20女足主帅贝尔:如释重负与欣喜

北青网-北京青年报
2026-04-12 14:20:03
央行原统计司长盛松成:面对预期下行,做好资产价格大幅下降准备

央行原统计司长盛松成:面对预期下行,做好资产价格大幅下降准备

专业聊房君
2026-04-10 16:41:31
欧尔班若落选,是匈牙利整个国家悲剧的开始

欧尔班若落选,是匈牙利整个国家悲剧的开始

清滨酒客
2026-04-12 11:14:36
专家分析得出:一旦核战爆发,中国3个地方可躲灾难,一定要知道

专家分析得出:一旦核战爆发,中国3个地方可躲灾难,一定要知道

文史达观
2024-06-14 21:35:17
领先12分!领先9分!五大联赛基本决出4冠了,阿森纳夺冠条件出炉

领先12分!领先9分!五大联赛基本决出4冠了,阿森纳夺冠条件出炉

球场没跑道
2026-04-12 11:05:35
她将弟弟带入娱乐圈,如今自己无人问津,弟弟却是红透半边天!

她将弟弟带入娱乐圈,如今自己无人问津,弟弟却是红透半边天!

看尽落尘花q
2026-04-12 19:49:44
史上最冤枉的差评!

史上最冤枉的差评!

果粉之家
2026-04-11 12:57:38
黑龙江畜生公公周永福被判死刑,法庭上嚣张大笑:这辈子值了

黑龙江畜生公公周永福被判死刑,法庭上嚣张大笑:这辈子值了

纸鸢奇谭
2025-02-06 14:31:24
男子半年花300万,嫖了160个小姐,2015年小姐:最高一次收费15万

男子半年花300万,嫖了160个小姐,2015年小姐:最高一次收费15万

汉史趣闻
2026-04-11 15:02:54
周鹏和娇妻近照,8次夺冠身家过亿,已为退役铺路,妻子1米88绝美

周鹏和娇妻近照,8次夺冠身家过亿,已为退役铺路,妻子1米88绝美

大西体育
2026-04-12 22:56:30
程潇“闪闪发光”

程潇“闪闪发光”

手工制作阿歼
2026-04-12 22:00:13
上海植物园猥亵惯犯落网!被抓6次,仍嬉皮笑脸毫无羞耻心太可恶

上海植物园猥亵惯犯落网!被抓6次,仍嬉皮笑脸毫无羞耻心太可恶

行者聊官
2026-04-12 15:46:42
2026-04-13 02:23:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11559文章数 117027关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

伊媒:美驱逐舰遭革命卫队锁定 距离被摧毁仅差几分钟

头条要闻

伊媒:美驱逐舰遭革命卫队锁定 距离被摧毁仅差几分钟

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

时尚
健康
手机
房产
本地

被周冬雨、林更新戴上热搜的珠宝,究竟有多惊艳?

干细胞抗衰4大误区,90%的人都中招

手机要闻

华为阔折叠设计图曝光!这外观你喜欢吗?

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版