网易首页 > 网易号 > 正文 申请入驻

主打一个快!腾讯开源0.3B端侧模型,手机耳机都能跑

0
分享至


智东西
作者 李水青
编辑 心缘

智东西2月10日报道,今日,腾讯混元开源一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参数量仅有0.3B,内存占用仅600MB,比常用的一些手机应用还小,可本地化部署于手机、耳机智能家居等设备应用。


该模型基于首个产业级2比特(Bit)端侧量化方案,通过对此前混元的小尺寸语言模型HY-1.8B-Instruct进行2比特量化感知训练(QAT)产出。这一模型对比原始精度模型等效参数量降低6倍,沿用原模型全思考能力,可根据任务复杂度切换长/短思维链;同时在真实端侧设备上生成速度提升2-3倍


▲ HY-1.8B原始精度模型生成效果


▲HY-1.8B-2Bit模型生成效果,2bit量化后的模型速度明显更快

比特是计算机存储的最小单位,一般模型的精度有2比特、4比特、8比特、32比特等表示方法,数值越大模型的精度更高,所占的内存就越大。虽然2比特量化的精度损失较大,但通过QAT和先进的量化策略,团队已经能让2比特模型接近全精度模型的性能,对比4比特PTQ模型版本数学、代码、科学等指标上表现相当。

对于原始模型大小只有1.8B,量化bit数只有2bit的HY-1.8B-2Bit,混元团队采用了量化感知训练策略,从而显著提升了量化后模型的性能。腾讯混元还通过数据优化、弹性拉伸量化以及训练策略创新三个方法,来提升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的gguf-int2格式的模型权重与bf16伪量化权重,对比原始精度模型,HY-1.8B-2Bit实际模型大小直降6倍,仅有300MB,能够灵活用于端侧设备上。该模型也已在Arm等计算平台上完成适配,可部署于启用Arm SME2技术的移动设备上。

MacBook M4芯片上,HY-1.8B-2Bit固定了线程数为2测试了不同窗口大小下的首字时延和生成速度,模型选定fp16、Q4、HY-1.8B-2Bit三种gguf格式作为对比,首字时延在1024输入内能够保持3~8倍的加速,生成速度上常用窗口下对比原始模型精度,HY-1.8B-2Bit能够实现至少2倍稳定加速。


天玑9500上同样进行了测试,对比HY-1.8B-Q4格式首字时延能够加速1.5~2倍,生成速度加速约1.5倍


项目链接:
https://github.com/Tencent/AngelSlim
模型地址:
https://huggingface.co/AngelSlim/HY-1.8B-2Bit
https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF
技术报告:
https://huggingface.co/AngelSlim/HY-1.8B-2Bit/blob/main/AngelSlim_Technical_Report.pdf

结语:模型“瘦身”,加速端边侧智能发展

HY-1.8B-2Bit的推出标志着腾讯在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。

从去年中阿里的Qwen-Embedding-0.6B、谷歌的0.27B的Gemma 3、0.3B的EmbeddingGemma,再到今年初腾讯0.3B的HY-1.8B-2Bit,越来越多的小尺寸模型可供开发者选择,推动RAG、语义搜索等应用不断下沉至个人设备。

当前,HY-1.8B-2Bit的能力仍受限于监督微调(SFT)的训练流程,以及基础模型本身的性能与抗压能力。针对这一问题,混元团队未来将重点转向强化学习与模型蒸馏等技术路径,以期进一步缩小低比特量化模型与全精度模型之间的能力差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为啥上海没有想象中那么繁华?网友:你没机会见到上海繁华的一面

为啥上海没有想象中那么繁华?网友:你没机会见到上海繁华的一面

带你感受人间冷暖
2026-04-11 00:30:08
四小时摧毁伊朗,法国提前动手,中方罕见表态,伊朗:美国中计了

四小时摧毁伊朗,法国提前动手,中方罕见表态,伊朗:美国中计了

安珈使者啊
2026-04-12 10:01:37
以色列撕毁停火,美国在中东的真正对手,从来不是伊朗而是以色列

以色列撕毁停火,美国在中东的真正对手,从来不是伊朗而是以色列

兴史兴谈
2026-04-11 14:37:54
比亚迪再掀价格战:8.98万续航2110km,合资车彻底慌了

比亚迪再掀价格战:8.98万续航2110km,合资车彻底慌了

华庭讲美食
2026-04-10 17:03:23
伊朗终止同美国直接外交联系

伊朗终止同美国直接外交联系

界面新闻
2026-04-07 23:03:06
陈丽华离世仅5天,前员工公开爆料其人品,迟重瑞的评价有人信了

陈丽华离世仅5天,前员工公开爆料其人品,迟重瑞的评价有人信了

天马幸福的人生
2026-04-12 01:18:05
2026辛卡决今晚九点分胜负,紫薇输球后遭尬评:世界排名会说谎

2026辛卡决今晚九点分胜负,紫薇输球后遭尬评:世界排名会说谎

网球之家
2026-04-12 12:20:26
上海洛夫顿怀特塞德受伤,辽宁锁定季后赛,山东于德豪赛季报销

上海洛夫顿怀特塞德受伤,辽宁锁定季后赛,山东于德豪赛季报销

中国篮坛快讯
2026-04-12 14:18:01
新华社消息|以色列袭击黎巴嫩已造成超2000人死亡

新华社消息|以色列袭击黎巴嫩已造成超2000人死亡

新华社
2026-04-12 10:02:06
中国两艘航母并列制造,一台是用核动力?另一台使用何种动力?

中国两艘航母并列制造,一台是用核动力?另一台使用何种动力?

别吵吵
2026-04-12 10:26:52
祖国统一大势不可挡,台初中生贴旗打脸,绿营慌了!

祖国统一大势不可挡,台初中生贴旗打脸,绿营慌了!

时尚的弄潮
2026-04-12 13:29:42
最差局面出现,伊朗最想要的中国给了?不到24小时,美国喊话中国

最差局面出现,伊朗最想要的中国给了?不到24小时,美国喊话中国

阿丰聊娱
2026-04-12 11:13:53
演员陈学冬:11部作品被下架,两年4次手术,今35岁生活无法自理

演员陈学冬:11部作品被下架,两年4次手术,今35岁生活无法自理

以茶带书
2026-04-03 19:40:21
郑丽文书法争议:她的字真的不是自己写的吗?

郑丽文书法争议:她的字真的不是自己写的吗?

书画相约
2026-04-08 08:19:04
陈丽华,吃到“唐僧肉”的女首富

陈丽华,吃到“唐僧肉”的女首富

难得君
2026-04-08 08:36:45
iPhone18ProMax最新曝光,手里的iPhone17ProMax更香了!

iPhone18ProMax最新曝光,手里的iPhone17ProMax更香了!

搞机小帝
2026-04-12 00:17:00
六年级女生因给老师起外号被连扇四个耳光 当场流鼻血并导致耳损伤

六年级女生因给老师起外号被连扇四个耳光 当场流鼻血并导致耳损伤

闪电新闻
2026-04-11 19:42:17
荷媒:富安健洋今夏将告别阿贾克斯,效力仅半年便分道扬镳

荷媒:富安健洋今夏将告别阿贾克斯,效力仅半年便分道扬镳

懂球帝
2026-04-11 17:15:27
60%民调反转!赖清德想不到,郑丽文大陆行,扭转国民党10年颓势

60%民调反转!赖清德想不到,郑丽文大陆行,扭转国民党10年颓势

一口娱乐
2026-04-12 10:11:28
猪肉1斤5块钱!谁都没想到,美伊冲突的炮火,炸穿了中国的猪圈

猪肉1斤5块钱!谁都没想到,美伊冲突的炮火,炸穿了中国的猪圈

北纬的咖啡豆
2026-04-11 14:53:46
2026-04-12 14:44:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11557文章数 117027关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

"赌王"何鸿燊女儿何超蕸去世 临终前家人陪伴在侧

头条要闻

"赌王"何鸿燊女儿何超蕸去世 临终前家人陪伴在侧

体育要闻

五大联赛首冠出炉?拜仁或提前4轮卫冕德甲

娱乐要闻

46岁赵达官宣结婚!曾与殷桃谈婚论嫁

财经要闻

三轮磋商谈至深夜 美伊谈判三大议题仍待解

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

教育
时尚
健康
亲子
数码

教育要闻

Q开头的单词!

伊姐周六热推:电视剧《八千里路云和月》;综艺《乘风2026》......

干细胞抗衰4大误区,90%的人都中招

亲子要闻

日本农村生活重启!喜娜酱又开始打网球,学跳舞,风一样的女孩

数码要闻

8GB显卡再战十年不是吹牛!NVIDIA RTX神经纹理压缩技术实测:显存占用爆降85%

无障碍浏览 进入关怀版