网易首页 > 网易号 > 正文 申请入驻

主打一个快!腾讯开源0.3B端侧模型,手机耳机都能跑

0
分享至

来源:市场资讯

(来源:智东西)


智东西

作者 李水青

编辑 心缘

智东西2月10日报道,今日,腾讯混元开源一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,等效参数量仅有0.3B,内存占用仅600MB,比常用的一些手机应用还小,可本地化部署于手机、耳机或智能家居等设备应用。


该模型基于首个产业级2比特(Bit)端侧量化方案,通过对此前混元的小尺寸语言模型HY-1.8B-Instruct进行2比特量化感知训练(QAT)产出。这一模型对比原始精度模型等效参数量降低6倍,沿用原模型全思考能力,可根据任务复杂度切换长/短思维链;同时在真实端侧设备上生成速度提升2-3倍。


▲ HY-1.8B原始精度模型生成效果


▲HY-1.8B-2Bit模型生成效果,2bit量化后的模型速度明显更快

比特是计算机存储的最小单位,一般模型的精度有2比特、4比特、8比特、32比特等表示方法,数值越大模型的精度更高,所占的内存就越大。虽然2比特量化的精度损失较大,但通过QAT和先进的量化策略,团队已经能让2比特模型接近全精度模型的性能,对比4比特PTQ模型版本数学、代码、科学等指标上表现相当。

对于原始模型大小只有1.8B,量化bit数只有2bit的HY-1.8B-2Bit,混元团队采用了量化感知训练策略,从而显著提升了量化后模型的性能。腾讯混元还通过数据优化、弹性拉伸量化以及训练策略创新三个方法,来提升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的gguf-int2格式的模型权重与bf16伪量化权重,对比原始精度模型,HY-1.8B-2Bit实际模型大小直降6倍,仅有300MB,能够灵活用于端侧设备上。该模型也已在Arm等计算平台上完成适配,可部署于启用Arm SME2技术的移动设备上。

在MacBook M4芯片上,HY-1.8B-2Bit固定了线程数为2测试了不同窗口大小下的首字时延和生成速度,模型选定fp16、Q4、HY-1.8B-2Bit三种gguf格式作为对比,首字时延在1024输入内能够保持3~8倍的加速,生成速度上常用窗口下对比原始模型精度,HY-1.8B-2Bit能够实现至少2倍稳定加速。


在天玑9500上同样进行了测试,对比HY-1.8B-Q4格式首字时延能够加速1.5~2倍,生成速度加速约1.5倍。


项目链接:

https://github.com/Tencent/AngelSlim

模型地址:

https://huggingface.co/AngelSlim/HY-1.8B-2Bit

https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF

技术报告:

https://huggingface.co/AngelSlim/HY-1.8B-2Bit/blob/main/AngelSlim_Technical_Report.pdf

结语:模型“瘦身”,加速端边侧智能发展

HY-1.8B-2Bit的推出标志着腾讯在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。

从去年中阿里的Qwen-Embedding-0.6B、谷歌的0.27B的Gemma 3、0.3B的EmbeddingGemma,再到今年初腾讯0.3B的HY-1.8B-2Bit,越来越多的小尺寸模型可供开发者选择,推动RAG、语义搜索等应用不断下沉至个人设备。

当前,HY-1.8B-2Bit的能力仍受限于监督微调(SFT)的训练流程,以及基础模型本身的性能与抗压能力。针对这一问题,混元团队未来将重点转向强化学习与模型蒸馏等技术路径,以期进一步缩小低比特量化模型与全精度模型之间的能力差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王毅:支持通过对话政治解决一切地区热点

王毅:支持通过对话政治解决一切地区热点

界面新闻
2026-02-14 21:44:47
游客在三亚支付19晚房费8499元,被民宿单方面取消,三亚通报

游客在三亚支付19晚房费8499元,被民宿单方面取消,三亚通报

爱看头条
2026-02-14 13:24:46
刘虎回家过年,这个春节最快乐的事

刘虎回家过年,这个春节最快乐的事

涛哥锐评
2026-02-14 23:16:16
中美博弈本质?英专家:中国触碰了西方300年来最大的“禁忌”

中美博弈本质?英专家:中国触碰了西方300年来最大的“禁忌”

琴音缭绕回
2026-02-14 12:07:27
揭秘:为何中国宁愿向越南输电,也不向朝鲜输电?

揭秘:为何中国宁愿向越南输电,也不向朝鲜输电?

辉辉历史记
2025-11-24 21:16:46
中国女性出轨率高达七成,不是寂寞,而是背后藏着不为人知的隐痛

中国女性出轨率高达七成,不是寂寞,而是背后藏着不为人知的隐痛

易玄
2026-02-14 12:09:25
那个教小米做手机的厂商,要断气了

那个教小米做手机的厂商,要断气了

蓝字计划
2026-02-14 11:40:57
挣再多钱有啥用,61岁崔培军如今的现状,给所有企业家提了醒

挣再多钱有啥用,61岁崔培军如今的现状,给所有企业家提了醒

云景侃记
2026-02-03 22:26:23
2-0!哈兰德休战,格伊处子球,7200万先生中柱,曼城四线争冠

2-0!哈兰德休战,格伊处子球,7200万先生中柱,曼城四线争冠

我的护球最独特
2026-02-15 00:53:22
俄媒:一旦开战,中方只靠解放军难以取胜,必须调动另一股力量!

俄媒:一旦开战,中方只靠解放军难以取胜,必须调动另一股力量!

勇士军武闲谈
2026-02-13 11:54:35
“学习学傻了吧?”女孩晒满墙奖状,挑衅有钱人被嘲:头脑不清醒

“学习学傻了吧?”女孩晒满墙奖状,挑衅有钱人被嘲:头脑不清醒

妍妍教育日记
2026-02-14 17:00:28
河南春晚被骂上热搜!大量广告穿插少量节目,满屏AI没什么活人感

河南春晚被骂上热搜!大量广告穿插少量节目,满屏AI没什么活人感

东方不败然多多
2026-02-15 09:58:11
被透支的晚年!母亲被两个女儿“瓜分”带娃,终以悲剧收场

被透支的晚年!母亲被两个女儿“瓜分”带娃,终以悲剧收场

深度报
2026-02-14 21:26:52
全线反弹!加密货币大涨,超9万人爆仓

全线反弹!加密货币大涨,超9万人爆仓

证券时报e公司
2026-02-15 08:20:57
这气球真好看!

这气球真好看!

贵圈真乱
2026-02-15 12:24:58
央视巨作被疯狂举报,只因这点,恨国党炸锅了!

央视巨作被疯狂举报,只因这点,恨国党炸锅了!

毛豆论道
2026-02-14 21:55:16
看蒋万安给儿子们起的名字,就知道他骨子里的中国人身份,藏不住

看蒋万安给儿子们起的名字,就知道他骨子里的中国人身份,藏不住

来科点谱
2026-02-12 07:19:46
一中国公民在金沙酒店赌博后跳楼身亡,我使馆再次郑重提醒在新中国公民远离赌博

一中国公民在金沙酒店赌博后跳楼身亡,我使馆再次郑重提醒在新中国公民远离赌博

极目新闻
2026-02-14 22:30:16
还没完!闫学晶偷漏税新进展,新疆班有新情况,这一步咎由自取

还没完!闫学晶偷漏税新进展,新疆班有新情况,这一步咎由自取

观察鉴娱
2026-02-14 09:57:14
针对印菲边界争端,中国换了高阶打法,这下他们寝食难安了

针对印菲边界争端,中国换了高阶打法,这下他们寝食难安了

混沌录
2026-02-15 14:42:07
2026-02-15 15:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2221848文章数 5483关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

家居
游戏
时尚
公开课
军事航空

家居要闻

中古雅韵 乐韵伴日常

《零 ~红蝶~ REMAKE》试玩报告:和无名野鬼大战二十回合

推广中奖名单-更新至2026年2月3日推广

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:在俄乌冲突问题上 泽连斯基必须行动起来

无障碍浏览 进入关怀版