网易首页 > 网易号 > 正文 申请入驻

440MB跑33种语言,1.25bit模型对标Qwen3-32B

0
分享至

440 MB,1.25 bit 极限量化,跑 33 种语言,翻译质量对标几百 GB 的大模型。端侧部署的物理极限,又被 Tencent 撕开了一道口子。

  • 极限量化:1.25 bit 压缩,3.3 GB 模型缩水至 440 MB,体积降 25%,速度快 10%
  • 能力对标:翻译质量匹配商业服务和 Qwen3-32B 等大模型,拿过 30 次国际机翻比赛第一
  • 完全离线:支持 33 种语言加 5 种方言,提供 Android APK,跨应用离线翻译
1.25 bit 的暴力压缩美学

搞端侧部署的兄弟都懂,显存和算力就是生命线。手机端跑大模型,最大的瓶颈根本不是算力,而是内存带宽和存储占用。Tencent 这次开源的Hy-MT1.5-1.8B-1.25bit,主打的就是一个极致压缩。原本 3.3 GB 的模型,直接干到了440 MB,连 1 GB 都不到,这个体积几乎不挑设备,随便一台主流智能手机都能轻松装下。

核心手段是把每个参数压到1.25 bit。之前业内玩 1.67 bit 量化已经觉得够狠了,这次 1.25 bit 方案不仅体积比前者小了25%,推理速度还快了10%。最关键的是,官方宣称没有质量损失。说白了,这就是在精度和体积的走钢丝里找到了新平衡点。你想啊,参数越少,访存越低,推理自然就越快,这是基本的物理规律。

440 MB 是什么概念?现在随便一个商用大模型都是几百 GB 的体量,这个模型用不到 1 GB 的空间,就实现了对标大模型的翻译质量,直接把端侧翻译的硬件门槛踩在脚下。这种激进量化路线,给整个端侧模型部署打了个样。

跑分与能力对标

别看体积小,跑分一点不虚。在标准基准测试中,Hy-MT1.5-1.8B-1.25bit的翻译质量不仅匹配了商业翻译服务,甚至能和Qwen3-32B这种量级的大模型掰手腕。440 MB 打几百 GB,这性价比不用多说了吧。官方还强调,这模型在国际机器翻译比赛中拿了30次第一名,这数据摆在这,证明不是纯靠压缩硬撑,底子本身就很硬。



模型覆盖面也够广,直接拉满了33种语言,包括德语、英语、中文、日语、法语,还有藏语和蒙古语。另外加上 5 种方言,支持1,056个翻译方向。这个翻译方向的数量级,基本覆盖了绝大多数跨语种交流的需求。

Google 那边也在推Gemma 4做智能手机本地运行,但 Tencent 这次在翻译细分赛道上,参数和体积控制得更极致。对比 Google Translate 这种云端服务,Hy-MT1.5-1.8B-1.25bit最大的杀手锏是完全离线,不依赖网络,也就没有网络延迟这一说。

核心参数配置: 模型参数:1.8B 量化精度:1.25 bit 模型体积:440 MB 对比前代:体积小 25%,速度快 10% 支持语言:33 种 + 5 种方言 翻译方向:1,056 个

这个 App 最实用的点在于,它可以跨任何应用进行离线翻译。没有网络信号、或者对数据隐私有极高要求的场景,比如跨国差旅、涉密会议,这套方案简直是刚需。手机端 440 MB 的占用,随便腾点空间就能装下,比起动辄几十 GB 的本地大模型,这个部署成本约等于零。

当然,1.25 bit 量化到底在长难句或者专业术语上有没有幻觉,还得自己实测才知道。但就这个体积和跑分数据来看,作为随身翻译工具绝对够格了。

你的业务场景里,端侧翻译目前是刚需还是伪需求?你会为了这 440MB 的模型放弃云端 API 吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
社保缴费变了!2026年5月1日起执行

社保缴费变了!2026年5月1日起执行

读本书
2026-05-04 21:55:09
今年立夏是“凶日”,提醒:1不去,2不吃,3要忌,4不留,有讲究

今年立夏是“凶日”,提醒:1不去,2不吃,3要忌,4不留,有讲究

芹姐说生活
2026-05-04 15:27:38
阿联酋称油轮过霍尔木兹遭伊朗袭击

阿联酋称油轮过霍尔木兹遭伊朗袭击

界面新闻
2026-05-04 19:36:16
英媒:伊朗革命卫队要求特朗普“二选一”

英媒:伊朗革命卫队要求特朗普“二选一”

参考消息
2026-05-04 18:13:09
秘密谈判!全程0泄密!原来东契奇不想来湖人啊

秘密谈判!全程0泄密!原来东契奇不想来湖人啊

柚子说球
2026-05-04 23:11:10
中方喊话190国,不许日本拥核,日前首相:不如我们"联中抗美"

中方喊话190国,不许日本拥核,日前首相:不如我们"联中抗美"

兴史兴谈
2026-05-04 01:59:51
大佬!梅西受邀坐进安东内利的座驾!世界罕见!

大佬!梅西受邀坐进安东内利的座驾!世界罕见!

历史第一人梅西
2026-05-04 18:26:03
俄副部长叛逃美国,俄军每天最低伤亡千人,仍在组织新攻势!

俄副部长叛逃美国,俄军每天最低伤亡千人,仍在组织新攻势!

知兵
2026-05-04 16:06:33
戴手套!“72小时可夺命”,又有人中招了

戴手套!“72小时可夺命”,又有人中招了

番禺台
2026-05-04 11:37:55
女演员宣布:已产下一个大胖小子!

女演员宣布:已产下一个大胖小子!

喜欢历史的阿繁
2026-05-05 00:04:32
温碧霞现身草蜢演唱会,疑似没穿内衣露尴尬点,丈夫看手机不理她

温碧霞现身草蜢演唱会,疑似没穿内衣露尴尬点,丈夫看手机不理她

童叔不飙车
2026-05-04 00:07:51
任仲夷晚年时说:现在腐败得不到遏制,根本原因是权力得不到制约

任仲夷晚年时说:现在腐败得不到遏制,根本原因是权力得不到制约

帝哥说史
2026-05-04 21:57:53
1分钟抢光!发售价5999元被炒到9.99万元,网友:到底谁在买……

1分钟抢光!发售价5999元被炒到9.99万元,网友:到底谁在买……

晋江电视台
2026-05-02 12:01:08
1-3大爆冷!蒯曼遭逆转原因揭晓;输不起!张本智和炮轰国际乒联

1-3大爆冷!蒯曼遭逆转原因揭晓;输不起!张本智和炮轰国际乒联

大秦壁虎白话体育
2026-05-04 22:12:11
伊朗媒体:两枚导弹击中穿越霍尔木兹海峡的美国军舰

伊朗媒体:两枚导弹击中穿越霍尔木兹海峡的美国军舰

新华社
2026-05-04 18:51:04
营业20多年,又一网红店扛不住:曾是很多人回忆,今一地门店全关

营业20多年,又一网红店扛不住:曾是很多人回忆,今一地门店全关

财经八卦
2026-05-04 15:54:17
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

黯泉
2026-05-03 20:25:37
官方:辽宁铁人宣布李金羽下课 且不再担任总经理

官方:辽宁铁人宣布李金羽下课 且不再担任总经理

体坛周报
2026-05-04 18:07:32
范冰冰 大方公开 :18亿是真 ,没打算复合。

范冰冰 大方公开 :18亿是真 ,没打算复合。

In风尚
2026-05-02 06:04:17
继续减仓,等崩盘

继续减仓,等崩盘

新浪财经
2026-05-04 22:54:14
2026-05-05 03:43:00
呼呼历史论
呼呼历史论
分享有趣的历史
386文章数 16950关注度
往期回顾 全部

科技要闻

在中国市场搞「付费订阅」,豆包咋想的?

头条要闻

媒体:霍尔木兹海峡一声惊雷炸响 战争的引信已经点燃

头条要闻

媒体:霍尔木兹海峡一声惊雷炸响 战争的引信已经点燃

体育要闻

骑士破猛龙:加雷特·阿伦的活力

娱乐要闻

张敬轩还是站上了英皇25周年舞台

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

健康
本地
艺术
房产
公开课

干细胞治烧烫伤面临这些“瓶颈”

本地新闻

用青花瓷的方式,打开西溪湿地

艺术要闻

震惊!43岁妈妈晒女儿合影,30万网友猜测身份!

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版