网易首页 > 网易号 > 正文 申请入驻

0.3B!谷歌开源新模型,手机断网也能跑,0.2GB内存就够用

0
分享至


智东西
作者 李水青
编辑 云鹏

智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。

EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。


▲Hugging Face开源页面截图

Hugging Face地址:
https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

据谷歌介绍,EmbeddingGemma具有以下几大亮点:

1、同类最佳:在海量文本嵌入基准(MTEB)上,在500M以下的开放式多语言文本嵌入模型中,EmbeddingGemma排名最高。EmbeddingGemma基于Gemma 3架构打造,已针对100多种语言进行训练,并且体积小巧,经过量化后可在不到200MB的内存上运行。


▲MTEB评分:EmbeddingGemma性能比肩比起尺寸大一倍的顶尖模型

2、专为灵活离线工作而设计:小巧、快速、高效,提供可自定义的输出尺寸,以及2K令牌上下文窗口,可在手机、笔记本电脑、台式机等日常设备上运行。它旨在与Gemma 3n配合使用,共同为移动RAG管道、语义搜索等解锁新的用例。

3、与流行工具集成:为了让用户轻松开始使用EmbeddingGemma,它已经可以与用户喜欢的工具一起使用,例如sentence-transformers、llama.cpp、MLX、Ollama、LiteRT、transformers.js、LMStudio、Weaviate、Cloudflare、LlamaIndex、LangChain等。

一、可生成优质嵌入向量,端侧RAG生成答案更准确

EmbeddingGemma会生成嵌入向量,在本文语境中,它能将文本转换为数值向量,在高维空间表征文本语义;嵌入向量质量越高,对语言细微差别与复杂特性的表征效果越好。


▲EmbeddingGemma会生成嵌入向量

构建RAG流程存在两个关键阶段:一是根据用户输入检索相关上下文,二是基于该上下文生成有依据的答案。

为实现检索功能,用户可以先生成提示词的嵌入向量,再计算该向量与系统中所有文档嵌入向量的相似度——通过这种方式,能够获取与用户查询最相关的文本片段。

随后,用户可将这些文本片段与原始查询一同输入生成式模型(如Gemma 3),从而生成符合上下文的相关答案。例如,模型能理解你需要联系木工的电话,以解决地板损坏的问题。

要让这个RAG流程切实有效,初始检索步骤的质量至关重要。质量不佳的嵌入向量会导致检索到不相关的文档,进而生成不准确或毫无意义的答案。

而EmbeddingGemma的性能优势正体现于此——它能提供高质量的(文本)表征,为精准、可靠的端侧应用提供核心支持。

二、以小博大,性能接近尺寸翻倍的Qwen-Embedding-0.6B

EmbeddingGemma提供了与其规模相适应的最先进的文本理解能力,在多语言嵌入生成方面具有特别强大的性能。

与其他流行嵌入模型的比较,EmbeddingGemma在检索、分类和聚类等任务上表现出色。

EmbeddingGemma在Mean(Task)、Retrieval、Classification、Clustering等测试中全面赶超了同等尺寸的gte-multilingual-base模型。其测试成绩也已接近尺寸达到其两倍的Qwen-Embedding-0.6B。


▲EmbeddingGemma的测评情况

EmbeddingGemma模型拥有308M参数,主要由大约100M模型参数和200M嵌入参数组成。

为了实现更高的灵活性,EmbeddingGemma利用Matryoshka表征学习(MRL),在一个模型中提供多种嵌入大小。开发者可以使用完整的768维向量以获得最佳质量,也可以将其截断为较小的维度(128、256或512),以提高速度并降低存储成本。

谷歌在EdgeTPU上将嵌入推理时间(256个输入token)缩短至<15ms,突破了速度界限,这意味着用户的AI功能可以提供实时响应,实现流畅、即时的交互。

利用量化感知训练(QAT),谷歌在保持模型质量的同时,显著将RAM使用量降低至200MB以下。

三、断网可用,可在不到200MB内存上运行

EmbeddingGemma支持开发者构建灵活且注重隐私的设备端应用。它直接在设备硬件上生成文档嵌入,帮助确保敏感用户数据的安全。

它使用与Gemma 3n相同的分词器进行文本处理,从而减少RAG应用的内存占用。用户可使用EmbeddingGemma解锁新功能,例如:

无需联网即可同时搜索个人文件、文本、电子邮件和通知。

通过RAG与Gemma 3n实现个性化、行业特定和离线支持的聊天机器人。

将用户查询分类到相关的函数调用,以帮助移动智能体理解(用户需求)。

下图为EmbeddingGemma的交互式演示,它将文本嵌入在三维空间中可视化,该模型完全在设备上运行。


▲EmbeddingGemma的交互式演示(图源:Hugging Face团队的Joshua)

Demo体验地址:
https://huggingface.co/spaces/webml-community/semantic-galaxy)

结语:小尺寸大能力,加速端侧智能发展

EmbeddingGemma的推出标志着谷歌在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。

未来,随着RAG、语义搜索等应用不断下沉至个人设备,EmbeddingGemma或将成为推动端侧智能普及的重要基石。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
钱多有何用?儿子涉毒女儿拾荒流浪,71岁成龙晚年凄凉,无人同情

钱多有何用?儿子涉毒女儿拾荒流浪,71岁成龙晚年凄凉,无人同情

有范又有料
2025-09-09 15:22:11
央视曝光,六部门彻查新能源车黑嘴,排除四车企,雷军恐又要憔悴

央视曝光,六部门彻查新能源车黑嘴,排除四车企,雷军恐又要憔悴

奇思妙想草叶君
2025-09-13 23:36:38
“吃饭七分饱”被推翻?医生:过了70岁之后,吃饭尽量做到这几点

“吃饭七分饱”被推翻?医生:过了70岁之后,吃饭尽量做到这几点

诗意世界
2025-09-14 22:51:59
到龄退休两年后,央企高管终落马

到龄退休两年后,央企高管终落马

运营商段子手
2025-09-15 00:43:21
于朦胧事件终于有进展!任嘉伦发文真是细思极恐,陈晓也曾经历过

于朦胧事件终于有进展!任嘉伦发文真是细思极恐,陈晓也曾经历过

陈意小可爱
2025-09-14 16:38:05
台岛东部发生激烈对峙,空警500突然开应答器冲入,F16紧急起飞

台岛东部发生激烈对峙,空警500突然开应答器冲入,F16紧急起飞

星辰故事屋
2025-09-14 10:11:22
广州突发,疑似发生爆炸事故,现场传出爆燃声!官方通报

广州突发,疑似发生爆炸事故,现场传出爆燃声!官方通报

FM93浙江交通之声
2025-09-15 00:10:50
王朔:只要不碰车贷、房贷、传宗接代,一个月三千,也活得很自在

王朔:只要不碰车贷、房贷、传宗接代,一个月三千,也活得很自在

清风拂心
2025-09-09 15:15:04
压哨手球送点!汉尼拔双手掩面,红军连场绝杀,名宿:简直是疯了

压哨手球送点!汉尼拔双手掩面,红军连场绝杀,名宿:简直是疯了

奥拜尔
2025-09-14 23:15:23
北京等地9月现冰雹是否罕见?中央气象台专家回应

北京等地9月现冰雹是否罕见?中央气象台专家回应

新京报
2025-09-14 19:11:07
疑于朦胧带血劳力士手表曝光,和极光光手表吻合,网友提更多质疑

疑于朦胧带血劳力士手表曝光,和极光光手表吻合,网友提更多质疑

娱圈小愚
2025-09-13 11:13:38
2亿鼻炎患者买爆这款创新药!

2亿鼻炎患者买爆这款创新药!

动脉网
2025-09-14 08:08:42
太疯狂!iPhone 17预售开启,苹果官网被挤崩,股价大涨!网友:根本抢不到,不是说丑吗?小米总裁:很强,牙膏挤爆了

太疯狂!iPhone 17预售开启,苹果官网被挤崩,股价大涨!网友:根本抢不到,不是说丑吗?小米总裁:很强,牙膏挤爆了

每日经济新闻
2025-09-13 00:56:04
俄专家:中国将为‘中立’付出代价,俄罗斯会坐看中美冲突!

俄专家:中国将为‘中立’付出代价,俄罗斯会坐看中美冲突!

柏林观察
2025-09-11 11:10:52
南海激烈对峙,P8-A逼近福建舰500米,歼-16起飞后,美军果然怕了

南海激烈对峙,P8-A逼近福建舰500米,歼-16起飞后,美军果然怕了

荐史
2025-09-14 14:50:24
震惊!加州山火慈善晚会募捐了1亿美元,狗能用、微生物能用,灾民一分都没有

震惊!加州山火慈善晚会募捐了1亿美元,狗能用、微生物能用,灾民一分都没有

大洛杉矶LA
2025-09-14 05:06:33
男单颁奖!雨果开心,王楚钦接奖杯笑开花,与孙颖莎合影太美妙了

男单颁奖!雨果开心,王楚钦接奖杯笑开花,与孙颖莎合影太美妙了

篮球资讯达人
2025-09-14 20:59:39
罗永浩称西贝的事情告一段落

罗永浩称西贝的事情告一段落

每日经济新闻
2025-09-14 00:12:21
雷军:我们要认真向特斯拉学习,除了特斯拉,比我们好的没有!网友:“天下造车,唯马与雷尔!”

雷军:我们要认真向特斯拉学习,除了特斯拉,比我们好的没有!网友:“天下造车,唯马与雷尔!”

大白聊IT
2025-09-14 10:43:28
中国女曲4-1逆转战胜印度队,时隔16年重夺亚洲杯

中国女曲4-1逆转战胜印度队,时隔16年重夺亚洲杯

懂球帝
2025-09-15 00:39:16
2025-09-15 02:15:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10459文章数 116855关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

罗永浩向贾国龙重新开战:我看你智力有问题 不可救药

头条要闻

罗永浩向贾国龙重新开战:我看你智力有问题 不可救药

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

艺术
教育
时尚
旅游
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

教育要闻

重磅:关于新修订职教高考考试大纲和专业技能考试标准的通知!

听说现在年轻人的家都“歪七扭八”的?

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版