网易首页 > 网易号 > 正文 申请入驻

0.3B!谷歌开源新模型,手机断网也能跑,0.2GB内存就够用

0
分享至


智东西
作者 李水青
编辑 云鹏

智东西9月5日消息,今天,谷歌开源一款全新的开放式嵌入模型EmbeddingGemma。该模型以小博大,拥有3.08亿个参数,专为端侧AI设计,支持在笔记本、手机等设备上部署检索增强生成(RAG)、语义搜索等应用程序。

EmbeddingGemma的一大特征是能生成隐私性良好的高质量嵌入向量,即使在断网情况下也能正常运行,且性能直追尺寸翻倍的Qwen-Embedding-0.6B。


▲Hugging Face开源页面截图

Hugging Face地址:
https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

据谷歌介绍,EmbeddingGemma具有以下几大亮点:

1、同类最佳:在海量文本嵌入基准(MTEB)上,在500M以下的开放式多语言文本嵌入模型中,EmbeddingGemma排名最高。EmbeddingGemma基于Gemma 3架构打造,已针对100多种语言进行训练,并且体积小巧,经过量化后可在不到200MB的内存上运行。


▲MTEB评分:EmbeddingGemma性能比肩比起尺寸大一倍的顶尖模型

2、专为灵活离线工作而设计:小巧、快速、高效,提供可自定义的输出尺寸,以及2K令牌上下文窗口,可在手机、笔记本电脑、台式机等日常设备上运行。它旨在与Gemma 3n配合使用,共同为移动RAG管道、语义搜索等解锁新的用例。

3、与流行工具集成:为了让用户轻松开始使用EmbeddingGemma,它已经可以与用户喜欢的工具一起使用,例如sentence-transformers、llama.cpp、MLX、Ollama、LiteRT、transformers.js、LMStudio、Weaviate、Cloudflare、LlamaIndex、LangChain等。

一、可生成优质嵌入向量,端侧RAG生成答案更准确

EmbeddingGemma会生成嵌入向量,在本文语境中,它能将文本转换为数值向量,在高维空间表征文本语义;嵌入向量质量越高,对语言细微差别与复杂特性的表征效果越好。


▲EmbeddingGemma会生成嵌入向量

构建RAG流程存在两个关键阶段:一是根据用户输入检索相关上下文,二是基于该上下文生成有依据的答案。

为实现检索功能,用户可以先生成提示词的嵌入向量,再计算该向量与系统中所有文档嵌入向量的相似度——通过这种方式,能够获取与用户查询最相关的文本片段。

随后,用户可将这些文本片段与原始查询一同输入生成式模型(如Gemma 3),从而生成符合上下文的相关答案。例如,模型能理解你需要联系木工的电话,以解决地板损坏的问题。

要让这个RAG流程切实有效,初始检索步骤的质量至关重要。质量不佳的嵌入向量会导致检索到不相关的文档,进而生成不准确或毫无意义的答案。

而EmbeddingGemma的性能优势正体现于此——它能提供高质量的(文本)表征,为精准、可靠的端侧应用提供核心支持。

二、以小博大,性能接近尺寸翻倍的Qwen-Embedding-0.6B

EmbeddingGemma提供了与其规模相适应的最先进的文本理解能力,在多语言嵌入生成方面具有特别强大的性能。

与其他流行嵌入模型的比较,EmbeddingGemma在检索、分类和聚类等任务上表现出色。

EmbeddingGemma在Mean(Task)、Retrieval、Classification、Clustering等测试中全面赶超了同等尺寸的gte-multilingual-base模型。其测试成绩也已接近尺寸达到其两倍的Qwen-Embedding-0.6B。


▲EmbeddingGemma的测评情况

EmbeddingGemma模型拥有308M参数,主要由大约100M模型参数和200M嵌入参数组成。

为了实现更高的灵活性,EmbeddingGemma利用Matryoshka表征学习(MRL),在一个模型中提供多种嵌入大小。开发者可以使用完整的768维向量以获得最佳质量,也可以将其截断为较小的维度(128、256或512),以提高速度并降低存储成本。

谷歌在EdgeTPU上将嵌入推理时间(256个输入token)缩短至<15ms,突破了速度界限,这意味着用户的AI功能可以提供实时响应,实现流畅、即时的交互。

利用量化感知训练(QAT),谷歌在保持模型质量的同时,显著将RAM使用量降低至200MB以下。

三、断网可用,可在不到200MB内存上运行

EmbeddingGemma支持开发者构建灵活且注重隐私的设备端应用。它直接在设备硬件上生成文档嵌入,帮助确保敏感用户数据的安全。

它使用与Gemma 3n相同的分词器进行文本处理,从而减少RAG应用的内存占用。用户可使用EmbeddingGemma解锁新功能,例如:

无需联网即可同时搜索个人文件、文本、电子邮件和通知。

通过RAG与Gemma 3n实现个性化、行业特定和离线支持的聊天机器人。

将用户查询分类到相关的函数调用,以帮助移动智能体理解(用户需求)。

下图为EmbeddingGemma的交互式演示,它将文本嵌入在三维空间中可视化,该模型完全在设备上运行。


▲EmbeddingGemma的交互式演示(图源:Hugging Face团队的Joshua)

Demo体验地址:
https://huggingface.co/spaces/webml-community/semantic-galaxy)

结语:小尺寸大能力,加速端侧智能发展

EmbeddingGemma的推出标志着谷歌在小型化、多语言和端侧AI上的新突破。它不仅在性能上接近更大规模的模型,还兼顾了速度、内存和隐私的平衡。

未来,随着RAG、语义搜索等应用不断下沉至个人设备,EmbeddingGemma或将成为推动端侧智能普及的重要基石。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女演员回应曝光片酬后登上热搜:演完这8天,可能一年都接不到戏

女演员回应曝光片酬后登上热搜:演完这8天,可能一年都接不到戏

韩小娱
2026-02-09 12:00:58
突然,飙涨90%!芯片,利好突袭!

突然,飙涨90%!芯片,利好突袭!

证券时报
2026-02-09 20:42:02
小年,除了吃饺子,这6种食物也要备一点!寓意:马年好运连连

小年,除了吃饺子,这6种食物也要备一点!寓意:马年好运连连

简食记工作号
2026-02-09 00:12:38
超越自我!中国速滑1000米排名+数据超北京,对手两破奥运纪录!

超越自我!中国速滑1000米排名+数据超北京,对手两破奥运纪录!

篮球资讯达人
2026-02-10 01:50:40
中方考虑拒绝特朗普访华,英媒曝料:已警告美国,越过红线别想来

中方考虑拒绝特朗普访华,英媒曝料:已警告美国,越过红线别想来

梦在深巷aqa
2026-02-07 22:58:03
河北搜爆器入户排查烟花爆竹,搜到没收罚款

河北搜爆器入户排查烟花爆竹,搜到没收罚款

记录刘杰
2026-02-09 14:38:41
她是最干净的女演员,出道25年戏红人不红,女儿像她颜值超高

她是最干净的女演员,出道25年戏红人不红,女儿像她颜值超高

枫尘余往逝
2026-02-10 03:47:07
她在柬埔寨7天被轮奸9次,被大陆解救,回台湾后立马抹黑大陆

她在柬埔寨7天被轮奸9次,被大陆解救,回台湾后立马抹黑大陆

吴王旅行ing
2026-02-10 02:44:28
农村重磅变局!2026中央一号文件敲定, 14亿人聚焦,别划走!

农村重磅变局!2026中央一号文件敲定, 14亿人聚焦,别划走!

现代小青青慕慕
2026-02-09 19:32:08
具俊晔韩综风波升级!节目组证实获本人授权,指责汪小菲造谣大S

具俊晔韩综风波升级!节目组证实获本人授权,指责汪小菲造谣大S

萌神木木
2026-02-07 14:26:57
男子欲结清分期还款却还不了,平台客服:分期还款提前结清须单独申请

男子欲结清分期还款却还不了,平台客服:分期还款提前结清须单独申请

极目新闻
2026-02-09 18:09:59
外资车1月份大获成功后,果然强化价格战,国产车压力更大了

外资车1月份大获成功后,果然强化价格战,国产车压力更大了

柏铭锐谈
2026-02-07 16:47:51
东体:阿马杜在冬训后半段已被雪藏,有关方面曾问过归化意向

东体:阿马杜在冬训后半段已被雪藏,有关方面曾问过归化意向

懂球帝
2026-02-09 12:58:17
输球不到24小时,张本智和再迎3大噩耗,个个戳他心窝

输球不到24小时,张本智和再迎3大噩耗,个个戳他心窝

罗纳尔说个球
2026-02-10 00:51:25
特朗普通知所有国家,禁止减持美国债,中国手里6830亿,不再奉陪

特朗普通知所有国家,禁止减持美国债,中国手里6830亿,不再奉陪

华人星光
2026-02-09 11:03:04
李显龙说对了!特朗普兵分两路,收割中国资产,要与中国硬刚?

李显龙说对了!特朗普兵分两路,收割中国资产,要与中国硬刚?

焦点集结号
2026-02-10 02:22:33
2月9日人民币对美元中间价调升67个基点

2月9日人民币对美元中间价调升67个基点

证券时报
2026-02-09 09:47:14
54岁汪峰形象大变,带醒醒三亚度假,近照发量稀少已有谢顶迹象!

54岁汪峰形象大变,带醒醒三亚度假,近照发量稀少已有谢顶迹象!

娱乐团长
2026-02-09 15:42:22
太平年:司马浦撞柱赴死才看透,他从始至终都是赵匡胤的太平利剑

太平年:司马浦撞柱赴死才看透,他从始至终都是赵匡胤的太平利剑

怂熊剧场
2026-02-10 04:02:34
3-2!国安击败中超新土豪,球队大腿连场进球,主力边卫又受重伤

3-2!国安击败中超新土豪,球队大腿连场进球,主力边卫又受重伤

体坛鉴春秋
2026-02-09 22:10:48
2026-02-10 05:07:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11206文章数 116966关注度
往期回顾 全部

科技要闻

实测|字节新模型带着音效和复杂运镜杀疯了

头条要闻

人民日报评"南博事件":无论涉及到什么人 绝不放任

头条要闻

人民日报评"南博事件":无论涉及到什么人 绝不放任

体育要闻

不会打篮球,如何入选詹娜前男友第一阵容

娱乐要闻

央视电影活动名场面!明星站位太讲究

财经要闻

沪深北交易所优化再融资 释放3个信号

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

旅游
亲子
房产
时尚
家居

旅游要闻

把银河搬到海边,灯里游太空!2026粤港澳大湾区灯会启幕

亲子要闻

越讨厌跑得越远

房产要闻

海南又一千亿级赛道出现,京东、华润、中石化等巨头率先杀入!

冬季穿衣越简单越实用!从这些日常穿搭中收获灵感,大方又自然

家居要闻

山院焕新 雅聚悦亲朋

无障碍浏览 进入关怀版