网易首页 > 网易号 > 正文 申请入驻

谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型

0
分享至

机器之心报道

机器之心编辑部

下载下来只有 241 MB。

本周四,谷歌正式发布了 Gemma 3 的最新一款模型。

Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。

它继承了 Gemma 3 系列的先进架构和强大的预训练功能,同时为小尺寸模型带来了强大的指令执行能力。谷歌展示的 IFEval 基准测试成绩所示,在同级模型上,Gemma 3 270M 树立了新的性能水平,使复杂的 AI 功能更容易应用于设备端和研究应用。

IFEval 旨在测试模型执行可验证指令的能力。

Gemma 3 270M 的核心功能主要包括如下几个方面:

  • 紧凑而强大的架构:新模型共有 2.7 亿参数:由于词汇量庞大,嵌入参数有 1.7 亿个,Transformer 模块则有 1 亿个。得益于 256k 个 token 的庞大词汇量,该模型可以处理特定和罕见的 token,使其成为强大的基础模型,可以在特定领域和语言中进一步进行微调。
  • 极致节能:Gemma 3 270M 的一个关键优势是其低功耗。在 Pixel 9 Pro 手机 SoC 上进行的内部测试表明,INT4 量化模型在 25 次对话中仅消耗 0.75% 的电量,使其成为最节能的 Gemma 模型。
  • 指令遵循:谷歌发布了一个指令调整模型,并附带预训练的检查点。虽然该模型并非为复杂的对话用例而设计,但它是一个强大的模型,可以开箱即用地遵循通用指令。
  • 可用于生产的量化:量化感知训练 (QAT) 检查点可用,使人们能够以 INT4 精度运行模型,同时最大程度地减少性能下降,这对于在资源受限的设备上部署至关重要。

对于 1.7 亿个嵌入参数,如何在训练过程中保证不出现嵌入崩溃,谷歌并没有对技术细节进行太多解释。不过在谷歌发布后,AI 社区很快开始了研究。

Sebastian Raschka 第一时间进行了简单的解读,他注意到了新模型的一些架构特点。

谷歌表示,Gemma 3 270M 是一款高质量的基础模型,开箱即用,适用于专业化的任务。在实践中,人们应从紧凑而强大的模型入手,进而构建出精简、快速且运营成本较低的生产系统。

这种思路已在现实世界中取得了很好的成果。谷歌举了 Adaptive ML 与 SK Telecom 合作的成果的例子。面对细致入微的多语言内容审核挑战,他们选择了专业化。Adaptive ML 没有使用大规模通用模型,而是对 Gemma 3 4B 模型进行了微调。从结果上看,专业化的 Gemma 模型达到甚至超越了更大型专有模型在其特定任务上的表现。

Gemma 3 270M 旨在让开发者更进一步利用这种方法,为定义明确的任务释放更高的效率。它是创建一系列小型专业模型的理想起点,每个模型都是各自任务的专家。

这种专业化的力量不仅适用于企业任务,还能帮助个人开发者构建创意应用程序。例如,Hugging Face 团队的成员使用 Gemma 3 270M 为一款使用 Transformers.js 的睡前故事生成器网页应用提供支持。可知,该模型的体量和性能使其非常适合离线、基于网页的创意任务。

谷歌表示,Gemma 3 270M 适用于以下场景:

  • 有一个高容量且定义明确的任务。该模型非常适合情绪分析、实体提取、查询路由、非结构化到结构化文本处理、创意写作和合规性检查等功能。
  • 需要精打细算,时延要求高的任务。它可以大幅降低甚至消除生产中的推理成本,并更快地为用户提供响应。经过微调的 270M 模型可以在轻量级的基础架构上运行,也可以直接在设备上运行。
  • 需要快速迭代和部署的工作。Gemma 3 270M 的小巧体积使其能够快速进行微调实验,帮助你在数小时内(而不是数天)找到适合您用例的完美配置。
  • 需要确保用户隐私的任务。由于该模型可以完全在设备上运行,你可以构建处理敏感信息的应用程序,而无需将数据发送到云端。
  • 你需要一批专门的任务模型。构建并部署多个自定义模型,每个模型都经过专业训练,能够完成不同的任务,而且不会超出预算。

  • 在新模型上,谷歌提供了快速入门的方案和工具。你可以在 Gemma 文档中找到使用 Gemma 3 270M 进行完整微调的指南:https://ai.google.dev/gemma/docs/core/huggingface_text_full_finetune
  • 谷歌同时发布了 Gemma 3 270M 的预训练模型和指令调优模型:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
  • 你可以在 Vertex AI 上试用模型,或使用 llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX 等热门推理工具进行试用:https://console.cloud.google.com/vertex-ai/publishers/google/model-garden/gemma3

现在,你也可以在 Colab 上尝试自行尝试微调,只需不到 5 分钟即可完成。

过去几个月,谷歌的 Gemma 开放模型系列经历了一系列发布。在 4 月到 5 月,谷歌推出了 Gemma 3 和 Gemma 3 QAT,为单云和桌面级 GPU 提供了不错的 AI 性能。随后在 6 月 25 日,面向移动端的 Gemma 3n 正式发布,为手机等设备引入了强大的实时多模态 AI 能力。

谷歌表示,截止上周,Gemma 系列的累积下载量已经突破了两亿次。

参考内容:

https://developers.googleblog.com/en/introducing-gemma-3-270m/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
狂飙不止!韩国股市涨到熔断,SK海力士市值破万亿美元,一年暴涨900%、市盈率仅6倍

狂飙不止!韩国股市涨到熔断,SK海力士市值破万亿美元,一年暴涨900%、市盈率仅6倍

金融界
2026-05-27 10:56:30
“宁愿死也不会向中国低头”——最硬气的铃木,如今怎么样了?

“宁愿死也不会向中国低头”——最硬气的铃木,如今怎么样了?

时评人李文君
2026-05-07 19:57:28
不敢对抗美国,欧盟调转枪口对准中国?不料中方早就有了准备

不敢对抗美国,欧盟调转枪口对准中国?不料中方早就有了准备

空天力量
2026-05-27 13:08:17
胖东来真刚!男子买茶叶后发现其中一根头发,客服直接退1赔10

胖东来真刚!男子买茶叶后发现其中一根头发,客服直接退1赔10

听心堂
2026-05-26 14:57:43
摩洛哥队世界杯26人名单:总身价4.7亿 中超旧将入选 2大功臣无缘

摩洛哥队世界杯26人名单:总身价4.7亿 中超旧将入选 2大功臣无缘

我爱英超
2026-05-27 06:09:26
“湿度快赶上亚马孙雨林了”,南方城市有居民连夜购买除湿机,电商平台湖北地区订单暴涨5倍

“湿度快赶上亚马孙雨林了”,南方城市有居民连夜购买除湿机,电商平台湖北地区订单暴涨5倍

极目新闻
2026-05-26 19:26:18
离谱,录像确认球被雷霆破坏出界,裁判仍将球权给雷霆&吹马刺技犯

离谱,录像确认球被雷霆破坏出界,裁判仍将球权给雷霆&吹马刺技犯

懂球帝
2026-05-27 10:55:42
NBA官宣:绿军37岁少帅马祖拉获年度最佳教练 创52年最年轻纪录

NBA官宣:绿军37岁少帅马祖拉获年度最佳教练 创52年最年轻纪录

醉卧浮生
2026-05-27 08:12:53
特斯拉中国官网新增自动换挡,要来了!

特斯拉中国官网新增自动换挡,要来了!

花果科技
2026-05-26 22:41:36
“韬定律”不是华为的独角戏

“韬定律”不是华为的独角戏

观察者网
2026-05-26 13:25:36
咋回事?跳号了?神舟二十二号乘组消失了?原因让人肃然起敬!

咋回事?跳号了?神舟二十二号乘组消失了?原因让人肃然起敬!

Thurman在昆明
2026-05-25 15:28:25
马云“跑了”,阿里套现300亿走人

马云“跑了”,阿里套现300亿走人

史潎的生活日记
2026-05-25 21:23:21
保安用手接下跳楼女孩,被砸瘫痪无钱救治,女孩家属:你多管闲事

保安用手接下跳楼女孩,被砸瘫痪无钱救治,女孩家属:你多管闲事

莫地方
2026-05-25 01:05:03
江苏入梅最新消息!开空调!开空调!

江苏入梅最新消息!开空调!开空调!

南通攻略
2026-05-27 09:20:14
广西一对新手爸妈按照豆包建议每顿只给满月宝宝喂60ml奶,把孩子饿的哭闹不止,医生:远达不到生长需求

广西一对新手爸妈按照豆包建议每顿只给满月宝宝喂60ml奶,把孩子饿的哭闹不止,医生:远达不到生长需求

扬子晚报
2026-05-27 12:14:55
传奇落幕!曝40岁魔笛在世界杯后宣布退役 2原因让他拒与米兰续约

传奇落幕!曝40岁魔笛在世界杯后宣布退役 2原因让他拒与米兰续约

我爱英超
2026-05-27 07:15:52
涉嫌严重违纪违法,崔汝山被查

涉嫌严重违纪违法,崔汝山被查

都市快报橙柿互动
2026-05-27 00:31:05
胡锡进:华为会被历史至少记住1000年,嘲讽的人让我无法理解

胡锡进:华为会被历史至少记住1000年,嘲讽的人让我无法理解

映射生活的身影
2026-05-26 02:07:09
朝鲜战争结束后,74名人民军战俘选择前往中立国,之后结局如何?

朝鲜战争结束后,74名人民军战俘选择前往中立国,之后结局如何?

浩渺青史
2026-05-27 01:34:10
新加坡媒体:警惕!《给阿嬷的情书》正在东南亚华人社会悄悄蔓延

新加坡媒体:警惕!《给阿嬷的情书》正在东南亚华人社会悄悄蔓延

手工制作阿歼
2026-05-27 09:00:23
2026-05-27 14:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13094文章数 142653关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

专家:全国多地降雨量突破历史极值 这是一种异常现象

头条要闻

专家:全国多地降雨量突破历史极值 这是一种异常现象

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

小S晒归宁宴旧照,大S穿吊带裙扎丸子头

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

极狐问道V9今日将正式上市 搭载华为雪鸮增程系统

态度原创

时尚
本地
游戏
数码
艺术

多巴胺“粉”,赫本是这样穿的!

本地新闻

用剪纸的方式,打开江苏扬州

SE移除《八方旅人0》D加密

数码要闻

买显卡送真黄金!技嘉40周年RTX 5090促销:买就赠1克999纯金

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

无障碍浏览 进入关怀版