网易首页 > 网易号 > 正文 申请入驻

谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型

0
分享至

机器之心报道

机器之心编辑部

下载下来只有 241 MB。

本周四,谷歌正式发布了 Gemma 3 的最新一款模型。

Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。

它继承了 Gemma 3 系列的先进架构和强大的预训练功能,同时为小尺寸模型带来了强大的指令执行能力。谷歌展示的 IFEval 基准测试成绩所示,在同级模型上,Gemma 3 270M 树立了新的性能水平,使复杂的 AI 功能更容易应用于设备端和研究应用。

IFEval 旨在测试模型执行可验证指令的能力。

Gemma 3 270M 的核心功能主要包括如下几个方面:

  • 紧凑而强大的架构:新模型共有 2.7 亿参数:由于词汇量庞大,嵌入参数有 1.7 亿个,Transformer 模块则有 1 亿个。得益于 256k 个 token 的庞大词汇量,该模型可以处理特定和罕见的 token,使其成为强大的基础模型,可以在特定领域和语言中进一步进行微调。
  • 极致节能:Gemma 3 270M 的一个关键优势是其低功耗。在 Pixel 9 Pro 手机 SoC 上进行的内部测试表明,INT4 量化模型在 25 次对话中仅消耗 0.75% 的电量,使其成为最节能的 Gemma 模型。
  • 指令遵循:谷歌发布了一个指令调整模型,并附带预训练的检查点。虽然该模型并非为复杂的对话用例而设计,但它是一个强大的模型,可以开箱即用地遵循通用指令。
  • 可用于生产的量化:量化感知训练 (QAT) 检查点可用,使人们能够以 INT4 精度运行模型,同时最大程度地减少性能下降,这对于在资源受限的设备上部署至关重要。

对于 1.7 亿个嵌入参数,如何在训练过程中保证不出现嵌入崩溃,谷歌并没有对技术细节进行太多解释。不过在谷歌发布后,AI 社区很快开始了研究。

Sebastian Raschka 第一时间进行了简单的解读,他注意到了新模型的一些架构特点。

谷歌表示,Gemma 3 270M 是一款高质量的基础模型,开箱即用,适用于专业化的任务。在实践中,人们应从紧凑而强大的模型入手,进而构建出精简、快速且运营成本较低的生产系统。

这种思路已在现实世界中取得了很好的成果。谷歌举了 Adaptive ML 与 SK Telecom 合作的成果的例子。面对细致入微的多语言内容审核挑战,他们选择了专业化。Adaptive ML 没有使用大规模通用模型,而是对 Gemma 3 4B 模型进行了微调。从结果上看,专业化的 Gemma 模型达到甚至超越了更大型专有模型在其特定任务上的表现。

Gemma 3 270M 旨在让开发者更进一步利用这种方法,为定义明确的任务释放更高的效率。它是创建一系列小型专业模型的理想起点,每个模型都是各自任务的专家。

这种专业化的力量不仅适用于企业任务,还能帮助个人开发者构建创意应用程序。例如,Hugging Face 团队的成员使用 Gemma 3 270M 为一款使用 Transformers.js 的睡前故事生成器网页应用提供支持。可知,该模型的体量和性能使其非常适合离线、基于网页的创意任务。

谷歌表示,Gemma 3 270M 适用于以下场景:

  • 有一个高容量且定义明确的任务。该模型非常适合情绪分析、实体提取、查询路由、非结构化到结构化文本处理、创意写作和合规性检查等功能。
  • 需要精打细算,时延要求高的任务。它可以大幅降低甚至消除生产中的推理成本,并更快地为用户提供响应。经过微调的 270M 模型可以在轻量级的基础架构上运行,也可以直接在设备上运行。
  • 需要快速迭代和部署的工作。Gemma 3 270M 的小巧体积使其能够快速进行微调实验,帮助你在数小时内(而不是数天)找到适合您用例的完美配置。
  • 需要确保用户隐私的任务。由于该模型可以完全在设备上运行,你可以构建处理敏感信息的应用程序,而无需将数据发送到云端。
  • 你需要一批专门的任务模型。构建并部署多个自定义模型,每个模型都经过专业训练,能够完成不同的任务,而且不会超出预算。

  • 在新模型上,谷歌提供了快速入门的方案和工具。你可以在 Gemma 文档中找到使用 Gemma 3 270M 进行完整微调的指南:https://ai.google.dev/gemma/docs/core/huggingface_text_full_finetune
  • 谷歌同时发布了 Gemma 3 270M 的预训练模型和指令调优模型:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d
  • 你可以在 Vertex AI 上试用模型,或使用 llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX 等热门推理工具进行试用:https://console.cloud.google.com/vertex-ai/publishers/google/model-garden/gemma3

现在,你也可以在 Colab 上尝试自行尝试微调,只需不到 5 分钟即可完成。

过去几个月,谷歌的 Gemma 开放模型系列经历了一系列发布。在 4 月到 5 月,谷歌推出了 Gemma 3 和 Gemma 3 QAT,为单云和桌面级 GPU 提供了不错的 AI 性能。随后在 6 月 25 日,面向移动端的 Gemma 3n 正式发布,为手机等设备引入了强大的实时多模态 AI 能力。

谷歌表示,截止上周,Gemma 系列的累积下载量已经突破了两亿次。

参考内容:

https://developers.googleblog.com/en/introducing-gemma-3-270m/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东部战区发海报!描绘统一后台湾省清明节场景

东部战区发海报!描绘统一后台湾省清明节场景

看看新闻Knews
2026-04-03 23:47:04
女子赴发小婚礼穿瑜伽裤,打扮过于火辣,网友直呼跟没穿似的

女子赴发小婚礼穿瑜伽裤,打扮过于火辣,网友直呼跟没穿似的

一盅情怀
2026-03-16 17:28:45
父亲称女儿被诱骗至柬埔寨遭威胁“轮奸”,女儿露面发声:因网恋自愿前往,绑架是演戏骗家里钱!

父亲称女儿被诱骗至柬埔寨遭威胁“轮奸”,女儿露面发声:因网恋自愿前往,绑架是演戏骗家里钱!

犀利辣椒
2026-04-05 06:39:46
虎跳峡惊魂:生死仅隔 40 厘米,那根断掉的登山杖看哭所有人

虎跳峡惊魂:生死仅隔 40 厘米,那根断掉的登山杖看哭所有人

周哥一影视
2026-04-05 12:44:11
荒唐!猫王一生睡遍3000女人,42岁惨死卧室,内裤褪到大腿根

荒唐!猫王一生睡遍3000女人,42岁惨死卧室,内裤褪到大腿根

七阿姨爱八卦
2026-04-04 18:04:16
杨瀚森前队友生涯之夜!轰33+三双创8新高:21岁拿双向合同搏命

杨瀚森前队友生涯之夜!轰33+三双创8新高:21岁拿双向合同搏命

颜小白的篮球梦
2026-04-06 07:42:37
民政局最新提醒:户口分开不算一家人,这3种证明走遍全国都认

民政局最新提醒:户口分开不算一家人,这3种证明走遍全国都认

李博世财经
2026-04-05 17:20:59
申裕斌无缘决赛采访!直指王曼昱没弱点,强调学习,获牌心情不错

申裕斌无缘决赛采访!直指王曼昱没弱点,强调学习,获牌心情不错

篮球资讯达人
2026-04-05 13:53:56
以色列遭到“背刺”:还没解决伊朗,特朗普已经做好撤退的打算

以色列遭到“背刺”:还没解决伊朗,特朗普已经做好撤退的打算

空天力量
2026-04-05 20:07:25
中方正式宣布:更换国内供应商,从此不再合作!荷兰后悔也没用了

中方正式宣布:更换国内供应商,从此不再合作!荷兰后悔也没用了

犟种美食
2026-04-05 16:26:31
4月5日俄乌:乌克兰无人机的新纪录

4月5日俄乌:乌克兰无人机的新纪录

山河路口
2026-04-05 18:35:42
退休不是“自由身”!2026严管:机关事业单位退休人员兼职红线

退休不是“自由身”!2026严管:机关事业单位退休人员兼职红线

宝哥精彩赛事
2026-04-05 21:40:44
50岁李小冉被赞像30岁!自曝洗脸用26块钱的香皂,还熬夜打游戏

50岁李小冉被赞像30岁!自曝洗脸用26块钱的香皂,还熬夜打游戏

韩小娱
2026-04-06 06:16:00
叶一茜浪姐上班,她是真的胖了,大腿那么粗,走路还有点外八字!

叶一茜浪姐上班,她是真的胖了,大腿那么粗,走路还有点外八字!

小娱乐悠悠
2026-04-05 06:48:49
云南3岁女童在家被眼镜王蛇咬伤全身瘫痪,假死3天奇迹生还

云南3岁女童在家被眼镜王蛇咬伤全身瘫痪,假死3天奇迹生还

大象新闻
2026-04-05 00:48:02
三连冠!埃因霍温提前5轮夺得25/26赛季荷甲冠军

三连冠!埃因霍温提前5轮夺得25/26赛季荷甲冠军

懂球帝
2026-04-05 22:54:28
许昕:竟有这么多人希望王楚钦输!他独守半区 你却盼外国人赢?

许昕:竟有这么多人希望王楚钦输!他独守半区 你却盼外国人赢?

念洲
2026-04-05 06:27:07
西方军事专家:只有吉尔吉斯斯坦知道,中国早就是最强超级大国了

西方军事专家:只有吉尔吉斯斯坦知道,中国早就是最强超级大国了

混沌录
2026-04-05 16:33:12
流量大戏落幕!陈光标兑现承诺,送张雪千万劳斯莱斯已变现捐嫣然

流量大戏落幕!陈光标兑现承诺,送张雪千万劳斯莱斯已变现捐嫣然

雷科技
2026-04-05 20:54:10
现货白银日内跌幅扩大至2%,报71.42美元/盎司

现货白银日内跌幅扩大至2%,报71.42美元/盎司

每日经济新闻
2026-04-06 06:20:05
2026-04-06 08:03:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12681文章数 142613关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗媒体:多名美士兵在营救行动中身亡 美军试图摧毁遗体

头条要闻

伊朗媒体:多名美士兵在营救行动中身亡 美军试图摧毁遗体

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

本地
家居
手机
时尚
公开课

本地新闻

跟着歌声游安徽,听古村回响

家居要闻

温馨多元 爱的具象化

手机要闻

OPPO Find X9s Pro银色哈苏专业增距镜亮相:观赛神器 颜值拉满

伊姐清明热推:电视剧《暴锋雨》;电影《我,许可》......

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版