网易首页 > 网易号 > 正文 申请入驻

谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草

0
分享至


新智元报道

编辑:元宇

【新智元导读】大模型越来越大,开发者的「算力焦虑」也越来越严重。谷歌的Gemma却另辟蹊径:模型不求大,够用才是王道。Gemma 3系列,尤其是新成员Gemma 3 270M正是这一理念的最佳诠释者。它虽然「身板小」,却能承担各种AI实战任务,还能「组团」一起干大事。

大块头不等于大智慧。

这在生成式AI领域,已逐渐成为共识。

Gemma 3系列的成功就是一个很好的例证。

在过去几个月,是Gemma 3系列开源模型的高光时刻。

先是Gemma 3和Gemma 3 QAT,在云端和本地桌面加速器上,均跑出了SOTA级别的表现。

紧接着,主打「移动优先」的Gemma 3n完整版,将强大、实时的多模态生成式AI直接带入边缘设备。

上周,Gemma系列模型的总下载量突破了2亿大关,Gemmaverse社区的热度空前高涨。

Google又乘势推出了Gemma 3 270M。

看名字中的「M」就知道,它的目标不是「通吃一切」,而是要以更低成本、更高效率、更快速度地完成你交给它的活。

小身板,真能打

Gemma 3 270M是Gemma 3系列中参数规模最小的。

别看它个头小,能量却不可小觑。

在IFEval基准测试上,Gemma 3 270M树立了性能新标杆。


它的IFEval分数接近50%,显著高于一些相同尺寸甚至更大尺寸的模型。

在小模型阵营里,它是唯一接近50%水平的,意味着它在指令跟随任务中表现非常突出。

再加上其出色的文本结构化能力,让它更适用于面向特定任务的微调,从而在端侧部署和科研应用方面均展现出独特优势。

在效率上,Gemma 3 270M在中小模型中表现最优,甚至超越了更大规模的Qwen 2.5 0.5B和SmolLM2-360M;但与1B级别的模型相比,仍有20~25个百分点的IFEval差距:这是极致压缩带来的不可避免损失。

综合来看,Gemma 3 270M重要的性能亮点有:

小体积,强架构:模型中的1.7亿参数用在词嵌入层,支持256k超大词表,能识别冷门Token,适合细分行业和语言环境下微调使用。剩下1亿参数,则用于Transformer块;

省电狂魔:Google在Pixel 9 Pro上实测,INT4量化版本进行25轮对话只耗0.75%电量,是迄今最节能的Gemma模型;

跟指令超听话:除了预训练版本外,Google还放出了指令微调模型,开箱即用,能直接处理常规的指令类任务;

量产级QAT支持,部署无忧:模型提供了量化感知训练(QAT)版本,可在INT4精度下运行,性能几乎无损,特别适合资源受限设备的部署需求。

用对AI,才能事半功倍

「挂一幅画,你会用铁锤吗?」

这句话提醒我们:用对AI才能事半功倍。

不是每个AI项目,都需要动用几十亿参数的大模型(大锤),更多情况下,像Gemma 3 270M这样的小模型,反而是你需要的那把「AI扳手」。

Gemma 3 270M推出,正是延续了该系列模型「用对工具」的理念。

它是一款「开箱即战」的高性能基础模型,正如上文在它的性能亮点中提到的,出色的指令跟随能力,经过简单微调后,便可以在文本分类、数据抽取等任务中游刃有余。

此外,它还能直接部署在手机,或者树莓派这样的单片机电脑上。

有了这样一个小而强、易部署的模型作为起点,开发者可以打造轻量、快速且极具成本优势的生产系统。

Plaito AI的CTO Greg Mars对Gemma 3 270M颇为赞赏,认为它可以在自己的M4 Pro上极其快速、高质量的运行。


LLM研究工程师Sebastian Raschka,还贴出了Gemma 3 270M和Qwen3 0.6B的并排比较。

他认为最大的惊喜是Gemma 3 270M只有4个注意力头。


和Qwen3 0.6B的16个注意力头相比,Gemma 3 270M只有4个注意力头,这意味着后者在推理时key/value复用率高,显著降低显存占用和延迟。

因此,Gemma 3 270M更适合部署在低配的本地环境。

虽然Gemma 3 270M刚刚发布,但Gemma 3系列在不同规模的任务中,早已展现出「小而专」的威力。

例如,Adaptive ML与SK Telecom合作解决复杂多语言内容审核的难题时,并没有依赖庞大的通用模型,而是选择了微调一个Gemma 3 4B模型。结果不仅达标,甚至超越了更大体量的专有模型。

Gemma 3 270M延续了这一理念,将「小而专」进一步压缩到极致,把高效、精准的特性下放到更多开发者可直接使用的规模。

比如,你可以用它构建一个「多模型小分队」,每个模型专攻一类任务。

但别以为这种小模型只能用在「单调的」企业系统里,它的专业化能力,同样也能在创意领域干点有趣的事。

例如,Hugging Face的开发者Joshua,就用Gemma 3 270M搞了个基于Transformers.js的网页应用,生成睡前故事,支持离线运行,还能个性化生成角色和情节。

270M,是谁的「理想型」

Gemma 3 270M承袭了Gemma系列的先进架构与强大预训练,具备打造定制应用的理想基础。

如果你的应用场景与下列条件类似,那它就是你的「理想型」:

任务明确、数据量大的场景:如情感分析、实体识别、查询路由、结构化转换、创意写作和合规检查类任务;

预算有限,对响应速度有高要求:模型微调后,可运行在轻量、低成本的本地或终端设备上,能帮你省下大模型的推理成本,速度更快;

希望快速迭代和上线:它可以小时级别完成微调实验,远快于大模型的开发周期;

需要本地部署,保证隐私:Gemma 3 270M支持完全本地化运行,用户数据无需上传云端;

构建多个小模型一起跑:一台设备上部署多个任务专家模型也不吃力,控制预算的同时实现模型能力最大化。

Gemma 3 270M采用与其他Gemma 3模型一致的架构,并配套提供微调方法与工具,帮助开发者轻松将其打造成自己专属的解决方案。

下载模型:Hugging Face、Ollama、Kaggle、LM Studio、Docker全平台覆盖,可以获取预训练模型及指令微调版本;

试跑体验:在Vertex AI或llama.cpp、Gemma.cpp、LiteRT、Keras、MLX等主流工具上都能玩;

开始微调:使用Hugging Face、UnSloth、JAX等你熟悉的工具开展微调;

部署上线:微调完成后,可部署到本地环境、Google Cloud Run,或任意你选择的平台。

Gemmaverse的核心理念是:创新无关大小。

Gemma 3,尤其是Gemma 3 270M,是开发者构建「专精小模型舰队」的理想起点。虽然它们身板小,却能承担起各种AI实战任务,组团干大活一点也不含糊。

Gemma 3:开发者手中的「瑞士军刀」

2024年2月,Google推出了Gemma系列的首个版本。

作为Gemini的轻量级版本,Google推出它的初衷很简单,让开发者不再为「模型太大跑不动、模型太小能力不够」而纠结。

Gemma 3上线后,「开源友好」「性价比高」「可塑性强」是众多开发者对它的一致评价,俨然已成为开发者AI工具箱里的「瑞士军刀」。

大模型越来越大,随之而来的是越来越严重的「算力焦虑」,市场对于低硬件需求且效能强劲的AI解决方案始终存在着巨大需求。

「模型不求大,够用才是王道」。

Gemma系列的这一设计理念,正是对上述市场趋势的积极回应,这次Gemma 3 270M的发布,更是将该理念推向一个新的阶段。

参考资料:

https://developers.googleblog.com/en/introducing-gemma-3-270m/

https://huggingface.co/google/gemma-3-270m

https://www.youtube.com/watch?v=qcjrduz_YS8

https://ikala.ai/zh-tw/blog/ikala-ai-insight/gemma-3-intro/


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全运会:山东突破50大关,广东差距被拉大,仅剩36金,看花落谁家

全运会:山东突破50大关,广东差距被拉大,仅剩36金,看花落谁家

萌兰聊个球
2025-11-20 07:53:26
57年,傅作义到功德林看望陈长捷,陈大喊:我这辈子都不会原谅你

57年,傅作义到功德林看望陈长捷,陈大喊:我这辈子都不会原谅你

历史龙元阁
2025-11-19 09:15:09
土豪航:波音飞机2700亿订单!

土豪航:波音飞机2700亿订单!

民航之翼
2025-11-19 09:05:53
12月1日起年检大调整!老车2条件免跑,电车3项严查

12月1日起年检大调整!老车2条件免跑,电车3项严查

沙雕小琳琳
2025-11-20 05:54:49
33分10板!22分22板!联盟第2!对不起,文班亚马,他要抢MIP

33分10板!22分22板!联盟第2!对不起,文班亚马,他要抢MIP

世界体育圈
2025-11-20 09:28:43
乾隆传初进宫的常在侍寝,察觉她不是完璧,盛怒:你跟谁山盟海誓

乾隆传初进宫的常在侍寝,察觉她不是完璧,盛怒:你跟谁山盟海誓

墨说古今
2025-11-16 23:28:42
陈梦夺冠后哭了!让王晓彤把孙颖莎当陈熠打,朝观众做闭嘴手势

陈梦夺冠后哭了!让王晓彤把孙颖莎当陈熠打,朝观众做闭嘴手势

念洲
2025-11-20 07:44:28
“地表最强特警”任山西公安厅副厅长,在反恐特警一线工作20年,曾负责北京奥运会安保任务

“地表最强特警”任山西公安厅副厅长,在反恐特警一线工作20年,曾负责北京奥运会安保任务

鲁中晨报
2025-11-20 07:19:06
一汽丰田新一代RAV4荣放首发亮相

一汽丰田新一代RAV4荣放首发亮相

车轱辘话V
2025-11-20 06:04:38
一年蒸发了10亿元,从网红白酒到狗都不喝,究竟发生了什么?

一年蒸发了10亿元,从网红白酒到狗都不喝,究竟发生了什么?

法老不说教
2025-11-06 20:45:28
央视《四喜》近尾声,最令人讨厌角色出炉,果然真正的坏都是惯的

央视《四喜》近尾声,最令人讨厌角色出炉,果然真正的坏都是惯的

卷史
2025-11-19 18:04:40
1994年,厅级干部夫妇被枪杀,震动中央,凶手供出幕后是人大常委

1994年,厅级干部夫妇被枪杀,震动中央,凶手供出幕后是人大常委

阿胡
2024-02-05 14:34:41
轰动西方的中国奇人,外媒称若他早生100年,美国怕是赶不上中国

轰动西方的中国奇人,外媒称若他早生100年,美国怕是赶不上中国

通文知史
2025-11-17 23:30:03
中日关系高度紧张:不少中国游客依然赴日,给出的理由竟出奇一致

中日关系高度紧张:不少中国游客依然赴日,给出的理由竟出奇一致

艾米手工作品
2025-11-19 00:45:26
广东34分大胜上海!徐昕12分钟砍11+5,实力打脸杜锋,黄明依12分

广东34分大胜上海!徐昕12分钟砍11+5,实力打脸杜锋,黄明依12分

多特体育说
2025-11-19 22:11:35
什么是文明?看挪威富裕后如何对待自己的国民​

什么是文明?看挪威富裕后如何对待自己的国民​

深度报
2025-11-07 22:57:08
陈梦女团夺冠发布会!没想到夺冠,致谢范思琦为自己画上圆满句号

陈梦女团夺冠发布会!没想到夺冠,致谢范思琦为自己画上圆满句号

篮球资讯达人
2025-11-19 23:26:50
网友疯狂!杨瀚森9+5+3原来这么强?美记狂吹,球迷从狂喷到膜拜

网友疯狂!杨瀚森9+5+3原来这么强?美记狂吹,球迷从狂喷到膜拜

嘴炮体坛
2025-11-19 16:02:48
超400亿美元!沙特要订购60架F-15EX和48架F-35A,不买歼-35E了?

超400亿美元!沙特要订购60架F-15EX和48架F-35A,不买歼-35E了?

甜柠聊史
2025-11-19 18:03:11
我师专毕业分在县教育局,同桌分在乡下初中,退休时却是天壤之别

我师专毕业分在县教育局,同桌分在乡下初中,退休时却是天壤之别

辉哥说动漫
2025-11-13 09:43:07
2025-11-20 10:31:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13908文章数 66279关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

牛弹琴:荷兰暂时服软了 给出的理由让全世界哭笑不得

头条要闻

牛弹琴:荷兰暂时服软了 给出的理由让全世界哭笑不得

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

英伟达财报,超预期

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

亲子
艺术
旅游
公开课
军事航空

亲子要闻

山东不能有0!大哥带怀孕17周妻子堕胎,原因曝光网友炸锅

艺术要闻

看完启功再对比,田蕴章行书你能认全吗?

旅游要闻

落叶缤纷美如画 在“古银杏之乡”邂逅金色浪漫

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版