网易首页 > 网易号 > 正文 申请入驻

Google把Gemini 3拆成4个尺寸,最小的能在树莓派上跑

0
分享至


4亿次下载、10万个社区魔改版——这是Google开源模型Gemma交出的成绩单。现在第四代来了,而且这次连许可证都换了。

Google DeepMind CEO Demis Hassabis说得很直接:「这是各自尺寸下全世界最好的开源模型。」

从手机到工作站:一条产品线全吃掉

Gemma 4这次发了四个型号,跨度大得有点离谱。最小的E2B(Effective 2B)能在树莓派和Jetson Nano上跑,最大的31B Dense模型目前在Arena AI开源模型排行榜上排第三。

中间夹着E4B(Effective 4B)和26B MoE(混合专家模型)。E2B和E4B是端侧专用,跟Pixel团队、高通、联发科一起调的;26B和31B瞄准开发者的本地工作站和 consumer GPU。

Google claim 两个大模型在Arena AI的 benchmark 上能打比自己大20倍的对手。31B的未量化权重刚好塞进单张80GB的Nvidia H100,量化版 consumer 硬件就能跑。

四个全是多模态,原生支持视频和图片,训练数据覆盖140多种语言。E2B和E4B额外加了原生音频输入,能做语音识别。上下文窗口:端侧模型128K token,两个大的256K。

能力上,Google强调了几点:多步推理改进、原生函数调用、结构化JSON输出(给agent工作流用)、离线代码生成。

Android开发者博客的数据:E2B比E4B快3倍,整个端侧家族比上一代Gemma快4倍,电池消耗最高省60%。

许可证换了:Apache 2.0意味着什么

这次最大的变化可能不是模型本身,是许可证。Gemma 4改用Apache 2.0,比前几代宽松得多。

Hugging Face联合创始人Clément Delangue的原话:「a huge milestone。」

开源模型圈的许可证战争打了很多年。Apache 2.0允许商用、允许修改、允许闭源衍生,只要求保留版权声明和免责声明。Gemma前几代用的自定义许可证有不少限制条款,开发者用起来总得先找法务过一遍。

现在不用了。这解释了为什么Hugging Face的人这么兴奋——他们的平台上现在可以直接 fork、改、商用, friction 低了一个数量级。

Google这一步踩得很有意思。Meta的Llama系列用自定义许可证,限制商用规模;Mistral也是自定义条款。Apache 2.0在合规成本上是个降维打击,尤其对企业用户。

跟Android绑定的野心

E2B和E4B不只是独立模型,它们是Gemini Nano 4的基座——Google下一代Android端侧模型,今年晚些时候上consumer设备。

这个链条很清晰:Gemma 4开源出来攒开发者口碑和社区生态,Gemini Nano 4闭源集成进Android系统服务。开源打声量,闭源赚用户。

Google跟高通、联发科的深度合作也在这里。端侧AI的瓶颈从来不是模型大小,是NPU调度、内存带宽、功耗墙。Pixel团队参与调E2B/E4B,说明这模型从一开始就是为Android设备的硬件特性优化的。

一个细节:E2B比E4B快3倍,但两者都是"端侧"定位。这个差距暗示Google在模型架构上做了差异化取舍——E2B可能更适合实时性要求高的场景(比如语音助手唤醒),E4B留给能容忍延迟的复杂任务。

排行榜第三,但开源模型的战场变了

31B Dense排Arena AI第三,26B MoE排第六。这个成绩不错,但排行榜本身的意义在贬值。

去年开始,开源模型的竞争维度从" benchmark 分数"转向"落地成本"。同样跑70B级别的能力,用20B MoE还是31B Dense,推理成本差几倍。Google claim 能打20倍体量的对手,说的就是性价比。

另一个变化是多模态变成标配。Gemma 4四个型号全带视觉能力,128K/256K的上下文窗口也比上一代翻倍。这意味着端侧模型现在能处理整本PDF、长视频片段,而不只是问答对话。

函数调用和结构化输出是agent基础设施。Google明显在押注2025年的AI应用形态:不是聊天机器人,是能调用工具、执行多步骤任务的agent。Gemma 4的原生支持让开发者不用自己 hack 提示词工程。

4亿下载之后的下一步

Gemma从2024年初发布到现在,4000多万下载、10万社区变体。这个数字在开源模型里仅次于Llama,但Llama有Meta的全站流量加持。

Gemma 4的渠道布局很全:Hugging Face、Kaggle、Ollama首发,31B和26B上Google AI Studio,端侧模型进AI Edge Gallery。基本上开发者在哪活跃,Google就把模型放哪。

一个值得观察的点:Gemma 4和Gemini 3共享技术栈,但Gemini 3本身还没完全铺开。Google似乎在用自己的闭源旗舰给开源产品线"技术背书",同时用开源产品的反馈迭代闭源版本。

这种双向流动的效率,是单纯做开源或单纯做闭源的公司很难复制的。

端侧AI的2025年会非常热闹。Apple Intelligence还没出中文,Gemini Nano 4就要来了。Google把E2B/E4B的基座开源出来,等于提前给开发者发了一张"Android端侧AI"的体验票。

当你的手机能在本地跑一个2B参数、128K上下文、支持语音图像的多模态模型时,你最先想用它做什么?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
现在的烧烤店,擦边文化盛行。。

现在的烧烤店,擦边文化盛行。。

微微热评
2026-04-20 11:55:03
45岁宋佳:陪玩陪睡、风流成性传闻真相揭秘

45岁宋佳:陪玩陪睡、风流成性传闻真相揭秘

暗香暗香
2026-03-23 04:26:38
日本新书揭露:日本正在“慢慢变穷”,但国内却没人注意

日本新书揭露:日本正在“慢慢变穷”,但国内却没人注意

知识圈
2026-04-19 20:56:51
张近东资产清零,张朝阳手握百亿现金:两种人生,一个忠告

张近东资产清零,张朝阳手握百亿现金:两种人生,一个忠告

老特有话说
2026-03-26 14:31:44
眼角塌陷,满脸疲态,都51岁中老年了还谈恋爱?钟汉良放过观众吧

眼角塌陷,满脸疲态,都51岁中老年了还谈恋爱?钟汉良放过观众吧

得得电影
2026-04-19 11:42:40
更新大潮来了?中央发文定调:2026年起20年房龄老房子或又吃香了

更新大潮来了?中央发文定调:2026年起20年房龄老房子或又吃香了

专业聊房君
2026-04-18 16:45:50
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

不似少年游
2026-04-17 19:31:49
《八千里路云和月》大结局,田家泰牺牲,七哥的真正身份曝光

《八千里路云和月》大结局,田家泰牺牲,七哥的真正身份曝光

看尽落尘花q
2026-04-19 23:49:01
中国媒体揭示外蒙古异象:女性过剩引发社会观察,为何女多男少?

中国媒体揭示外蒙古异象:女性过剩引发社会观察,为何女多男少?

老鹈爱说事
2026-04-19 15:26:10
D19 卖 21 万还能挣钱,零跑是怎么做到的?

D19 卖 21 万还能挣钱,零跑是怎么做到的?

小怪吃美食
2026-04-20 11:46:10
32岁帅小伙与54岁大妈,街头热吻!网友:这小伙也是真的“饿”了

32岁帅小伙与54岁大妈,街头热吻!网友:这小伙也是真的“饿”了

川渝视觉
2026-04-17 22:26:16
朱丹周一围杭州买两套房!一套住一套播,这盘棋下得太妙了

朱丹周一围杭州买两套房!一套住一套播,这盘棋下得太妙了

乐悠悠娱乐
2026-03-24 11:25:08
《八千里路云和月》:从剧情到男主角,还有这样哄人的国产剧吗?

《八千里路云和月》:从剧情到男主角,还有这样哄人的国产剧吗?

北方丽人读书观史
2026-04-18 11:52:47
美国至少10名科研人员离奇死亡或神秘失踪引发广泛关注!大都接触UFO、航空航天、原子能等涉密项目,白宫承诺:彻查

美国至少10名科研人员离奇死亡或神秘失踪引发广泛关注!大都接触UFO、航空航天、原子能等涉密项目,白宫承诺:彻查

大风新闻
2026-04-20 09:35:11
意外!三镇多轮不胜后做出重要决定!将自上而下启动全方位调整

意外!三镇多轮不胜后做出重要决定!将自上而下启动全方位调整

振刚说足球
2026-04-20 13:52:50
任泽平退款730万:价值4500万的恒大花瓶

任泽平退款730万:价值4500万的恒大花瓶

超先声
2026-04-17 16:34:01
瓜迪奥拉:我要哭了!哈兰德:他TM就是卡纳瓦罗!

瓜迪奥拉:我要哭了!哈兰德:他TM就是卡纳瓦罗!

砚底沉香
2026-04-20 09:03:22
徐冬冬尹子维官宣生娃:不办婚礼不晒娃,这届明星终于活明白了

徐冬冬尹子维官宣生娃:不办婚礼不晒娃,这届明星终于活明白了

小猫娱乐叭叭
2026-04-18 17:34:18
41岁男子威胁女邻居发生关系,事后女子为自证清白,让他再来一次

41岁男子威胁女邻居发生关系,事后女子为自证清白,让他再来一次

丫头舫
2026-04-10 21:54:02
反腐再出新规!5月1日起严纠违规“人情往来” ,筑牢腐败防线!

反腐再出新规!5月1日起严纠违规“人情往来” ,筑牢腐败防线!

细说职场
2026-04-19 16:04:52
2026-04-20 14:48:49
全栈遛狗员
全栈遛狗员
白天跟需求对线,晚上在小区遛狗。
1580文章数 50关注度
往期回顾 全部

数码要闻

华硕推出OLED专业显示器PA32USD:31.5" UHD 240Hz,ΔE<1

头条要闻

媒体:伊朗刚说不谈 美国立即开打

头条要闻

媒体:伊朗刚说不谈 美国立即开打

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

鹿晗生日上热搜,被关晓彤撕下体面

财经要闻

月之暗面IPO迷局

科技要闻

蓝色起源一级火箭完美回收 客户卫星未入轨

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

艺术
游戏
亲子
公开课
军事航空

艺术要闻

王羲之《换鹅帖》尚在人间,惊艳无比!

《GT7》制作人官宣更新!神秘新车剪影引爆玩家猜测

亲子要闻

“疑似被鼠药污染”,国际知名婴幼儿食品多国下架

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:美舰向伊朗货船开火炸出个洞

无障碍浏览 进入关怀版