网易首页 > 网易号 > 正文 申请入驻

Google把31B模型塞进Android Studio

0
分享至


2024年4月,一个Android开发者在Reddit上吐槽:「我在飞机上改bug,Copilot断了,我像个原始人。」这条帖子被顶了2400次。14个月后,Google的回应来了——不是补丁,是直接把一个31B参数的模型塞进你的IDE,断网也能用。

4月2日,Gemma 4正式发布。没有发布会,没有 Sundar Pichai 站台,只有一条技术博客和Android Studio里的更新提示。但开发者社区的反应是:「等等,这玩意真的在本地跑?」

是的。E2B和E4B两个轻量版本,26B和31B两个满血版本,全部可以离线运行。你的代码不再流向任何服务器,Agent Mode能跨文件改代码、写测试、查文档——而这一切发生在你的笔记本上。

「云优先」是个美丽的陷阱

过去三年,AI编程助手几乎成了标配。GitHub Copilot、Cursor、甚至Google自己的Gemini Code Assist,它们有个共同前提:你得联网。Token配额用完?等下个月。API密钥泄露?重新生成。企业代码上传云端?先过安全审查。

这些不是边缘场景。某金融科技公司的技术负责人告诉我,他们的合规团队花了8个月才批准使用云端AI工具——条件是「核心模块代码不得上传」。最后方案是:买两台带A100的本地服务器,团队排队用。

更隐蔽的问题是节奏控制。一个中等规模的Android项目,Agent Mode一次深度查询可能消耗数万Token。按OpenAI的定价,一个月轻松烧掉几百美元。但真正的成本不是钱,是中断——当你卡在「Rate limit exceeded」的提示前,思路断了。

Gemma 4的本地架构直接抹掉了这三层摩擦。没有配额,没有密钥,没有网络依赖。Google DeepMind的工程师在发布说明里写了一句很少见的话:「核心操作无需API密钥。」翻译过来:我们不打算从这个功能上直接赚钱。

31B塞进笔记本,怎么做到的

Gemma 4的四个版本中,31B Dense是性能怪兽。它在LMSYS Arena排行榜上位列开源模型第三,超过Llama 3 70B和Qwen 2.5 72B。但参数只有后者的一半不到。

秘密在于训练后优化。Google用了知识蒸馏(knowledge distillation)把Gemini 3的能力压缩进更小的架构,再加上针对ARM芯片的量化方案。结果是:M3 Max MacBook Pro可以流畅运行E4B版本,31B在RTX 4090上响应延迟低于2秒。

但Android开发者真正该看的是E2B和E4B。这两个版本专为边缘设备设计,128K上下文窗口,原生支持函数调用(function calling),能处理文本、图像、视频、音频的多模态输入。E2B在Pixel 9上实测可用——虽然慢,但能跑。

一个关键细节:Gemma 4支持「投机解码」(speculative decoding)。简单说,模型会同时生成多个候选答案,用更快的草稿模型筛选,最终输出质量不变但速度快40%。这个技术在云端大模型里常见,但在本地运行的开源模型中,Gemma 4是首批实装的。

Agent Mode不是更聪明的补全,是另一个物种

传统的AI编程助手是「你写,它猜」。Agent Mode是「你说,它干」。我在Android Studio 2025.1.1 Preview里测试了Gemma 4的Agent Mode,场景是:给一个三年前的Kotlin项目加Jetpack Compose支持。

指令很简单:「把MainActivity的XML布局改成Compose,保持原有逻辑。」Agent Mode的执行路径是:先读build.gradle确认依赖版本,再分析现有布局文件的结构,生成Compose代码,最后提出需要手动调整的硬编码颜色值。全程没有生成无法编译的中间状态。

这背后是「工具使用」(tool use)能力的落地。Gemma 4在本地维护了一个符号索引,能调用Android Studio的代码分析API、Gradle构建系统、甚至模拟器状态。它不是在读代码,是在操作IDE。

Google的演示视频里有个更激进的例子:开发者说「这个崩溃只在低内存设备上出现,帮我复现」,Agent Mode自动调低模拟器内存配置、运行测试、抓取日志、定位到Bitmap未回收的泄漏点。这个过程没有预设脚本,是模型根据问题描述自主规划的步骤。

代价是显存。31B版本需要约48GB显存才能全速运行,E4B压缩到8GB可用。Google的解决方案是分层加载——常用代码分析模块常驻内存,生成功能按需唤醒。实际体验中,16GB M3 Pro Mac的交换内存压力明显,但可用。

为什么是现在?

本地大模型不是新概念。Llama.cpp、Ollama、LM Studio这些工具已经存在两年。但它们的共同问题是:模型和工具链脱节。你得自己下载、配置、对接IDE,Agent能力几乎为零。

Google的赌注是:开发者愿意为「零配置」买单。Gemma 4在Android Studio里的集成深度,是第三方工具无法复制的。代码补全、重构建议、错误解释、测试生成,全部走同一套本地推理管道,上下文共享,没有「 Copilot 和 IDE 各说各话」的割裂感。

更深层的动机可能是防御。2024年,Cursor以「AI-native IDE」的定位拿下40亿美元估值,其核心卖点就是深度集成的Agent能力。Google不能让Android开发的最佳体验出现在别人的编辑器里。

但Gemma 4的开放程度也出人意料。模型权重在Hugging Face和Kaggle完全开源,允许商业使用,没有「月活超过X需付费」的隐藏条款。Google的AI Studio还提供了微调接口,可以用企业私有代码库继续训练。

一位在Square工作的Android工程师告诉我,他们已经在评估用Gemma 4替代内部托管的Code Llama。「同样的硬件,Gemma 4的Kotlin代码质量明显更好。而且我们不需要维护模型服务了,Android Studio自己搞定。」

谁还没准备好

不是所有开发者都能立即迁移。Windows平台的支持目前滞后——Gemma 4的本地优化主要针对Apple Silicon和Linux,Windows版Android Studio还需要通过WSL2迂回。Google承诺Q2解决,但时间表模糊。

更现实的障碍是硬件门槛。E4B需要至少8GB统一内存或显存,31B版本建议32GB起步。这意味着2019年之前的Intel Mac、大多数Windows笔记本、全部Chromebook被排除在外。Google的回应是云端回退——硬件不达标时自动切到Gemini API,但这又回到了老问题。

企业采纳的另一个未知数是审计。虽然代码不出本机,但模型本身的行为是否可解释?Gemma 4的推理过程是黑箱,生成的代码是否包含许可证冲突的片段?Google提供了输出溯源功能,能标记与训练数据相似的代码块,但精确度有限。

Reddit上有个高赞评论:「我终于可以把Copilot订阅停了,但我要先买台M4 Mac。」这条回复下面有217条讨论,核心分歧是:本地AI节省的订阅费,多久能抵消硬件升级成本?

你的开发环境现在是什么配置?如果升级硬件能彻底摆脱云端AI的配额焦虑,这笔账你会怎么算?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
把刘涛抱在怀里,有谁注意到他手上的小动作,人品如何一目了然。

把刘涛抱在怀里,有谁注意到他手上的小动作,人品如何一目了然。

动物奇奇怪怪
2026-03-27 07:28:03
放下“旧怨”,这两座古城不争了?

放下“旧怨”,这两座古城不争了?

中国新闻周刊
2026-04-04 12:39:55
来自广西南丹的王梓莼,身高173cm 美的无可挑剔,高级感满满

来自广西南丹的王梓莼,身高173cm 美的无可挑剔,高级感满满

喜欢历史的阿繁
2026-04-04 18:13:53
婚前收父母6000万转账,刚想告诉丈夫,他:我们家很多亲戚你要帮

婚前收父母6000万转账,刚想告诉丈夫,他:我们家很多亲戚你要帮

云端小院
2026-04-05 09:26:12
孙颖莎12100分绝对优势领跑!蒯曼回升第四,覃予萱创个人新高

孙颖莎12100分绝对优势领跑!蒯曼回升第四,覃予萱创个人新高

烧体坛
2026-04-05 20:50:26
世体:贝尔纳尔想踢和马竞的次回合,但巴萨不会冒险

世体:贝尔纳尔想踢和马竞的次回合,但巴萨不会冒险

懂球帝
2026-04-06 03:54:05
日本球迷看好松岛辉空:把王楚钦逼到绝境瘫倒,不用多久就能超越

日本球迷看好松岛辉空:把王楚钦逼到绝境瘫倒,不用多久就能超越

杨华评论
2026-04-06 00:25:53
发现一个奇怪现象:喜欢吼老公,训孩子的女人,其实很值得尊重

发现一个奇怪现象:喜欢吼老公,训孩子的女人,其实很值得尊重

枕边聊育儿
2026-03-30 09:54:59
专家警告:每天吃一根香蕉,就等于给心脏“踩刹车”?真相来了

专家警告:每天吃一根香蕉,就等于给心脏“踩刹车”?真相来了

路医生健康科普
2026-04-05 11:20:07
人还没走红帽先扣!郑丽文赴陆,民进党对抗,天价军购成一场闹剧

人还没走红帽先扣!郑丽文赴陆,民进党对抗,天价军购成一场闹剧

小兰聊历史
2026-04-06 03:30:38
考拉悄然长大,钟丽缇小女儿颜值惊艳,眉眼间尽是妈妈的绝世美貌

考拉悄然长大,钟丽缇小女儿颜值惊艳,眉眼间尽是妈妈的绝世美貌

庭小娱
2026-04-05 17:47:28
美论坛:为什么中国在明确我们不会偿还的情况下还要购买美债?

美论坛:为什么中国在明确我们不会偿还的情况下还要购买美债?

共工之锚
2026-04-06 00:15:47
特朗普更新两则动态

特朗普更新两则动态

Nee看
2026-04-05 21:23:08
16岁女生上课总犯困,坐着就能“秒睡”,家长认为其学习态度不端正,经医生检查评估确诊为发作性睡病

16岁女生上课总犯困,坐着就能“秒睡”,家长认为其学习态度不端正,经医生检查评估确诊为发作性睡病

大象新闻
2026-04-05 22:45:02
奉劝老年人:任何人请你吃饭,不管去与不去,必须先搞清4件事

奉劝老年人:任何人请你吃饭,不管去与不去,必须先搞清4件事

叮当当科技
2026-04-05 17:06:09
伊朗导弹击中以色列海法导致多人受伤

伊朗导弹击中以色列海法导致多人受伤

财联社
2026-04-06 00:17:40
足总杯彻底乱了:随着南安普顿2-1,曼城4-0,2大豪门被送回家

足总杯彻底乱了:随着南安普顿2-1,曼城4-0,2大豪门被送回家

凌空倒钩
2026-04-05 06:23:14
四川一父亲被女儿杀害,审讯室中的女儿:他不是人,他就是畜生

四川一父亲被女儿杀害,审讯室中的女儿:他不是人,他就是畜生

林林故事揭秘
2025-01-16 14:57:20
人心不足蛇吞象啊!云南宝妈发帖,怒斥公婆只会出钱,不帮带孩子

人心不足蛇吞象啊!云南宝妈发帖,怒斥公婆只会出钱,不帮带孩子

火山詩话
2026-04-04 11:13:00
深圳的楼市开始价格上涨了

深圳的楼市开始价格上涨了

房产有点意思
2026-04-05 23:54:33
2026-04-06 05:59:00
灰度测试中
灰度测试中
生活正在重构,目前还在灰度测试阶段,暂不全量发布。
819文章数 10关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗军方:过去两天击落美12架战机 含4架“黑鹰”

头条要闻

伊朗军方:过去两天击落美12架战机 含4架“黑鹰”

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

时尚
家居
亲子
教育
军事航空

伊姐清明热推:电视剧《暴锋雨》;电影《我,许可》......

家居要闻

温馨多元 爱的具象化

亲子要闻

小英自曝给女儿剪短发原因!怕头发抢营养长不高,想剃光头太真实

教育要闻

临时组队、跨国搭档!两个成都女孩拿下亚洲辩论冠军

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版