网易首页 > 网易号 > 正文 申请入驻

Google把70亿参数塞进手机:没网也能跑大模型

0
分享至

2023年,一位苹果工程师在内部会议上被问到:iPhone什么时候能本地跑GPT-4级别的模型?他的回答是"至少还要等5年"。不到24个月,Google把70亿参数的Gemma 4塞进了普通安卓机,内存占用压到4GB以下。不是演示视频,是今天就能下载的APK。

这相当于把一台2019年的服务器机房,折叠进了你的牛仔裤口袋。

更反常的是性能数据。高通骁龙8 Gen 3上,Gemma 4的推理速度达到每秒40个token——接近人类阅读速度的两倍。作为参照,2022年同类模型在同等硬件上的速度是每秒3个token。13倍的提速不是算法魔术,是Google把模型架构从Transformer换成了RMSNorm+GQA(分组查询注意力)的组合拳。

「我们不是在优化云端推理,是在重新定义设备本身的边界。」Google DeepMind工程师Thomas Mesnard在发布文档中写道。这句话的潜台词是:当苹果还在争论"云端AI够不够隐私"时,Google已经让这个问题变得无关紧要。

离线AI的临界点:从"能跑"到"好用"

本地大模型不是新概念。2023年,Meta的Llama 2 7B已经能在手机上运行,但体验堪称灾难——生成一句话要喘半分钟,手机烫到可以煎蛋。用户评分1.2星,评论区最高赞是"这玩意儿存在的意义是证明这件事做不到"。

Gemma 4的突破在于把"可用"的标准线往上抬了三档。70亿参数是Llama 2 7B的10倍体量,速度反而更快。秘密藏在量化策略里:Google用了4-bit激活感知量化,把模型权重压缩到原体积的1/4,精度损失控制在1%以内。换句话说,模型变"瘦"了,但没变"傻"。

实际场景测试更能说明问题。让Gemma 4写一篇500字的邮件草稿,全程离线,耗时11秒。同样的任务交给云端GPT-4,网络延迟+排队等待平均需要8秒。差距缩小到3秒,换来的是零订阅费、零数据上传、零服务器宕机风险。

对每天处理200+邮件的商务用户来说,这不是替代方案,是备份方案——当飞机落地、高铁进隧道、会议室信号被屏蔽时,AI助理不会突然掉线。

Google的"特洛伊木马":开源模型的阳谋

Gemma 4的许可证写着"可商用、可修改、可分发",和Llama的"月活7亿以上要申请授权"形成刺眼对比。但别急着给Google发好人卡——这套策略的本质是抢占端侧AI的基础设施位。

看一组数据:Android全球月活设备30亿,其中运行骁龙7系及以上芯片的约占40%,也就是12亿台。这些设备理论上都能跑Gemma 4。如果Google能让开发者习惯用Gemma构建离线功能,就等于在苹果生态之外划出了一块"Google标准"的飞地。

更隐蔽的布局在Gemini Nano。这是Google自家Pixel手机的专属离线模型,参数只有38亿,能力明显弱于Gemma 4。Google同时推两条线:Nano绑定硬件销售,Gemma开放拉拢开发者。无论用户选哪边,赢家都是Google。

「开源模型是诱饵,生态锁定才是鱼钩。」一位前Google Brain研究员在Bluesky上的评论获得2000+转发。他补充说,Gemma的"开放"有明确边界——训练数据不开源,微调后的模型权重可以商用,但无法逆向工程原始能力。这是经过精密计算的开放,不是理想主义的馈赠。

谁会被撞翻?三类玩家的生存危机

第一类是"AI硬件创业公司"。Rabbit R1、Humane AI Pin的卖点是"专用AI设备",但它们的云端依赖症在Gemma 4面前暴露无遗。R1的延迟中位数4.2秒,售价199美元;一部三年前的二手安卓机+Gemma 4,延迟0.8秒,成本0美元。硬件溢价的故事讲不下去了。

第二类是"端侧AI中间件"。过去两年涌现了十几家做"模型压缩+硬件适配"的创业公司,估值普遍在5000万到2亿美元之间。Gemma 4的开源发布直接提供了他们收费服务的免费替代,且效果更优。一位不愿具名的创业者在TechCrunch采访中承认:"我们的技术护城河,一夜之间变成了水沟。"

第三类最微妙:苹果。iOS 18的Apple Intelligence重度依赖云端,本地模型只有30亿参数,且仅限iPhone 15 Pro以上机型。Gemma 4的70亿参数跑在骁龙8 Gen 2上——这是2023年的中端芯片。苹果的性能傲慢正在变成生态包袱。

但苹果有一张牌还没打:芯片垂直整合。A17 Pro的神经网络引擎算力35 TOPS,高于骁龙8 Gen 3的34 TOPS。如果苹果愿意把本地模型参数上限从30亿提到70亿,体验反超只在一代产品之间。问题是,他们愿不愿意为了"离线可用"牺牲云端服务的订阅收入?

开发者正在用脚投票

发布72小时内,Hugging Face上的Gemma 4相关项目突破800个。最热门的方向不是聊天机器人,是"离线RAG(检索增强生成)"——把个人文档库塞进手机,让AI在完全隔离的环境中回答问题。

一个典型用例是医疗咨询。某糖尿病管理App的开发者展示了原型:患者上传3年的血糖记录、用药日志、饮食照片,Gemma 4在本地分析趋势,生成个性化建议。数据从未离开设备,合规审查从6个月缩短到6天。

另一个方向是"边缘Agent"。智能家居厂商Shelly正在测试让Gemma 4直接控制设备,无需经过云端中转。指令延迟从平均800毫秒降到120毫秒,且断网时全屋自动化不会瘫痪。对于网络基础设施薄弱的发展中国家,这是降维打击。

「我们内部有个说法:2024年是'云优先AI'的顶点。」Shelly CTO在GitHub讨论区写道,「2025年开始,'离线优先'会成为新的默认假设。」

这个判断可能过于乐观。Gemma 4的70亿参数在处理复杂推理时仍会卡顿,多轮对话的上下文窗口只有8K——是GPT-4的1/16。但它证明了一件事:端侧AI的性能曲线比云端陡峭得多。云端大模型的提升依赖堆算力、烧电费,端侧AI的提升依赖算法压缩和硬件迭代,后者每18个月翻一番。

当两条曲线交汇时,你会选择每月付20美元订阅云端服务,还是花0美元在手机上跑一个"够好用"的本地模型?这个问题,Google已经替你把答案写进了Gemma 4的开源协议里。

最后一个细节:Gemma 4的模型卡末尾有一行小字,注明训练数据截止于2024年6月。这意味着它不知道特朗普第二次当选,不知道Sora的发布,不知道2024年诺贝尔物理学奖颁给了AI科学家。离线AI的代价是时间滞后——你愿意用"落后6个月"换取"永远在线"吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
难以置信!张雪峰离世后,峰学蔚来员工从10点变为七八点主动到岗

难以置信!张雪峰离世后,峰学蔚来员工从10点变为七八点主动到岗

火山詩话
2026-04-11 19:37:49
快讯!万斯突然宣布了!

快讯!万斯突然宣布了!

达文西看世界
2026-04-12 13:20:48
从伊朗脱身后,特朗普要干的第一件事,就是拿“自己人”开刀

从伊朗脱身后,特朗普要干的第一件事,就是拿“自己人”开刀

空天力量
2026-04-12 17:19:20
“你怎么在这?”女子商场惊魂:闺蜜上趟洗手间,竟跟着陌生人走

“你怎么在这?”女子商场惊魂:闺蜜上趟洗手间,竟跟着陌生人走

一丝不苟的法律人
2026-04-11 19:27:49
这5个行业,已经发不出工资了!真的很严重了

这5个行业,已经发不出工资了!真的很严重了

细说职场
2026-04-12 14:35:35
连谈21小时,美伊不欢而散,特朗普:特朗普:中国不许送武器,否则有麻烦

连谈21小时,美伊不欢而散,特朗普:特朗普:中国不许送武器,否则有麻烦

闻识
2026-04-12 13:53:31
突发:王石被抓!!!

突发:王石被抓!!!

大嘴説
2026-04-12 18:30:38
百万豪车陪葬后续:死者身份披露,官方介入处置,目击者透露更多

百万豪车陪葬后续:死者身份披露,官方介入处置,目击者透露更多

离离言几许
2026-04-11 16:34:13
过气艳星艳照风波后,二婚嫁山东农村小伙,43岁已当妈

过气艳星艳照风波后,二婚嫁山东农村小伙,43岁已当妈

君笙的拂兮
2026-04-11 19:38:43
美国记者直言:以色列是种族灭绝、满嘴谎言的法西斯国家

美国记者直言:以色列是种族灭绝、满嘴谎言的法西斯国家

不掉线电波
2026-04-12 08:37:37
赌王女儿何超蕸病逝,常年和乳癌斗争,120多亿遗产由姐弟继承

赌王女儿何超蕸病逝,常年和乳癌斗争,120多亿遗产由姐弟继承

素素娱乐
2026-04-12 16:24:23
网盘禁止分享美剧?天塌了

网盘禁止分享美剧?天塌了

来看美剧
2026-04-12 16:08:02
郑丽文现身小米汽车工厂参访,分享体验:只有一个字,赞!雷军亲自接见,并赠送郑丽文一部小米手机

郑丽文现身小米汽车工厂参访,分享体验:只有一个字,赞!雷军亲自接见,并赠送郑丽文一部小米手机

大风新闻
2026-04-12 19:45:02
女子独自带5岁女儿和未满1岁儿子到餐厅用餐,女儿不幸从包间窗户坠亡……法院判了:餐厅赔近74万元,母亲担责三成

女子独自带5岁女儿和未满1岁儿子到餐厅用餐,女儿不幸从包间窗户坠亡……法院判了:餐厅赔近74万元,母亲担责三成

极目新闻
2026-04-12 18:00:56
伊朗官员说美国比伊朗更需要协议达成

伊朗官员说美国比伊朗更需要协议达成

界面新闻
2026-04-12 19:33:56
西班牙小镇炸毁内塔尼亚胡塑像 之前还炸过特朗普的

西班牙小镇炸毁内塔尼亚胡塑像 之前还炸过特朗普的

新京报
2026-04-12 19:05:16
一张折线图揭露人类寿命暴增的真正秘密!是儿童死亡率从50%跌到4.3%

一张折线图揭露人类寿命暴增的真正秘密!是儿童死亡率从50%跌到4.3%

三言四拍
2026-04-12 10:37:11
穿衣不自由!女解说被批裙子太短 全身涂黑上镜回击

穿衣不自由!女解说被批裙子太短 全身涂黑上镜回击

游民星空
2026-04-12 12:56:12
新娘确实漂亮,但我更喜欢戴眼镜那个。

新娘确实漂亮,但我更喜欢戴眼镜那个。

动物奇奇怪怪
2026-04-12 12:44:36
不打了!大规模轮休!俯冲西部第4挑选火箭

不打了!大规模轮休!俯冲西部第4挑选火箭

篮球实战宝典
2026-04-12 19:29:05
2026-04-12 20:52:49
码上闲叙
码上闲叙
有态度网友ytd
1664文章数 24关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

上海阿婆被"干儿子"分80次转走95万气瘫 毕生积蓄没了

头条要闻

上海阿婆被"干儿子"分80次转走95万气瘫 毕生积蓄没了

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

家居
教育
游戏
房产
军事航空

家居要闻

复古风格 自然简约

教育要闻

难哭学霸的思维题,家长都不会做

诚意不足!《星空》新DLC褒贬不一:性价比太差

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

军事要闻

美国副总统万斯:美伊谈判未能达成协议

无障碍浏览 进入关怀版