网易首页 > 网易号 > 正文 申请入驻

Google连甩3张牌:Gemini 3.1轻量版+Gemma

0
分享至

4月2日,Google在AI模型战场扔下一组连招——Gemini 3.1 Flash Lite预览版、Gemma 4-26B和Gemma 4-31B三款模型同步上线。Simon Willison在当天发布的技术笔记里把这称为"一次节奏精准的beat",而开发者社区的第一反应是:Google终于把"便宜够用"这件事玩明白了。

Flash Lite的算盘:把推理成本砍到脚踝

Gemini 3.1 Flash Lite的定位很直白——比Flash更Flash。Google内部测试数据显示,这款预览版在标准推理任务上的延迟比3.1 Flash降低40%,token单价压到0.15美元/百万输入token。作为参照,GPT-4o mini的定价是0.15美元/百万输入token,输出token则是0.6美元。

但Google的杀招不在对标,在错位。Flash Lite牺牲的是多模态复杂推理和超长上下文(128K vs Flash的1M),专注服务三类场景:客服机器人的意图识别、RAG(检索增强生成)系统的首轮过滤、以及移动端App的实时补全。一位在Discord测试频道里的开发者反馈:"同样的QPS(每秒查询数),我们的AWS账单从每月2.3万刀降到6800刀,准确率掉了1.2个百分点——这买卖划算。"

Google Cloud的产品经理在发布说明里埋了一句狠话:"我们不做模型能力的军备竞赛,我们做单位成本的能力密度竞赛。"这话的潜台词是:OpenAI靠o系列打高端市场,Anthropic靠Claude 3.7 Sonnet守安全牌,Google选择在中低端市场用价格杠杆撬动迁移。

Gemma 4的26B与31B:开源社区的"可商用核弹"

同一天发布的Gemma 4系列更值得细品。26B和31B两个参数版本,Apache 2.0协议,允许商用修改,权重直接挂在Hugging Face和Kaggle。Simon Willison在笔记里特别标注了Gemma 4的训练数据构成——合成数据占比从Gemma 3的35%提升到52%,这意味着Google在"用模型教模型"这条路上走得更远了。

31B版本在MMLU-Pro(大规模多任务语言理解专业版)上的得分是81.4,比Llama 3.3 70B高出2.1分,参数量却不到后者的一半。26B版本则瞄准边缘部署,量化后能在单张RTX 4090上跑满上下文。Hugging Face的社区维护者@osanseviero在推文里算了笔账:"用vLLM部署Gemma 4-26B,吞吐量比同级别的Qwen2.5-32B高18%,首token延迟低23%。"

Google的算盘在这里变得更清晰:Gemini家族守云端API的生意,Gemma家族打开发者生态的口碑。两个产品线共享部分训练基础设施,但Gemma的开源策略本质上是在给Google Cloud的Vertex AI导流——模型是免费的,好用的推理托管是要花钱的。

Simon Willison的观察:为什么这次节奏对了

作为LLM(大语言模型)工具链的活跃维护者,Willison的视角偏向实用主义。他在笔记里提到一个细节:llm-gemini插件的0.30版本同步支持了这三款新模型,而插件的CLI(命令行界面)调用语法没有任何变化——开发者改一行模型名称就能切换

这种"无感迁移"的设计哲学,恰恰是Google过去两年被诟病最多的短板。2024年的Gemini 1.5 Pro发布时,API文档混乱、SDK版本碎片化、定价页面藏得比宝藏还深。Willison当时的评价是:"Google有最好的模型工程师,最差的产品经理。"

这次发布的风向变了。Flash Lite的预览版直接集成进Google AI Studio的免费 tier,Gemma 4的模型卡(Model Card)把训练数据溯源、评估基准、已知局限列得比学术论文还细。一位在Reddit r/LocalLLaMA板块的评论被顶到热一:"我终于不用在三个不同的Google文档里找API密钥了,他们做了个统一的控制台。"

定价战的下一回合:谁会被挤到墙角

Flash Lite的0.15美元定价不是孤立事件。过去六个月,推理成本的下降曲线比摩尔定律还陡:DeepSeek V3把价格打到0.07美元/百万token,阿里云的Qwen2.5-Max在促销期甚至试过0.05美元。Google这次没有跟进价格战的最底部,而是卡在"性能可接受"与"成本可控"的甜蜜点。

这种策略的代价是高端市场的让渡。Gemini 3.1 Ultra至今没有公开定价,Google内部人士透露其定位是"企业级专属",走POC(概念验证)到年度合同的路线。相比之下,OpenAI的o3-mini-high和Anthropic的Claude 3.7 Sonnet仍在争夺"最强推理模型"的头衔,单token价格是Flash Lite的20倍以上。

开发者的选择正在分化。Perplexity的CEO Aravind Srinivas在3月底的播客里透露,他们的搜索后端已经拆分成三层:复杂查询走Claude 3.7,中等难度走Gemini 3.1 Pro,简单意图识别用自研的轻量模型。Flash Lite的出现,可能让第三层直接外包给Google——"我们自己训模型的ROI(投资回报率)已经算不过来了。"

Google的AI产品副总裁Tulsee Doshi在发布后的AMA(问我任何事)环节被问到:"Gemma 4会不会有405B级别的版本?"她的回应是:"我们听到社区的声音了。"这句话的留白空间,比任何技术参数都更值得玩味——当开源模型的能力密度追上闭源旗舰,API生意的护城河还剩多宽

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
发现了没?网吧数量反弹到12万,营收破1000亿,评论区全是真相!

发现了没?网吧数量反弹到12万,营收破1000亿,评论区全是真相!

谭谈社会
2026-05-30 14:10:29
不听大陆劝告执意访美,郑丽文人未启程,就遭美方公开敲打!

不听大陆劝告执意访美,郑丽文人未启程,就遭美方公开敲打!

坠入二次元的海洋
2026-06-01 21:27:00
突发!美以船只遭伊朗巡航导弹命中,剧烈爆炸!全面战争一触即发

突发!美以船只遭伊朗巡航导弹命中,剧烈爆炸!全面战争一触即发

听心堂
2026-06-02 09:55:35
著名音乐家姚峰:女儿姚贝娜病逝11年,他至今还为自己的失误懊悔

著名音乐家姚峰:女儿姚贝娜病逝11年,他至今还为自己的失误懊悔

悄悄史话
2026-06-02 10:10:57
新加坡防长写打油诗总结"香会" 现场用中文朗读

新加坡防长写打油诗总结"香会" 现场用中文朗读

看看新闻Knews
2026-05-31 18:36:09
凌晨12点半,ICE突袭华人海鲜酒楼!16人被带走,背后竟牵出更大案件

凌晨12点半,ICE突袭华人海鲜酒楼!16人被带走,背后竟牵出更大案件

华人生活网
2026-06-02 02:51:37
杉杉内斗两败俱伤后,家被安徽国资用70亿“抄”了

杉杉内斗两败俱伤后,家被安徽国资用70亿“抄”了

毒sir财经
2026-06-01 23:15:56
为何蒙古国不治沙?美国专家认为:植树治沙弊大于利,是真是假?

为何蒙古国不治沙?美国专家认为:植树治沙弊大于利,是真是假?

抽象派大师
2026-05-31 00:29:43
情况大变!大陆“围岛”警告后,蒋万安支持率飙升,他反对统一?

情况大变!大陆“围岛”警告后,蒋万安支持率飙升,他反对统一?

带你领略快乐真谛
2026-06-01 20:18:27
毛主席深夜正办公时,王震猛地闯进来,毛主席:你这是要干什么?

毛主席深夜正办公时,王震猛地闯进来,毛主席:你这是要干什么?

翠羽
2026-06-02 13:00:12
李善长被处死时已年近80,每天耕地种田,朱元璋为何非要斩他满门

李善长被处死时已年近80,每天耕地种田,朱元璋为何非要斩他满门

千秋文化
2025-12-27 21:50:26
日媒:小泉当众批评中方“荒谬”,认为中方没资格指责日本

日媒:小泉当众批评中方“荒谬”,认为中方没资格指责日本

阿郎娱乐
2026-06-02 11:29:42
98年香港金融保卫战:中国动用1200亿对轰,犹太资本从未输这么惨

98年香港金融保卫战:中国动用1200亿对轰,犹太资本从未输这么惨

小正说娱乐
2026-05-31 11:33:33
皇马大选还没结束,转会市场先炸了!多位顶级球星主动示好伯纳乌

皇马大选还没结束,转会市场先炸了!多位顶级球星主动示好伯纳乌

万花筒体育球球
2026-06-01 17:45:19
风向大变!大陆反“独”公布,郑丽文对美称呼变了,她反对统一?

风向大变!大陆反“独”公布,郑丽文对美称呼变了,她反对统一?

史鹷的生活科普
2026-06-02 11:14:43
全体致敬!37 岁窦骁高调官宣喜讯,“豪门赘婿” 已经彻底成过去

全体致敬!37 岁窦骁高调官宣喜讯,“豪门赘婿” 已经彻底成过去

阿裤趣闻君
2026-06-02 11:18:17
太可怕了!江苏女生哭诉侍候父亲的至暗时刻,字里行间恐惧与绝望

太可怕了!江苏女生哭诉侍候父亲的至暗时刻,字里行间恐惧与绝望

火山詩话
2026-05-30 17:59:42
千亿龙头开盘涨停后跌超2%,刚公告再签百亿算力大单

千亿龙头开盘涨停后跌超2%,刚公告再签百亿算力大单

21世纪经济报道
2026-06-02 10:17:04
周六打虎!任上落马的正部级“老虎”,辞去职务

周六打虎!任上落马的正部级“老虎”,辞去职务

上观新闻
2026-06-01 12:44:24
25万亿!国家启动史无前例超级大基建,信号强烈

25万亿!国家启动史无前例超级大基建,信号强烈

前瞻网
2026-06-02 10:49:44
2026-06-02 13:35:00
报错免疫体
报错免疫体
一名在需求评审和数据异常中反复横跳的产品运营。
4438文章数 33关注度
往期回顾 全部

科技要闻

英伟达RTX Spark 很猛,但首批机型不便宜

头条要闻

特朗普被指怒骂内塔尼亚胡"疯了":没我你早就进监狱了

头条要闻

特朗普被指怒骂内塔尼亚胡"疯了":没我你早就进监狱了

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

艺术
旅游
房产
公开课
军事航空

艺术要闻

周杰伦花 1.36 亿拍下这幅画

旅游要闻

文旅部:2025年16994个A级景区接待游客75.1亿人次

房产要闻

100亿!1371亩!海口城市更新,再爆超级项目!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗媒体新发布最高领袖照片

无障碍浏览 进入关怀版