网易首页 > 网易科技 > 网易科技 > 正文

谷歌祭出Gemma 4,”死磕企业级市场!25.6万上下文打造本地编程神器

0
分享至

4月3日消息,谷歌周四发布全新Gemma 4系列开放权重(open-weights)模型。该系列针对AI智能体及编程场景进行了优化,并改用更为宽松的Apache 2.0许可协议,意在扩大企业级市场份额。


此举正值中国大语言模型(LLM)快速发展之际。目前,月之暗面、阿里巴巴千问等中国企业推出的多款模型,在性能指标上已具备与OpenAI及Anthropic旗下头部模型竞争的能力。

面对激烈的市场竞争,谷歌借Gemma 4向企业客户抛出了一套安全可控的本地化部署方案。其核心卖点直击企业数据安全痛点:明确承诺绝不“窃取”企业的私有敏感数据用于未来迭代模型的训练。

作为谷歌DeepMind团队的最新力作,Gemma 4迎来了全面进化。新模型引入了“高级推理”机制,大幅强化了数学运算与指令遵循(instruction-following)能力。同时,其应用边界得到极大拓展,不仅原生支持140多种语言和函数调用(native function calling),更打通了音视频多模态输入。

延续此前的分级策略,谷歌此次提供多种参数规模的模型版本,以适配从单板计算机、智能手机到笔记本电脑及企业数据中心等不同层级的硬件环境。

该系列中参数规模最大的为一款310亿参数大语言模型。谷歌方面称,经微调后,该模型可提供同系列中最优的输出质量。

这一参数体量既避免了与谷歌大型闭源模型形成内部竞争,又保持了相对轻量化的特性,使企业无需投入高昂的GPU服务器成本即可进行本地运行或微调。

算力门槛的显著降低是此次升级的一大亮点。谷歌表示该模型16位未量化版本可在单块80GB显存的H100显卡上运行。若采用4位精度并结合Llama.cpp或Ollama等框架,该模型可在24GB显存的消费级显卡(如英伟达RTX 4090或AMD RX 7900 XTX)上部署。

针对低延迟应用场景,Gemma 4系列推出了一款260亿参数的混合专家(MoE)架构模型。在推理(inference)阶段,该模型仅激活128个专家网络中的子集(约38亿激活参数)来处理和生成词元(token)。在显存充足的条件下,其生成速度显著高于同等规模的稠密模型(dense model)。

尽管这种机制不可避免地会在输出质量上做出微小妥协,但在笔记本电脑或消费级显卡等受限于显存带宽的设备上,这种“以质量换速度”的策略无疑极具现实意义。

值得一提的是,上述两款主力模型均配备了高达25.6万词元的超大上下文窗口。这一特性使其成为本地AI代码助手的绝佳底座,这也是谷歌在发布会上着墨最多的核心落地场景。

面向下沉的端侧市场,谷歌还为智能手机及树莓派(Raspberry Pi)等算力受限的边缘硬件“量身定制”了两款微型模型,分别具备20亿和40亿的“有效参数”。这里的“有效”大有玄机:两款模型的物理参数量实为51亿和80亿,但谷歌通过引入逐层嵌入技术,硬生生将其推理时的实际计算负担压缩至23亿和45亿级别。这一技术魔术让模型在低算力、依赖电池供电的移动设备上得以高效运转。

尽管参数规模较小,这两款边缘模型仍支持12.8万个词元的上下文窗口及多模态功能,在特定的E2B/E4B版本中,它们不仅能理解文本,还能直接解析视觉与音频输入。

从谷歌公布的成绩单来看,Gemma 4较上一代Gemma 3在各项核心AI基准测试中均实现了跨越式增长。


许可协议的变更是此次发布的另一核心。Gemma 4全面转向更为宽松的Apache 2.0许可协议。此前,Gemma的专属许可协议对模型的特定使用场景设有严格限制,并保留了对违规用户的访问终止权。改用Apache 2.0协议后,企业在模型部署与商业化应用方面获得了更高的自主权,降低了因协议条款变动引发的合规风险。

生态布局方面,Gemma 4已全线登陆谷歌自家的AI Studio与AI Edge Gallery平台,并同步上线Hugging Face、Kaggle及Ollama等主流开源社区。谷歌指出,该模型在发布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余种主流推理框架。(易句)

(本文由AI翻译,网易编辑负责校对)

相关推荐
热点推荐
最新!江苏诞生一位千万富翁!

最新!江苏诞生一位千万富翁!

江南晚报
2026-04-03 13:15:38
看懂了人性,才能读懂为何武松在血溅鸳鸯楼时,连丫鬟也不放过

看懂了人性,才能读懂为何武松在血溅鸳鸯楼时,连丫鬟也不放过

掠影后有感
2026-04-02 19:46:08
日本这对颜值天花板结婚了?正主回应来了!

日本这对颜值天花板结婚了?正主回应来了!

今日日本
2026-04-03 16:57:13
严屹宽谈张凌赫“粉底液将军”争议:演员对妆造的决策权有限,有质疑说明受到了关注,要用虚心的心态接受质疑

严屹宽谈张凌赫“粉底液将军”争议:演员对妆造的决策权有限,有质疑说明受到了关注,要用虚心的心态接受质疑

极目新闻
2026-04-02 14:29:35
中美航天冰与火的两天

中美航天冰与火的两天

凤眼论
2026-04-03 14:32:56
伊朗军队总司令谈可能的地面战:“不允许敌方一人生还”

伊朗军队总司令谈可能的地面战:“不允许敌方一人生还”

新华社
2026-04-02 17:08:05
特朗普拟对北约实施“付费参与模式”

特朗普拟对北约实施“付费参与模式”

参考消息
2026-04-02 16:57:06
连樱花都不敢看,谈何文化自信?别让“恐日症”锁死中国的春天

连樱花都不敢看,谈何文化自信?别让“恐日症”锁死中国的春天

律法刑道
2026-03-30 08:41:29
全国严查后排安全带?320万AI摄像头上线,交警回应,官方辟谣!

全国严查后排安全带?320万AI摄像头上线,交警回应,官方辟谣!

眼光很亮
2026-04-03 08:16:35
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
霍尔木兹海峡,最新动向!英国、法国、德国等40国,紧急行动!

霍尔木兹海峡,最新动向!英国、法国、德国等40国,紧急行动!

新财富杂志
2026-04-03 18:28:19
甘肃省住房和城乡建设厅党组书记、厅长苏海明接受审查调查

甘肃省住房和城乡建设厅党组书记、厅长苏海明接受审查调查

界面新闻
2026-04-03 16:52:02
活久见!网传一男子离婚后,以年薪10万雇前妻带娃,创业成功逆袭

活久见!网传一男子离婚后,以年薪10万雇前妻带娃,创业成功逆袭

火山詩话
2026-04-01 09:21:04
不够圆滑的张雪,回答了关于雷军和挖孔机盖事件

不够圆滑的张雪,回答了关于雷军和挖孔机盖事件

ZAKER新闻
2026-03-31 16:48:49
长春市刚刚发布暴雪预警

长春市刚刚发布暴雪预警

吉刻新闻
2026-04-03 16:47:12
小姑子给我女儿大红包,我转她两万,红包打开一看:全是优惠券!

小姑子给我女儿大红包,我转她两万,红包打开一看:全是优惠券!

坏故事集
2026-03-31 10:48:50
龙虾记忆能力暴涨!腾讯云发布Agent Memory 准确率较原生OpenClaw提升近6成

龙虾记忆能力暴涨!腾讯云发布Agent Memory 准确率较原生OpenClaw提升近6成

快科技
2026-04-03 13:50:59
中南大学副教授因劳累过度去世,享年60岁

中南大学副教授因劳累过度去世,享年60岁

超级数学建模
2026-04-02 22:32:25
有200-300万存款的家庭,在国内是什么水平?答案会让你很意外。

有200-300万存款的家庭,在国内是什么水平?答案会让你很意外。

花小猫的美食日常
2026-04-03 11:20:40
不可错过!4月3日晚上20:30比赛!中央5套CCTV5、CCTV5+直播表

不可错过!4月3日晚上20:30比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-04-03 14:17:03
2026-04-03 19:00:49

科技要闻

5万辆库存车,给了特斯拉一记重拳

头条要闻

记者问阿富汗和巴基斯坦是否在乌鲁木齐和谈 中方回应

头条要闻

记者问阿富汗和巴基斯坦是否在乌鲁木齐和谈 中方回应

体育要闻

冲击世界杯失败,80岁老帅一气之下病倒了

娱乐要闻

《浪姐7》最新人气TOP 曾沛慈断层第一

财经要闻

专家称长期摄入“飘香剂”存在健康隐患

汽车要闻

你介意和远房亲戚长得很像吗?

态度原创

本地
健康
亲子
艺术
公开课

本地新闻

跟着歌声游安徽,听古村回响

干细胞抗衰4大误区,90%的人都中招

亲子要闻

卵泡不长能怀上孕吗?促排期间怎么做卵泡长得好又快?

艺术要闻

吴昌硕『扇画』老辣古拙

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×