网易首页 > 网易科技 > 网易科技 > 正文

谷歌祭出Gemma 4,”死磕企业级市场!25.6万上下文打造本地编程神器

0
分享至

4月3日消息,谷歌周四发布全新Gemma 4系列开放权重(open-weights)模型。该系列针对AI智能体及编程场景进行了优化,并改用更为宽松的Apache 2.0许可协议,意在扩大企业级市场份额。


此举正值中国大语言模型(LLM)快速发展之际。目前,月之暗面、阿里巴巴千问等中国企业推出的多款模型,在性能指标上已具备与OpenAI及Anthropic旗下头部模型竞争的能力。

面对激烈的市场竞争,谷歌借Gemma 4向企业客户抛出了一套安全可控的本地化部署方案。其核心卖点直击企业数据安全痛点:明确承诺绝不“窃取”企业的私有敏感数据用于未来迭代模型的训练。

作为谷歌DeepMind团队的最新力作,Gemma 4迎来了全面进化。新模型引入了“高级推理”机制,大幅强化了数学运算与指令遵循(instruction-following)能力。同时,其应用边界得到极大拓展,不仅原生支持140多种语言和函数调用(native function calling),更打通了音视频多模态输入。

延续此前的分级策略,谷歌此次提供多种参数规模的模型版本,以适配从单板计算机、智能手机到笔记本电脑及企业数据中心等不同层级的硬件环境。

该系列中参数规模最大的为一款310亿参数大语言模型。谷歌方面称,经微调后,该模型可提供同系列中最优的输出质量。

这一参数体量既避免了与谷歌大型闭源模型形成内部竞争,又保持了相对轻量化的特性,使企业无需投入高昂的GPU服务器成本即可进行本地运行或微调。

算力门槛的显著降低是此次升级的一大亮点。谷歌表示该模型16位未量化版本可在单块80GB显存的H100显卡上运行。若采用4位精度并结合Llama.cpp或Ollama等框架,该模型可在24GB显存的消费级显卡(如英伟达RTX 4090或AMD RX 7900 XTX)上部署。

针对低延迟应用场景,Gemma 4系列推出了一款260亿参数的混合专家(MoE)架构模型。在推理(inference)阶段,该模型仅激活128个专家网络中的子集(约38亿激活参数)来处理和生成词元(token)。在显存充足的条件下,其生成速度显著高于同等规模的稠密模型(dense model)。

尽管这种机制不可避免地会在输出质量上做出微小妥协,但在笔记本电脑或消费级显卡等受限于显存带宽的设备上,这种“以质量换速度”的策略无疑极具现实意义。

值得一提的是,上述两款主力模型均配备了高达25.6万词元的超大上下文窗口。这一特性使其成为本地AI代码助手的绝佳底座,这也是谷歌在发布会上着墨最多的核心落地场景。

面向下沉的端侧市场,谷歌还为智能手机及树莓派(Raspberry Pi)等算力受限的边缘硬件“量身定制”了两款微型模型,分别具备20亿和40亿的“有效参数”。这里的“有效”大有玄机:两款模型的物理参数量实为51亿和80亿,但谷歌通过引入逐层嵌入技术,硬生生将其推理时的实际计算负担压缩至23亿和45亿级别。这一技术魔术让模型在低算力、依赖电池供电的移动设备上得以高效运转。

尽管参数规模较小,这两款边缘模型仍支持12.8万个词元的上下文窗口及多模态功能,在特定的E2B/E4B版本中,它们不仅能理解文本,还能直接解析视觉与音频输入。

从谷歌公布的成绩单来看,Gemma 4较上一代Gemma 3在各项核心AI基准测试中均实现了跨越式增长。


许可协议的变更是此次发布的另一核心。Gemma 4全面转向更为宽松的Apache 2.0许可协议。此前,Gemma的专属许可协议对模型的特定使用场景设有严格限制,并保留了对违规用户的访问终止权。改用Apache 2.0协议后,企业在模型部署与商业化应用方面获得了更高的自主权,降低了因协议条款变动引发的合规风险。

生态布局方面,Gemma 4已全线登陆谷歌自家的AI Studio与AI Edge Gallery平台,并同步上线Hugging Face、Kaggle及Ollama等主流开源社区。谷歌指出,该模型在发布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余种主流推理框架。(易句)

(本文由AI翻译,网易编辑负责校对)

延伸阅读
相关推荐
热点推荐
纪事报:火箭低价甩卖芬尼-史密斯,要价仅两个二轮签

纪事报:火箭低价甩卖芬尼-史密斯,要价仅两个二轮签

奕辰说球
2026-05-20 12:05:33
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
存储超级景气驱动!半导体封测进入黄金爆发期!(附A股核心标的)

存储超级景气驱动!半导体封测进入黄金爆发期!(附A股核心标的)

新浪财经
2026-05-20 21:40:08
最多狂输上海24分!北京惨败许利民被打懵了:这是计划中的输球吗

最多狂输上海24分!北京惨败许利民被打懵了:这是计划中的输球吗

篮球快餐车
2026-05-20 21:57:15
如何看待追觅科技创始人俞浩退网:一场高调网红 CEO 的及时止损!

如何看待追觅科技创始人俞浩退网:一场高调网红 CEO 的及时止损!

爱看剧的阿峰
2026-05-20 20:30:56
小米遭公牛、美的专利“围殴”,为何传统巨头都要对它“开战”?

小米遭公牛、美的专利“围殴”,为何传统巨头都要对它“开战”?

野马财经
2026-05-20 21:14:58
中国三次化债:债务从来不会消失,只会换个人来扛!

中国三次化债:债务从来不会消失,只会换个人来扛!

牛锅巴小钒
2026-05-20 19:14:44
国乒连丢3冠!14大新星出击全落败,王楚钦孙颖莎之后谁扛大旗?

国乒连丢3冠!14大新星出击全落败,王楚钦孙颖莎之后谁扛大旗?

李喜林篮球绝杀
2026-05-20 18:13:27
中式英语杀疯了!800年前诺曼贵族埋的坑,中国网友用三个词填上

中式英语杀疯了!800年前诺曼贵族埋的坑,中国网友用三个词填上

深析古今
2026-05-19 03:59:27
“订单排到2027年”!除了芯片,它也爆火!全球资本涌入

“订单排到2027年”!除了芯片,它也爆火!全球资本涌入

环球网资讯
2026-05-19 19:45:56
一个扎心又现实的现象!中国男人凭一己之力,好像已经养不起家了

一个扎心又现实的现象!中国男人凭一己之力,好像已经养不起家了

网络易不易
2026-05-21 06:00:23
刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

老玮是个手艺人
2026-03-27 14:46:10
郑州全城地铁悄然大整改,关灯关梯精简设施,亏损之下节流运营实属无奈

郑州全城地铁悄然大整改,关灯关梯精简设施,亏损之下节流运营实属无奈

花小猫的美食日常
2026-05-20 21:18:37
莫言遇田朴珺手足无措、眼神闪躲,再上热搜!网友:真是一张一弛

莫言遇田朴珺手足无措、眼神闪躲,再上热搜!网友:真是一张一弛

火山詩话
2026-05-16 08:38:35
A股:国务院重磅公布新规,释放三信号,明日很可能迎来新的行情

A股:国务院重磅公布新规,释放三信号,明日很可能迎来新的行情

云鹏叙事
2026-05-21 00:00:10
李时珍行医一生,临终前叮嘱弟子:观人寿命,先看其怎么吃饭

李时珍行医一生,临终前叮嘱弟子:观人寿命,先看其怎么吃饭

千秋文化
2026-03-06 20:42:44
旗舰9系SUV打入30万元内!小鹏GX正式上市:限时26.98万元起

旗舰9系SUV打入30万元内!小鹏GX正式上市:限时26.98万元起

快科技
2026-05-20 22:11:37
低价存储芯片:万润科技、华天科技、太极实业、万通发展潜力谁大

低价存储芯片:万润科技、华天科技、太极实业、万通发展潜力谁大

长风价值掘金
2026-05-20 17:47:02
英伟达业绩炸裂,再创新高

英伟达业绩炸裂,再创新高

半导体行业观察
2026-05-21 06:15:02
嫪毐赴死之际,未作一声乞求,只给嬴政看了眼他身上的半块玉佩

嫪毐赴死之际,未作一声乞求,只给嬴政看了眼他身上的半块玉佩

卡西莫多的故事
2025-12-24 10:00:50
2026-05-21 06:56:49

科技要闻

一文看懂谷歌I/O2026:谷歌打响智能体大战

头条要闻

被普京抱过的中国男孩火了 本人最新发声

头条要闻

被普京抱过的中国男孩火了 本人最新发声

体育要闻

尼克斯赢下最窒息的一场翻盘,场场都是逆天局

娱乐要闻

王菲“没事儿”,成年人学不来的松弛

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

汽车要闻

26.98万起步 看小鹏GX如何诠释一车多能以及满配的科技与豪华

态度原创

本地
房产
时尚
公开课
军事航空

本地新闻

用云锦的方式,打开江苏南京

房产要闻

别被中介带了节奏,你的房子可能比你想的值钱

被这个颜色刷屏了!今年夏天想减龄好看就穿它吧

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄媒盛赞中国军人:身姿挺拔 站如松柏

无障碍浏览 进入关怀版
×