网易首页 > 网易科技 > 网易科技 > 正文

谷歌祭出Gemma 4,”死磕企业级市场!25.6万上下文打造本地编程神器

0
分享至

4月3日消息,谷歌周四发布全新Gemma 4系列开放权重(open-weights)模型。该系列针对AI智能体及编程场景进行了优化,并改用更为宽松的Apache 2.0许可协议,意在扩大企业级市场份额。


此举正值中国大语言模型(LLM)快速发展之际。目前,月之暗面、阿里巴巴千问等中国企业推出的多款模型,在性能指标上已具备与OpenAI及Anthropic旗下头部模型竞争的能力。

面对激烈的市场竞争,谷歌借Gemma 4向企业客户抛出了一套安全可控的本地化部署方案。其核心卖点直击企业数据安全痛点:明确承诺绝不“窃取”企业的私有敏感数据用于未来迭代模型的训练。

作为谷歌DeepMind团队的最新力作,Gemma 4迎来了全面进化。新模型引入了“高级推理”机制,大幅强化了数学运算与指令遵循(instruction-following)能力。同时,其应用边界得到极大拓展,不仅原生支持140多种语言和函数调用(native function calling),更打通了音视频多模态输入。

延续此前的分级策略,谷歌此次提供多种参数规模的模型版本,以适配从单板计算机、智能手机到笔记本电脑及企业数据中心等不同层级的硬件环境。

该系列中参数规模最大的为一款310亿参数大语言模型。谷歌方面称,经微调后,该模型可提供同系列中最优的输出质量。

这一参数体量既避免了与谷歌大型闭源模型形成内部竞争,又保持了相对轻量化的特性,使企业无需投入高昂的GPU服务器成本即可进行本地运行或微调。

算力门槛的显著降低是此次升级的一大亮点。谷歌表示该模型16位未量化版本可在单块80GB显存的H100显卡上运行。若采用4位精度并结合Llama.cpp或Ollama等框架,该模型可在24GB显存的消费级显卡(如英伟达RTX 4090或AMD RX 7900 XTX)上部署。

针对低延迟应用场景,Gemma 4系列推出了一款260亿参数的混合专家(MoE)架构模型。在推理(inference)阶段,该模型仅激活128个专家网络中的子集(约38亿激活参数)来处理和生成词元(token)。在显存充足的条件下,其生成速度显著高于同等规模的稠密模型(dense model)。

尽管这种机制不可避免地会在输出质量上做出微小妥协,但在笔记本电脑或消费级显卡等受限于显存带宽的设备上,这种“以质量换速度”的策略无疑极具现实意义。

值得一提的是,上述两款主力模型均配备了高达25.6万词元的超大上下文窗口。这一特性使其成为本地AI代码助手的绝佳底座,这也是谷歌在发布会上着墨最多的核心落地场景。

面向下沉的端侧市场,谷歌还为智能手机及树莓派(Raspberry Pi)等算力受限的边缘硬件“量身定制”了两款微型模型,分别具备20亿和40亿的“有效参数”。这里的“有效”大有玄机:两款模型的物理参数量实为51亿和80亿,但谷歌通过引入逐层嵌入技术,硬生生将其推理时的实际计算负担压缩至23亿和45亿级别。这一技术魔术让模型在低算力、依赖电池供电的移动设备上得以高效运转。

尽管参数规模较小,这两款边缘模型仍支持12.8万个词元的上下文窗口及多模态功能,在特定的E2B/E4B版本中,它们不仅能理解文本,还能直接解析视觉与音频输入。

从谷歌公布的成绩单来看,Gemma 4较上一代Gemma 3在各项核心AI基准测试中均实现了跨越式增长。


许可协议的变更是此次发布的另一核心。Gemma 4全面转向更为宽松的Apache 2.0许可协议。此前,Gemma的专属许可协议对模型的特定使用场景设有严格限制,并保留了对违规用户的访问终止权。改用Apache 2.0协议后,企业在模型部署与商业化应用方面获得了更高的自主权,降低了因协议条款变动引发的合规风险。

生态布局方面,Gemma 4已全线登陆谷歌自家的AI Studio与AI Edge Gallery平台,并同步上线Hugging Face、Kaggle及Ollama等主流开源社区。谷歌指出,该模型在发布首日已兼容vLLM、SGLang、Llama.cpp及MLX等十余种主流推理框架。(易句)

(本文由AI翻译,网易编辑负责校对)

延伸阅读
相关推荐
热点推荐
高晓松83岁母亲结束23年美生活回国,称中国医疗生活更便利

高晓松83岁母亲结束23年美生活回国,称中国医疗生活更便利

王飬吃吃喝喝
2026-05-18 21:07:18
“孩子丑成那种,还天天晒”,宝妈朋友圈晒娃,被十年好友骂哭

“孩子丑成那种,还天天晒”,宝妈朋友圈晒娃,被十年好友骂哭

菁妈育儿
2026-05-19 17:37:28
加速高血脂恶化的行为:米饭排第5,第1名很多人都没意识到

加速高血脂恶化的行为:米饭排第5,第1名很多人都没意识到

岐黄传人孙大夫
2026-05-19 22:30:03
200架波音下单,不是给特朗普的面子,是中国给C919买的一份保险

200架波音下单,不是给特朗普的面子,是中国给C919买的一份保险

另子维爱读史
2026-05-20 08:01:12
上海交大樊同学,高中保送到交大,又转到高分专业,计划进体制内

上海交大樊同学,高中保送到交大,又转到高分专业,计划进体制内

汉史趣闻
2026-05-19 14:34:42
韩国灭亡倒计时,或将成为地球上第1个自然消失的国家!

韩国灭亡倒计时,或将成为地球上第1个自然消失的国家!

光辉与阴暗
2026-05-20 14:00:01
张本智和弃日赴德?德乒国家队教练正式锤定,真相太出人意料了

张本智和弃日赴德?德乒国家队教练正式锤定,真相太出人意料了

梦在深巷aqa
2026-05-21 03:38:55
“余生好好走”,知名央视主持人王小丫,病床上的留言字字催泪

“余生好好走”,知名央视主持人王小丫,病床上的留言字字催泪

近史谈
2026-03-31 18:57:49
中国男篮VS日本票价出炉:分七档,最少380元,最高2280元

中国男篮VS日本票价出炉:分七档,最少380元,最高2280元

体育哲人
2026-05-20 18:32:59
浙江女教师劝架被学生用镊子戳伤眼,涉事女生家长在第一次调解后也不再理会她;当事人再发声:希望对涉事女生给予处分并启动矫治学校程序

浙江女教师劝架被学生用镊子戳伤眼,涉事女生家长在第一次调解后也不再理会她;当事人再发声:希望对涉事女生给予处分并启动矫治学校程序

扬子晚报
2026-05-20 20:22:31
窦骁《主角》上线秒杀翟子路!被赞多年不老:燕洵世子又杀回来了

窦骁《主角》上线秒杀翟子路!被赞多年不老:燕洵世子又杀回来了

草莓解说体育
2026-05-21 06:04:29
德比斯5冠后直白辟谣:不属张雪,仍属意大利车队

德比斯5冠后直白辟谣:不属张雪,仍属意大利车队

小武侃风云
2026-05-20 19:45:29
山西一位14岁女孩被活生生配冥婚,警察找到时发现,已与死者合葬

山西一位14岁女孩被活生生配冥婚,警察找到时发现,已与死者合葬

莫地方
2026-05-20 01:40:03
新欢不保?杨子家族爆大雷,和黄圣依离婚真实目的藏不住了!

新欢不保?杨子家族爆大雷,和黄圣依离婚真实目的藏不住了!

今夜繁星坠落
2026-05-20 12:30:27
于娜退圈十年罕露面,又白又壮双下巴抢镜,肚腩凸出胖到不敢认

于娜退圈十年罕露面,又白又壮双下巴抢镜,肚腩凸出胖到不敢认

一娱三分地
2026-05-20 18:44:45
阿尔特塔太狠!刚夺冠就升级祖比门迪!7000 万锁定英超第一中场

阿尔特塔太狠!刚夺冠就升级祖比门迪!7000 万锁定英超第一中场

澜归序
2026-05-21 05:33:35
陪女儿熬过一场离婚才看清:孩子婚姻不幸,根源从来不是嫁错人,而是父母在择偶关口漏掉了这两层底福

陪女儿熬过一场离婚才看清:孩子婚姻不幸,根源从来不是嫁错人,而是父母在择偶关口漏掉了这两层底福

心理观察局
2026-05-21 06:43:11
戴妃弟弟四婚娶考古学家,新娘:伯爵头衔不如我的博士学位

戴妃弟弟四婚娶考古学家,新娘:伯爵头衔不如我的博士学位

时光慢旅人
2026-05-20 01:19:34
意媒致敬张雪:试驾后真服了!4000转开始猛往上冲 全程都很有劲

意媒致敬张雪:试驾后真服了!4000转开始猛往上冲 全程都很有劲

念洲
2026-05-21 06:49:02
国民党彻底撕破脸!

国民党彻底撕破脸!

安安说
2026-05-20 10:43:30
2026-05-21 08:52:49

科技要闻

好到离谱也不够!英伟达交出816亿美元营收

头条要闻

牛弹琴:中俄罕见发表了两份联合声明 特朗普也在关注

头条要闻

牛弹琴:中俄罕见发表了两份联合声明 特朗普也在关注

体育要闻

尼克斯赢下最窒息的一场翻盘,场场都是逆天局

娱乐要闻

王菲“没事儿”,成年人学不来的松弛

财经要闻

英伟达业绩超预!指引再新高仍不够亮眼

汽车要闻

26.98万起步 看小鹏GX如何诠释一车多能以及满配的科技与豪华

态度原创

旅游
房产
健康
亲子
公开课

旅游要闻

中国之城丨河南焦作:兼具山、丘、川、滩的立体之城

房产要闻

别被中介带了节奏,你的房子可能比你想的值钱

专家:别把PRP当作“自体干细胞”

亲子要闻

孩子零食肉干掉地上蚂蚁吃完全死了!家长慌了:天天给娃吃的啊!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×