网易首页 > 网易号 > 正文 申请入驻

Gemma 4:最强开放模型重磅发布,性能密度创新高

0
分享至


今天,我们正式推出Gemma 4——迄今为止最智能的开放模型。Gemma 4专为高级推理和智能体工作流而设计,在智能密度方面实现了前所未有的突破。自首代产品发布以来,开发者已下载Gemma超过4亿次,构建了超过10万个变体的活跃生态系统。我们深入了解创新者的需求,Gemma 4就是我们的答案:在Apache 2.0许可证下提供突破性能力。

基于与Gemini 3相同的世界级研究和技术构建,Gemma 4是您硬件上可运行的最强模型系列。它们与我们的Gemini模型相辅相成,为开发者提供业界最强大的开放和专有工具组合。

行业领先能力与移动优先AI

我们发布四种规格的Gemma 4:高效2B(E2B)、高效4B(E4B)、26B混合专家(MoE)和31B密集型。整个系列超越简单对话,能够处理复杂逻辑和智能体工作流。大型模型在同等规模中表现卓越,31B模型在业界标准Arena AI文本排行榜中排名全球开放模型第3位,26B模型位列第6。Gemma 4的表现超越了体积大20倍的模型。对开发者而言,这种新的智能密度意味着以更少的硬件开销实现前沿能力。

在边缘计算方面,E2B和E4B模型重新定义设备端实用性,优先考虑多模态能力、低延迟处理和无缝生态系统集成。

强大、易用、开放

为推动下一代开创性研究和产品,我们专门调整了Gemma 4模型规格,使其能在各种硬件上高效运行和微调——从全球数十亿Android设备到笔记本GPU,再到开发工作站和加速器。

通过使用这些高度优化的模型,您可以微调Gemma 4以在特定任务上实现顶尖性能。我们已经看到这种方法的巨大成功;例如,INSAIT创建了开创性的保加利亚语优先语言模型(BgGPT),我们与耶鲁大学合作开发Cell2Sentence-Scale以发现癌症治疗新途径等。

以下是Gemma 4成为我们最强开放模型系列的特色:

高级推理:具备多步骤规划和深度逻辑能力,Gemma 4在需要此类能力的数学和指令遵循基准测试中表现显著提升。

智能体工作流:原生支持函数调用、结构化JSON输出和原生系统指令,让您能构建可与不同工具和API交互并可靠执行工作流的自主智能体。

代码生成:Gemma 4支持高质量离线代码,将您的工作站变成本地优先的AI代码助手。

视觉和音频:所有模型都原生处理视频和图像,支持可变分辨率,在OCR和图表理解等视觉任务中表现出色。此外,E2B和E4B模型具备原生音频输入功能,用于语音识别和理解。

更长上下文:无缝处理长篇内容。边缘模型具有128K上下文窗口,大型模型可达256K,让您能在单个提示中传递代码库或长文档。

140多种语言:在超过140种语言上原生训练,Gemma 4帮助开发者为全球受众构建包容性高性能应用。

适配多样化硬件的通用模型

我们发布的Gemma 4模型权重针对特定硬件和用例定制,确保您在任何需要的地方都能获得前沿推理能力。

为研究人员和开发者提供在可及硬件上的顶尖推理能力,我们的未量化bfloat16权重可高效适配单个80GB NVIDIA H100 GPU。对于本地设置,量化版本可在消费级GPU上原生运行,为IDE、编程助手和智能体工作流提供支持。26B混合专家(MoE)专注延迟优化,推理时仅激活总参数中的38亿个,实现极快的每秒Token数,而31B密集型最大化原始质量,为微调提供强大基础。

从头设计以实现最大计算和内存效率,这些模型在推理时激活有效的20亿和40亿参数占用,以保持RAM和电池续航。通过与Google Pixel团队以及高通科技和联发科等移动硬件领导者的密切合作,这些多模态模型可在手机、树莓派、NVIDIA Jetson Orin Nano等边缘设备上完全离线运行,延迟接近零。Android开发者现在可以在AICore开发者预览版中构建智能体流程原型,与Gemini Nano 4向前兼容。

开源许可证

您提供了反馈,我们倾听了。构建AI未来需要协作方式,我们相信在没有限制性障碍的情况下赋能开发者生态系统。因此,Gemma 4在商业友好的Apache 2.0许可证下发布。

这个开源许可证为完整的开发者灵活性和数字主权提供基础;让您完全控制数据、基础设施和模型。它允许您自由构建并在任何环境中安全部署,无论是本地部署还是云端。

建立在信任与安全基础上

这些模型经历了与我们专有模型相同的严格基础设施安全协议。选择Gemma 4,企业和主权组织获得可信、透明的基础,在满足最高安全性和可靠性标准的同时提供顶尖能力。

选择生态系统

立即开始实验:立即访问Gemma 4并开始构建。在Google AI Studio(31B和26B MoE)或Google AI Edge Gallery(E4B和E2B)中探索Gemma 4。对于Android开发,使用它在Android Studio中为智能体模式提供支持,并使用ML Kit GenAI Prompt API开始为Android构建生产应用。

使用您喜爱的工具:首日支持Hugging Face(Transformers、TRL、Transformers.js、Candle)、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM和NeMo、LM Studio、Unsloth、SGLang、Cactus、Basetan、Docker、MaxText、Tunix、Keras,您可以灵活选择最适合项目的工具。

下载模型:从Hugging Face、Kaggle或Ollama获取模型权重。

定制Gemma 4以满足特定需求:使用您偏好的平台(如Google Colab、Vertex AI或游戏GPU)训练和调整模型。

在Google Cloud上扩展到生产:虽然本地设备端推理适合离线使用,Google Cloud消除了所有计算限制。通过Vertex AI、Cloud Run、GKE、主权云、TPU加速服务和受监管工作负载的最高合规保证进行部署。

在多个硬件平台上加速AI开发:Gemma 4针对业界领先硬件开箱即用优化。在从NVIDIA Jetson Orin Nano到Blackwell GPU的NVIDIA AI基础设施上体验最大性能,通过开源ROCm(TM)堆栈与AMD GPU集成,或在Trillium和Ironwood TPU上部署以实现大规模和效率。

参与影响力竞赛:加入Kaggle上的Gemma 4 Good挑战赛,构建在世界上创造有意义积极变化的产品。

Q&A

Q1:Gemma 4有哪些不同规格的模型?

A:Gemma 4发布四种规格:高效2B(E2B)、高效4B(E4B)、26B混合专家(MoE)和31B密集型。E2B和E4B专为边缘设备优化,支持多模态和音频输入;26B MoE专注延迟优化,推理时仅激活38亿参数;31B密集型追求最高质量,适合微调。

Q2:Gemma 4相比其他开放模型性能如何?

A:Gemma 4在性能上表现卓越,31B模型在Arena AI文本排行榜中排名全球开放模型第3位,26B模型位列第6。更重要的是,Gemma 4的表现超越了体积大20倍的模型,在智能密度方面实现了突破,让开发者能以更少硬件开销获得前沿能力。

Q3:如何开始使用Gemma 4?

A:您可以通过多种方式开始使用:在Google AI Studio或Google AI Edge Gallery中直接体验,从Hugging Face、Kaggle或Ollama下载模型权重,使用Google Colab或Vertex AI进行定制训练。Gemma 4支持140多种语言,提供128K-256K上下文窗口,并在Apache 2.0许可证下开源。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“黑鹰坠落”在伊朗上演,一场全面溃败已经开始!

“黑鹰坠落”在伊朗上演,一场全面溃败已经开始!

李光满说
2026-04-04 14:58:52
油车换电车1年真实感受:普通人别跟风!买车前没人告诉你的真相

油车换电车1年真实感受:普通人别跟风!买车前没人告诉你的真相

华庭讲美食
2026-03-28 17:08:13
华裔老师爆火全球!预言特朗普回归、美伊开战,第三个更吓人

华裔老师爆火全球!预言特朗普回归、美伊开战,第三个更吓人

阿校谈史
2026-04-02 15:28:26
我瞒副处长身份去相亲,女方嫌我穷直接掀桌,隔天她见我后直哆嗦

我瞒副处长身份去相亲,女方嫌我穷直接掀桌,隔天她见我后直哆嗦

千秋文化
2026-03-21 19:47:37
俄议员警告:如果以色列对伊朗使用核武器,拥核国家不再只有9个

俄议员警告:如果以色列对伊朗使用核武器,拥核国家不再只有9个

半路友人之他
2026-04-03 18:11:05
伦纳德和娇妻近照,34岁还是超巨,赚了4.3亿,妻子旺夫相

伦纳德和娇妻近照,34岁还是超巨,赚了4.3亿,妻子旺夫相

大西体育
2026-04-03 22:36:13
刘建业:浙江队实力非常强劲;队长向余望将因伤缺阵

刘建业:浙江队实力非常强劲;队长向余望将因伤缺阵

懂球帝
2026-04-04 17:38:04
只要 11 万!比亚迪新发布这 2000km 新车,又要卖爆!

只要 11 万!比亚迪新发布这 2000km 新车,又要卖爆!

科技狐
2026-04-03 22:34:24
丈母娘心碎!没等来董宇辉假一赔三,当年郎咸平对他评价一语中的

丈母娘心碎!没等来董宇辉假一赔三,当年郎咸平对他评价一语中的

潮鹿逐梦
2026-04-04 18:25:18
“赶紧给她买个内衣!”母亲晒女儿勤奋练习视频,过来人看不下去

“赶紧给她买个内衣!”母亲晒女儿勤奋练习视频,过来人看不下去

蝴蝶花雨话教育
2026-04-03 13:17:50
“原来身份证不是全国统一的”话题冲上热搜,网友晒双语身份证,多地派出所:民族自治地方可同时使用民族文字

“原来身份证不是全国统一的”话题冲上热搜,网友晒双语身份证,多地派出所:民族自治地方可同时使用民族文字

极目新闻
2026-04-03 19:34:47
国宴上钱学森按请柬找不到座位,毛主席:你的名字是我划掉的

国宴上钱学森按请柬找不到座位,毛主席:你的名字是我划掉的

浩渺青史
2026-03-16 15:02:55
业界拥有极品颜值的女老师,身材与颜值完美结合~

业界拥有极品颜值的女老师,身材与颜值完美结合~

吃瓜党二号头目
2026-04-04 16:03:08
曼城vs利物浦:哈兰德PK萨拉赫,维尔茨、索博、谢尔基出战

曼城vs利物浦:哈兰德PK萨拉赫,维尔茨、索博、谢尔基出战

懂球帝
2026-04-04 19:18:19
4月7日晚油价或再大涨,汽柴油“6连涨”中,大涨近2500元/吨

4月7日晚油价或再大涨,汽柴油“6连涨”中,大涨近2500元/吨

油价早知道
2026-04-04 01:22:16
61场达成!薪资大幅提升,整整多拿840万啊,锡安,终于想通了

61场达成!薪资大幅提升,整整多拿840万啊,锡安,终于想通了

球童无忌
2026-04-04 13:58:28
想撤都晚了!伊朗亮万枚家底,美军吓得光身逃跑,三面死围以色列

想撤都晚了!伊朗亮万枚家底,美军吓得光身逃跑,三面死围以色列

梁蜱爱玩车
2026-04-04 10:21:06
既没有胜利,也没有繁荣,更没有联邦

既没有胜利,也没有繁荣,更没有联邦

寰宇大观察
2026-04-03 15:07:02
35岁傅彪儿子,住豪宅生活奢华,单身满头白发,走上了“不归路”

35岁傅彪儿子,住豪宅生活奢华,单身满头白发,走上了“不归路”

林轻吟
2026-04-02 19:51:37
西安不再绕行:一条隧道,缝合被割裂的东郊

西安不再绕行:一条隧道,缝合被割裂的东郊

小鹿姐姐情感说
2026-04-04 15:16:19
2026-04-04 20:36:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17425文章数 49697关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

网友称食品快递中途被换箱子收到里面全是血 顺丰回应

头条要闻

网友称食品快递中途被换箱子收到里面全是血 顺丰回应

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

阚清子口碑赢了!全开麦跑调拒绝重唱

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

家居
教育
健康
时尚
艺术

家居要闻

温馨多元 爱的具象化

教育要闻

“如果能消除自闭症,你愿意吗?”

干细胞抗衰4大误区,90%的人都中招

好养眼啊!大家快收下这份春日片单

艺术要闻

Dinner Lidia:俄罗斯当代女画家

无障碍浏览 进入关怀版