网易首页 > 网易号 > 正文 申请入驻

Gemma 4:最强开放模型重磅发布,性能密度创新高

0
分享至


今天,我们正式推出Gemma 4——迄今为止最智能的开放模型。Gemma 4专为高级推理和智能体工作流而设计,在智能密度方面实现了前所未有的突破。自首代产品发布以来,开发者已下载Gemma超过4亿次,构建了超过10万个变体的活跃生态系统。我们深入了解创新者的需求,Gemma 4就是我们的答案:在Apache 2.0许可证下提供突破性能力。

基于与Gemini 3相同的世界级研究和技术构建,Gemma 4是您硬件上可运行的最强模型系列。它们与我们的Gemini模型相辅相成,为开发者提供业界最强大的开放和专有工具组合。

行业领先能力与移动优先AI

我们发布四种规格的Gemma 4:高效2B(E2B)、高效4B(E4B)、26B混合专家(MoE)和31B密集型。整个系列超越简单对话,能够处理复杂逻辑和智能体工作流。大型模型在同等规模中表现卓越,31B模型在业界标准Arena AI文本排行榜中排名全球开放模型第3位,26B模型位列第6。Gemma 4的表现超越了体积大20倍的模型。对开发者而言,这种新的智能密度意味着以更少的硬件开销实现前沿能力。

在边缘计算方面,E2B和E4B模型重新定义设备端实用性,优先考虑多模态能力、低延迟处理和无缝生态系统集成。

强大、易用、开放

为推动下一代开创性研究和产品,我们专门调整了Gemma 4模型规格,使其能在各种硬件上高效运行和微调——从全球数十亿Android设备到笔记本GPU,再到开发工作站和加速器。

通过使用这些高度优化的模型,您可以微调Gemma 4以在特定任务上实现顶尖性能。我们已经看到这种方法的巨大成功;例如,INSAIT创建了开创性的保加利亚语优先语言模型(BgGPT),我们与耶鲁大学合作开发Cell2Sentence-Scale以发现癌症治疗新途径等。

以下是Gemma 4成为我们最强开放模型系列的特色:

高级推理:具备多步骤规划和深度逻辑能力,Gemma 4在需要此类能力的数学和指令遵循基准测试中表现显著提升。

智能体工作流:原生支持函数调用、结构化JSON输出和原生系统指令,让您能构建可与不同工具和API交互并可靠执行工作流的自主智能体。

代码生成:Gemma 4支持高质量离线代码,将您的工作站变成本地优先的AI代码助手。

视觉和音频:所有模型都原生处理视频和图像,支持可变分辨率,在OCR和图表理解等视觉任务中表现出色。此外,E2B和E4B模型具备原生音频输入功能,用于语音识别和理解。

更长上下文:无缝处理长篇内容。边缘模型具有128K上下文窗口,大型模型可达256K,让您能在单个提示中传递代码库或长文档。

140多种语言:在超过140种语言上原生训练,Gemma 4帮助开发者为全球受众构建包容性高性能应用。

适配多样化硬件的通用模型

我们发布的Gemma 4模型权重针对特定硬件和用例定制,确保您在任何需要的地方都能获得前沿推理能力。

为研究人员和开发者提供在可及硬件上的顶尖推理能力,我们的未量化bfloat16权重可高效适配单个80GB NVIDIA H100 GPU。对于本地设置,量化版本可在消费级GPU上原生运行,为IDE、编程助手和智能体工作流提供支持。26B混合专家(MoE)专注延迟优化,推理时仅激活总参数中的38亿个,实现极快的每秒Token数,而31B密集型最大化原始质量,为微调提供强大基础。

从头设计以实现最大计算和内存效率,这些模型在推理时激活有效的20亿和40亿参数占用,以保持RAM和电池续航。通过与Google Pixel团队以及高通科技和联发科等移动硬件领导者的密切合作,这些多模态模型可在手机、树莓派、NVIDIA Jetson Orin Nano等边缘设备上完全离线运行,延迟接近零。Android开发者现在可以在AICore开发者预览版中构建智能体流程原型,与Gemini Nano 4向前兼容。

开源许可证

您提供了反馈,我们倾听了。构建AI未来需要协作方式,我们相信在没有限制性障碍的情况下赋能开发者生态系统。因此,Gemma 4在商业友好的Apache 2.0许可证下发布。

这个开源许可证为完整的开发者灵活性和数字主权提供基础;让您完全控制数据、基础设施和模型。它允许您自由构建并在任何环境中安全部署,无论是本地部署还是云端。

建立在信任与安全基础上

这些模型经历了与我们专有模型相同的严格基础设施安全协议。选择Gemma 4,企业和主权组织获得可信、透明的基础,在满足最高安全性和可靠性标准的同时提供顶尖能力。

选择生态系统

立即开始实验:立即访问Gemma 4并开始构建。在Google AI Studio(31B和26B MoE)或Google AI Edge Gallery(E4B和E2B)中探索Gemma 4。对于Android开发,使用它在Android Studio中为智能体模式提供支持,并使用ML Kit GenAI Prompt API开始为Android构建生产应用。

使用您喜爱的工具:首日支持Hugging Face(Transformers、TRL、Transformers.js、Candle)、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM和NeMo、LM Studio、Unsloth、SGLang、Cactus、Basetan、Docker、MaxText、Tunix、Keras,您可以灵活选择最适合项目的工具。

下载模型:从Hugging Face、Kaggle或Ollama获取模型权重。

定制Gemma 4以满足特定需求:使用您偏好的平台(如Google Colab、Vertex AI或游戏GPU)训练和调整模型。

在Google Cloud上扩展到生产:虽然本地设备端推理适合离线使用,Google Cloud消除了所有计算限制。通过Vertex AI、Cloud Run、GKE、主权云、TPU加速服务和受监管工作负载的最高合规保证进行部署。

在多个硬件平台上加速AI开发:Gemma 4针对业界领先硬件开箱即用优化。在从NVIDIA Jetson Orin Nano到Blackwell GPU的NVIDIA AI基础设施上体验最大性能,通过开源ROCm(TM)堆栈与AMD GPU集成,或在Trillium和Ironwood TPU上部署以实现大规模和效率。

参与影响力竞赛:加入Kaggle上的Gemma 4 Good挑战赛,构建在世界上创造有意义积极变化的产品。

Q&A

Q1:Gemma 4有哪些不同规格的模型?

A:Gemma 4发布四种规格:高效2B(E2B)、高效4B(E4B)、26B混合专家(MoE)和31B密集型。E2B和E4B专为边缘设备优化,支持多模态和音频输入;26B MoE专注延迟优化,推理时仅激活38亿参数;31B密集型追求最高质量,适合微调。

Q2:Gemma 4相比其他开放模型性能如何?

A:Gemma 4在性能上表现卓越,31B模型在Arena AI文本排行榜中排名全球开放模型第3位,26B模型位列第6。更重要的是,Gemma 4的表现超越了体积大20倍的模型,在智能密度方面实现了突破,让开发者能以更少硬件开销获得前沿能力。

Q3:如何开始使用Gemma 4?

A:您可以通过多种方式开始使用:在Google AI Studio或Google AI Edge Gallery中直接体验,从Hugging Face、Kaggle或Ollama下载模型权重,使用Google Colab或Vertex AI进行定制训练。Gemma 4支持140多种语言,提供128K-256K上下文窗口,并在Apache 2.0许可证下开源。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
最新!总台人事变动

最新!总台人事变动

广电头条
2026-05-31 20:13:34
黄仁勋:英语专业的学生有可能成为最成功的那批人

黄仁勋:英语专业的学生有可能成为最成功的那批人

麦可思研究
2026-05-30 11:19:36
Netflix新剧首周560万,烂番茄97%仍扑

Netflix新剧首周560万,烂番茄97%仍扑

自愈小日子
2026-06-01 00:44:43
罗翔:如果一个人突然努力工作,业余时间开始学习,不再参加社交活动,那么,身边的人可能不仅不会帮他,还会拉他下来,原因就一个!

罗翔:如果一个人突然努力工作,业余时间开始学习,不再参加社交活动,那么,身边的人可能不仅不会帮他,还会拉他下来,原因就一个!

谭老师地理大课堂
2026-04-22 00:03:57
人的一生,要闯三关。第一关,送父母终老;第三关,守好自己的命

人的一生,要闯三关。第一关,送父母终老;第三关,守好自己的命

富书
2026-05-31 21:32:50
热熔胶烫幼儿老师面相友善,家长:她平常看起来非常和蔼可亲

热熔胶烫幼儿老师面相友善,家长:她平常看起来非常和蔼可亲

映射生活的身影
2026-05-31 20:36:21
【2026.5.31】爆姐的饭后爆料:生命不止,爆料不息!

【2026.5.31】爆姐的饭后爆料:生命不止,爆料不息!

娱乐真爆姐
2026-05-31 23:12:26
66岁陈永贵,退休后对秘书发脾气,李先念下令:不许再给他送文件

66岁陈永贵,退休后对秘书发脾气,李先念下令:不许再给他送文件

简史档案馆
2026-04-02 11:05:03
上海队遇到了大麻烦!

上海队遇到了大麻烦!

体育哲人
2026-05-31 18:44:17
央视曝光:广州女子持两本护照调包登机被识破,竟然是双重国籍。

央视曝光:广州女子持两本护照调包登机被识破,竟然是双重国籍。

健身狂人
2026-05-31 12:00:28
快讯!关于郑丽文的消息!

快讯!关于郑丽文的消息!

故事终将光明磊落
2026-05-31 10:59:46
2018年,张继科为景甜母亲庆生,景甜趴在母亲肩膀上,一脸幸福

2018年,张继科为景甜母亲庆生,景甜趴在母亲肩膀上,一脸幸福

喜文多见01
2026-05-30 10:27:29
女儿在家啃老十年选择自杀,母亲整理遗物,查看存折余额后彻底崩溃

女儿在家啃老十年选择自杀,母亲整理遗物,查看存折余额后彻底崩溃

荔枝人物记
2025-03-20 17:49:15
马英九的"报应"终于来了,三人调查小组深夜强势反击!

马英九的"报应"终于来了,三人调查小组深夜强势反击!

小管聊一聊
2026-05-31 23:19:32
天热多吃3瓜,一排毒,二清热,三祛湿,全身是宝,中老年别错过

天热多吃3瓜,一排毒,二清热,三祛湿,全身是宝,中老年别错过

江江食研社
2026-05-30 22:30:05
夏天,有一种臭不是口臭、狐臭、脚臭,而是名副其实的“裆臭”!

夏天,有一种臭不是口臭、狐臭、脚臭,而是名副其实的“裆臭”!

爆炸营养彭鑫蕊
2026-05-28 16:38:52
佛山彻底失守!广东第三城易主

佛山彻底失守!广东第三城易主

洞见报告
2026-05-02 18:55:22
王菲看谢霆锋北京演唱会,一脸娇羞躲在俞飞鸿身后,陈鲁豫也陪着

王菲看谢霆锋北京演唱会,一脸娇羞躲在俞飞鸿身后,陈鲁豫也陪着

安海客
2026-05-30 21:51:30
信号失联、烧成火球!神舟21号航天员返回途中,有多惊心动魄?

信号失联、烧成火球!神舟21号航天员返回途中,有多惊心动魄?

王瑄自驾
2026-05-31 11:06:52
陪跑十年零七个月,深圳夫妻意外中签后却只能发呆

陪跑十年零七个月,深圳夫妻意外中签后却只能发呆

宝哥精彩赛事
2026-05-31 08:31:05
2026-06-01 02:16:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18906文章数 49707关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

特朗普生日白宫办格斗赛 近距离观赛花超100万美元

头条要闻

特朗普生日白宫办格斗赛 近距离观赛花超100万美元

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

时尚
艺术
教育
亲子
军事航空

梓渝:慢下来,也很好

艺术要闻

耗资约24亿!新美术馆正式开放,深圳人沸腾!

教育要闻

小初物理开窍神器!后悔没早点发现!!谁懂啊!!物理渣娃突..

亲子要闻

飞鹤联手中标院定义“鲜活”新标准:奶粉“生日”从原料算起

军事要闻

解放军代表质问日防卫大臣:日本何时道歉

无障碍浏览 进入关怀版