网易首页 > 网易号 > 正文 申请入驻

谷歌开源单卡最强多模态模型!分数超满血版DeepSeek V3,一张GPU就能跑

0
分享至

智东西3月12日报道,刚刚,谷歌发布emma 3系列模型。谷歌博客中说,这是其迄今为止最先进、最便携、最负责任开发的开放式模型,是“世界上最好的单GPU模型”。

Gemma 3采用与Gemini 2.0相同的研究和技术,支持超过35种语言,并能够分析文本、图像和短视频。

其优势在于可以直接在手机、PC、工作站上快速运行,参数规模有1B、4B、12B和27B四种,开发者可以根据特定硬件和性能需求选择。

Gemma 3在知名AI排行榜LMArena上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。

谷歌还推出了基于Gemma 3的图像安全分类器ShieldGemma 2,ShieldGemma 2可用于过滤图像输入和输出,以查找归类为色情、危险或暴力的内容。

▲Gemma 3技术报告

Hugging Face地址:https://huggingface.co/blog/gemma3

Kaggle地址:https://www.kaggle.com/models/google/gemma-3

论文地址:https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

一、引入官方量化版本,单卡即可运行

谷歌以不同的标准格式提供模型的量化版本,通过使用量化感知训练(QAT)对每个模型进行少量步骤微调获得的,这使得Gemma 3在保持高精度的同时减少了模型大小和计算要求。

按Chatbot Arena Elo分数对AI模型进行排名:分数越高(排名越靠前的数字)表明越受用户青睐。下方的圆点表示模型对英伟达H100 GPU的需求,Gemma 3 27B模型排名很高,其他模型可能需要多达32块GPU,Gemma 3 27B仅需一块GPU即可运行。

▲Chatbot Arena评估分数越高越受青睐(下方原点指模型运行需要使用的英伟达H100数量)

从Chatbot Arena评测结果来看,Gemma-3-27B-IT得分超过DeepSeek-V3、01-preview等模型。其论文中提到,所有模型均由人类评分员通过盲目并排评估,每个模型都根据Elo评分系统获得一个分数,Gemma-3-27B-IT是2025年3月8日收到的初步结果。

Gemma 3在LMArena排行榜上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。

Gemma 3系列模型为超过35种语言提供开箱即用的支持,并为140多种语言提供预训练支持。

此外,其可以帮助开发者创建具有高级文本和视觉推理功能的AI功能,如分析图像、文本和短视频的应用程序。Gemma 3支持函数调用和结构化输出,可帮助开发者自动执行任务并构建Agent。

▲视觉识别

除了Gemma 3,谷歌还推出了基于Gemma 3构建的4B参数图像安全检查器ShieldGemma 2。

ShieldGemma 2可以输出三个类别的安全标签:危险内容、露骨色情和暴力。开发人员可以根据他们的安全需求和用户进一步定制ShieldGemma。

二、与Gemma 2训练方式类似,增加多语言数据

Gemma 3遵循与Gemma 2类似的方法进行知识提炼的预训练。

训练数据方面,研究人员在比Gemma 2稍大的token预算上对模型进行预训练,即在Gemma 3 27B上使用14T tokens,在12B版本上使用12T tokens,在4B版本上使用4T tokens,在1B版本上使用2T tokens。token的增加解释了预训练期间使用的图像和文本的混合。

此外,研究人员还增加了多语言数据量以提高语言覆盖率,并添加了短语和并行数据等。

Tokenizer(分词器)方面,研究人员使用与Gemini 2.0相同的Tokenizer:具有拆分数字、保留空格和字节级编码的SentencePiece Tokenizer,生成的词汇表有262k个条目,此Tokenizer对于非英语语言来说更加平衡。

Gemma 3使用过滤技术降低不必要或不安全的言论风险,并删除某些个人信息和其他敏感数据。其会从预训练数据混合物中净化评估集,并通过最大限度地减少敏感输出的扩散来降低风险。

研究人员为每个token抽取256个logit,并按教师概率加权。学生通过交叉熵损失在这些样本中学习教师的分布。对于非抽样logit,教师的目标分布设置为零概率,并重新规范化。

三、附带改进代码库高效微调,已在英伟达API上线

开发者现在可以将Gemma 3和ShieldGemma 2无缝集成到现有的工作流程中。

Gemma 3的开发工具包括Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM和Gemma.cpp。

开发者可以在Google AI Studio中访问Gemma 3,或通过Kaggle或Hugging Face下载模型。

在自定义方面,Gemma 3附带了一个改进的代码库,其中包括用于高效微调和推理的配方。开发者可以通过Google Colab、Vertex AI甚至游戏GPU进行训练和微调模型。

Gemma 3提供了多种部署选项,包括Vertex AI、Cloud Run、Google GenAI API、Iocal环境等。

值得一提的是,英伟达直接优化了Gemma 3模型,以确保开发者在从Jetson Nano到最新的Blackwell芯片上都能获得最高性能。Gemma 3现已在英伟达API目录中,开发者只需调用API即可实现快速原型设计。

英伟达API目录:https://build.nvidia.com/search?q=gemma

Gemma 3还针对Google Cloud TPU进行了优化,并通过开源ROCm堆栈与AMD GPU集成。

结语:低硬件需求模型受捧,谷歌Gemma 3学术计划开启

对DeepSeek等模型的关注,凸显出开发者对硬件要求较低的大模型的兴趣。

因此,为了进一步促进学术研究突破,谷歌还推出了Gemma 3学术计划。学术研究人员可以申请Google Cloud积分(每个奖励价值10000美元),以加速他们基于Gemma 3的研究。申请表今天开放,并将持续开放四个星期。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
接受中广专访却跑到飞碟电台迟到半小时 赵少康:金溥聪你失智?

接受中广专访却跑到飞碟电台迟到半小时 赵少康:金溥聪你失智?

金牛传声
2026-05-27 10:11:01
被投诉威胁2个月后,小学女教师告了家长!教育局结论下来了‌

被投诉威胁2个月后,小学女教师告了家长!教育局结论下来了‌

教育人看世界
2026-05-24 21:47:53
马英九终于松口,亲美派失算了,金小刀原形毕露,公开硬刚郑丽文

马英九终于松口,亲美派失算了,金小刀原形毕露,公开硬刚郑丽文

兰妮搞笑分享
2026-05-27 00:49:22
有钱人私下玩的多花?网友:开眼了

有钱人私下玩的多花?网友:开眼了

另子维爱读史
2026-05-16 21:38:47
华为新出的τ定律,是夯爆了还是拉完了?

华为新出的τ定律,是夯爆了还是拉完了?

差评XPIN
2026-05-27 00:12:30
上海赢球后却遭一大打击?卢伟这下真慌了:两大超级王牌意外伤了

上海赢球后却遭一大打击?卢伟这下真慌了:两大超级王牌意外伤了

篮球快餐车
2026-05-27 01:08:41
破防了?美媒称华为是“制裁破坏者”,华为韬τ定律到底有多强?

破防了?美媒称华为是“制裁破坏者”,华为韬τ定律到底有多强?

大卫聊科技
2026-05-27 12:16:18
65岁的庾澄庆,当着所有人的面问29岁的窦靖童:我该怎么称呼你?

65岁的庾澄庆,当着所有人的面问29岁的窦靖童:我该怎么称呼你?

草莓解说体育
2026-05-25 13:36:29
“扶弟魔”升级版!妻子因丈夫拒每月拿2000元帮弟还车贷,离婚了

“扶弟魔”升级版!妻子因丈夫拒每月拿2000元帮弟还车贷,离婚了

火山詩话
2026-05-26 07:27:35
长安汽车旗下阿维塔港股IPO招股书失效

长安汽车旗下阿维塔港股IPO招股书失效

澎湃新闻
2026-05-27 11:14:15
演员袁立辟谣 "抗癌成功" ,称颈部纱布实为眼罩,怒斥平台封其账号却放任谣言传播,同时回应被陈建斌、朱媛媛与辛柏青“欺负”之说

演员袁立辟谣 "抗癌成功" ,称颈部纱布实为眼罩,怒斥平台封其账号却放任谣言传播,同时回应被陈建斌、朱媛媛与辛柏青“欺负”之说

鲁中晨报
2026-05-25 16:23:16
0-3输日本,国乒男单丢冠!混双全军覆没,无缘八强!曼谷站国青小将7冠4亚收官

0-3输日本,国乒男单丢冠!混双全军覆没,无缘八强!曼谷站国青小将7冠4亚收官

最爱乒乓球
2026-05-27 05:03:04
撕破脸面?老杜之子给小马科斯下通牒,菲亲华派:大清算或将开启

撕破脸面?老杜之子给小马科斯下通牒,菲亲华派:大清算或将开启

史智文道
2026-05-27 11:58:09
陪护杨绛二十余年保姆,临终揭秘长寿只因坚守小事

陪护杨绛二十余年保姆,临终揭秘长寿只因坚守小事

唠叨说历史
2026-05-25 14:24:39
陆小曼有多美?26岁和翁端午游西湖的留影,青春靓丽娇俏可人!

陆小曼有多美?26岁和翁端午游西湖的留影,青春靓丽娇俏可人!

舆图看世界
2026-05-26 10:55:03
四川任免翟刚、严卫东、黄河职务

四川任免翟刚、严卫东、黄河职务

中国经济网
2026-05-27 10:31:05
库里:NBA真正影响全世界的只有4个人,我还不够资格!

库里:NBA真正影响全世界的只有4个人,我还不够资格!

钱说体育
2026-05-25 13:00:31
保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开了

保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开了

历史点行
2026-03-29 13:38:28
章子怡汪峰离婚后首同框,10岁女儿交响乐惊艳全场

章子怡汪峰离婚后首同框,10岁女儿交响乐惊艳全场

TVB的四小花
2026-05-27 09:33:18
重大发现!南宋皇宫遗址的碎骨堆中,重庆专家找到我国首枚考古出土的大齿鼠遗骸

重大发现!南宋皇宫遗址的碎骨堆中,重庆专家找到我国首枚考古出土的大齿鼠遗骸

上游新闻
2026-05-26 16:05:20
2026-05-27 15:16:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11904文章数 117085关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

专家:全国多地降雨量突破历史极值 这是一种异常现象

头条要闻

专家:全国多地降雨量突破历史极值 这是一种异常现象

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

小S晒归宁宴旧照,大S穿吊带裙扎丸子头

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

极狐问道V9今日将正式上市 搭载华为雪鸮增程系统

态度原创

房产
亲子
时尚
旅游
军事航空

房产要闻

终极塔尖资产!这可能是海南今年最出圈的豪宅!

亲子要闻

4岁女儿真记仇,因为爸爸惹她生气了,去参加她运动会还有条件

多巴胺“粉”,赫本是这样穿的!

旅游要闻

爱上海|八仙花迎最佳观赏期 粉色花海点亮初夏街头

军事要闻

特朗普称要和赖清德谈军售 国台办回应

无障碍浏览 进入关怀版