网易首页 > 网易号 > 正文 申请入驻

谷歌开源单卡最强多模态模型!分数超满血版DeepSeek V3,一张GPU就能跑

0
分享至

智东西3月12日报道,刚刚,谷歌发布emma 3系列模型。谷歌博客中说,这是其迄今为止最先进、最便携、最负责任开发的开放式模型,是“世界上最好的单GPU模型”。

Gemma 3采用与Gemini 2.0相同的研究和技术,支持超过35种语言,并能够分析文本、图像和短视频。

其优势在于可以直接在手机、PC、工作站上快速运行,参数规模有1B、4B、12B和27B四种,开发者可以根据特定硬件和性能需求选择。

Gemma 3在知名AI排行榜LMArena上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。

谷歌还推出了基于Gemma 3的图像安全分类器ShieldGemma 2,ShieldGemma 2可用于过滤图像输入和输出,以查找归类为色情、危险或暴力的内容。

▲Gemma 3技术报告

Hugging Face地址:https://huggingface.co/blog/gemma3

Kaggle地址:https://www.kaggle.com/models/google/gemma-3

论文地址:https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

一、引入官方量化版本,单卡即可运行

谷歌以不同的标准格式提供模型的量化版本,通过使用量化感知训练(QAT)对每个模型进行少量步骤微调获得的,这使得Gemma 3在保持高精度的同时减少了模型大小和计算要求。

按Chatbot Arena Elo分数对AI模型进行排名:分数越高(排名越靠前的数字)表明越受用户青睐。下方的圆点表示模型对英伟达H100 GPU的需求,Gemma 3 27B模型排名很高,其他模型可能需要多达32块GPU,Gemma 3 27B仅需一块GPU即可运行。

▲Chatbot Arena评估分数越高越受青睐(下方原点指模型运行需要使用的英伟达H100数量)

从Chatbot Arena评测结果来看,Gemma-3-27B-IT得分超过DeepSeek-V3、01-preview等模型。其论文中提到,所有模型均由人类评分员通过盲目并排评估,每个模型都根据Elo评分系统获得一个分数,Gemma-3-27B-IT是2025年3月8日收到的初步结果。

Gemma 3在LMArena排行榜上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。

Gemma 3系列模型为超过35种语言提供开箱即用的支持,并为140多种语言提供预训练支持。

此外,其可以帮助开发者创建具有高级文本和视觉推理功能的AI功能,如分析图像、文本和短视频的应用程序。Gemma 3支持函数调用和结构化输出,可帮助开发者自动执行任务并构建Agent。

▲视觉识别

除了Gemma 3,谷歌还推出了基于Gemma 3构建的4B参数图像安全检查器ShieldGemma 2。

ShieldGemma 2可以输出三个类别的安全标签:危险内容、露骨色情和暴力。开发人员可以根据他们的安全需求和用户进一步定制ShieldGemma。

二、与Gemma 2训练方式类似,增加多语言数据

Gemma 3遵循与Gemma 2类似的方法进行知识提炼的预训练。

训练数据方面,研究人员在比Gemma 2稍大的token预算上对模型进行预训练,即在Gemma 3 27B上使用14T tokens,在12B版本上使用12T tokens,在4B版本上使用4T tokens,在1B版本上使用2T tokens。token的增加解释了预训练期间使用的图像和文本的混合。

此外,研究人员还增加了多语言数据量以提高语言覆盖率,并添加了短语和并行数据等。

Tokenizer(分词器)方面,研究人员使用与Gemini 2.0相同的Tokenizer:具有拆分数字、保留空格和字节级编码的SentencePiece Tokenizer,生成的词汇表有262k个条目,此Tokenizer对于非英语语言来说更加平衡。

Gemma 3使用过滤技术降低不必要或不安全的言论风险,并删除某些个人信息和其他敏感数据。其会从预训练数据混合物中净化评估集,并通过最大限度地减少敏感输出的扩散来降低风险。

研究人员为每个token抽取256个logit,并按教师概率加权。学生通过交叉熵损失在这些样本中学习教师的分布。对于非抽样logit,教师的目标分布设置为零概率,并重新规范化。

三、附带改进代码库高效微调,已在英伟达API上线

开发者现在可以将Gemma 3和ShieldGemma 2无缝集成到现有的工作流程中。

Gemma 3的开发工具包括Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM和Gemma.cpp。

开发者可以在Google AI Studio中访问Gemma 3,或通过Kaggle或Hugging Face下载模型。

在自定义方面,Gemma 3附带了一个改进的代码库,其中包括用于高效微调和推理的配方。开发者可以通过Google Colab、Vertex AI甚至游戏GPU进行训练和微调模型。

Gemma 3提供了多种部署选项,包括Vertex AI、Cloud Run、Google GenAI API、Iocal环境等。

值得一提的是,英伟达直接优化了Gemma 3模型,以确保开发者在从Jetson Nano到最新的Blackwell芯片上都能获得最高性能。Gemma 3现已在英伟达API目录中,开发者只需调用API即可实现快速原型设计。

英伟达API目录:https://build.nvidia.com/search?q=gemma

Gemma 3还针对Google Cloud TPU进行了优化,并通过开源ROCm堆栈与AMD GPU集成。

结语:低硬件需求模型受捧,谷歌Gemma 3学术计划开启

对DeepSeek等模型的关注,凸显出开发者对硬件要求较低的大模型的兴趣。

因此,为了进一步促进学术研究突破,谷歌还推出了Gemma 3学术计划。学术研究人员可以申请Google Cloud积分(每个奖励价值10000美元),以加速他们基于Gemma 3的研究。申请表今天开放,并将持续开放四个星期。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赶在欧盟对华下手前,德方带人来访,他们想求中方,别误伤友军

赶在欧盟对华下手前,德方带人来访,他们想求中方,别误伤友军

线装史册
2026-05-27 20:53:51
徐帆回应离婚几个月后,68岁冯小刚再惹争议,养女徐朵成导火索!

徐帆回应离婚几个月后,68岁冯小刚再惹争议,养女徐朵成导火索!

乡野小珥
2026-05-18 08:58:28
中一签最高赚32万!武汉又诞生大牛股

中一签最高赚32万!武汉又诞生大牛股

新浪财经
2026-05-28 18:14:01
中国正在成为全球第一个集体抛弃电话的国家。

中国正在成为全球第一个集体抛弃电话的国家。

维纳斯的眼泪
2026-05-22 12:15:47
超50℃高温,恒河水都快干了,美国务卿在印度热得受不了

超50℃高温,恒河水都快干了,美国务卿在印度热得受不了

兵国大事
2026-05-27 18:10:04
年产仅 6 枚的榛树导弹,三次实战效果解析,神话与现实的巨大落差

年产仅 6 枚的榛树导弹,三次实战效果解析,神话与现实的巨大落差

林子说事
2026-05-28 19:24:01
涉黄倒查严查开启!这3种情况不用慌,一般不予处罚

涉黄倒查严查开启!这3种情况不用慌,一般不予处罚

混沌录
2026-05-07 20:46:15
贾庆林,接见211大学书记、校长

贾庆林,接见211大学书记、校长

双一流高校
2026-05-29 00:11:33
接力爆涨!两大电力央企彻底火了!

接力爆涨!两大电力央企彻底火了!

格隆汇
2026-05-28 19:30:21
台湾绿营几十年的谎言,一夜之间被神舟二十三号彻底撕碎

台湾绿营几十年的谎言,一夜之间被神舟二十三号彻底撕碎

精彩瞬间回顾
2026-05-28 00:07:27
虚构:胡雪岩破产后才明白:左宗棠之所以袖手旁观,并非因为无情

虚构:胡雪岩破产后才明白:左宗棠之所以袖手旁观,并非因为无情

卡西莫多的故事
2026-01-30 09:51:45
上海夺G2沪媒采访!古德温谈绝杀,添荣哭着说紧张,卢伟强调锻炼

上海夺G2沪媒采访!古德温谈绝杀,添荣哭着说紧张,卢伟强调锻炼

篮球资讯达人
2026-05-29 01:28:54
同事蹭我车回家,路过超市时买了1800块东西,要结账时我笑着说:你稍等一下,我去地下2层把车开上来

同事蹭我车回家,路过超市时买了1800块东西,要结账时我笑着说:你稍等一下,我去地下2层把车开上来

品读时刻
2026-05-28 09:06:31
马自达造了双鞋,比车还难买

马自达造了双鞋,比车还难买

快乐加载中21
2026-05-27 01:05:07
江苏一润滑油企业厂房起火,瞬间腾起巨大火球,现场浓烟滚滚,居民称有爆燃声传出,当地:火情已控制,原因调查中

江苏一润滑油企业厂房起火,瞬间腾起巨大火球,现场浓烟滚滚,居民称有爆燃声传出,当地:火情已控制,原因调查中

大象新闻
2026-05-28 22:10:54
老了才看透:父弱母强的家庭,养出来的孩子,大多是这两种结局

老了才看透:父弱母强的家庭,养出来的孩子,大多是这两种结局

心理观察局
2026-05-11 10:00:27
iPhone16 Pro开始清仓了,618再降1101元,苹果A18 Pro+钛金属

iPhone16 Pro开始清仓了,618再降1101元,苹果A18 Pro+钛金属

科技阿维
2026-05-28 22:11:49
毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

中吴网
2026-05-25 22:42:39
爱运动的美女更迷人

爱运动的美女更迷人

蓝色海洋009
2026-05-15 21:03:09
“最干净女演员”被富商苦追10年才嫁,如今和女儿被宠如宝

“最干净女演员”被富商苦追10年才嫁,如今和女儿被宠如宝

吃青菜长高
2026-05-26 16:31:47
2026-05-29 02:24:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11922文章数 117086关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

宋Ultra DM-i售12.99万起 选装天神之眼B承诺一年城市领航兜底

态度原创

本地
手机
数码
教育
公开课

本地新闻

用剪纸的方式,打开江苏扬州

手机要闻

红米K100 Pro Max与荣耀Magic9标准版,均传出新消息!

数码要闻

宏碁推出Predator Atlas 8掌机:8" FHD+ 120Hz 500nits触屏

教育要闻

中考数学:很多同学表示无解题,思维太局限

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版