网易首页 > 网易号 > 正文 申请入驻

谷歌开源单卡最强多模态模型!分数超满血版DeepSeek V3,一张GPU就能跑

0
分享至

智东西3月12日报道,刚刚,谷歌发布emma 3系列模型。谷歌博客中说,这是其迄今为止最先进、最便携、最负责任开发的开放式模型,是“世界上最好的单GPU模型”。

Gemma 3采用与Gemini 2.0相同的研究和技术,支持超过35种语言,并能够分析文本、图像和短视频。

其优势在于可以直接在手机、PC、工作站上快速运行,参数规模有1B、4B、12B和27B四种,开发者可以根据特定硬件和性能需求选择。

Gemma 3在知名AI排行榜LMArena上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。

谷歌还推出了基于Gemma 3的图像安全分类器ShieldGemma 2,ShieldGemma 2可用于过滤图像输入和输出,以查找归类为色情、危险或暴力的内容。

▲Gemma 3技术报告

Hugging Face地址:https://huggingface.co/blog/gemma3

Kaggle地址:https://www.kaggle.com/models/google/gemma-3

论文地址:https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

一、引入官方量化版本,单卡即可运行

谷歌以不同的标准格式提供模型的量化版本,通过使用量化感知训练(QAT)对每个模型进行少量步骤微调获得的,这使得Gemma 3在保持高精度的同时减少了模型大小和计算要求。

按Chatbot Arena Elo分数对AI模型进行排名:分数越高(排名越靠前的数字)表明越受用户青睐。下方的圆点表示模型对英伟达H100 GPU的需求,Gemma 3 27B模型排名很高,其他模型可能需要多达32块GPU,Gemma 3 27B仅需一块GPU即可运行。

▲Chatbot Arena评估分数越高越受青睐(下方原点指模型运行需要使用的英伟达H100数量)

从Chatbot Arena评测结果来看,Gemma-3-27B-IT得分超过DeepSeek-V3、01-preview等模型。其论文中提到,所有模型均由人类评分员通过盲目并排评估,每个模型都根据Elo评分系统获得一个分数,Gemma-3-27B-IT是2025年3月8日收到的初步结果。

Gemma 3在LMArena排行榜上的初步人类偏好评估中优于Llama-405B、DeepSeek-V3和o3-mini。

Gemma 3系列模型为超过35种语言提供开箱即用的支持,并为140多种语言提供预训练支持。

此外,其可以帮助开发者创建具有高级文本和视觉推理功能的AI功能,如分析图像、文本和短视频的应用程序。Gemma 3支持函数调用和结构化输出,可帮助开发者自动执行任务并构建Agent。

▲视觉识别

除了Gemma 3,谷歌还推出了基于Gemma 3构建的4B参数图像安全检查器ShieldGemma 2。

ShieldGemma 2可以输出三个类别的安全标签:危险内容、露骨色情和暴力。开发人员可以根据他们的安全需求和用户进一步定制ShieldGemma。

二、与Gemma 2训练方式类似,增加多语言数据

Gemma 3遵循与Gemma 2类似的方法进行知识提炼的预训练。

训练数据方面,研究人员在比Gemma 2稍大的token预算上对模型进行预训练,即在Gemma 3 27B上使用14T tokens,在12B版本上使用12T tokens,在4B版本上使用4T tokens,在1B版本上使用2T tokens。token的增加解释了预训练期间使用的图像和文本的混合。

此外,研究人员还增加了多语言数据量以提高语言覆盖率,并添加了短语和并行数据等。

Tokenizer(分词器)方面,研究人员使用与Gemini 2.0相同的Tokenizer:具有拆分数字、保留空格和字节级编码的SentencePiece Tokenizer,生成的词汇表有262k个条目,此Tokenizer对于非英语语言来说更加平衡。

Gemma 3使用过滤技术降低不必要或不安全的言论风险,并删除某些个人信息和其他敏感数据。其会从预训练数据混合物中净化评估集,并通过最大限度地减少敏感输出的扩散来降低风险。

研究人员为每个token抽取256个logit,并按教师概率加权。学生通过交叉熵损失在这些样本中学习教师的分布。对于非抽样logit,教师的目标分布设置为零概率,并重新规范化。

三、附带改进代码库高效微调,已在英伟达API上线

开发者现在可以将Gemma 3和ShieldGemma 2无缝集成到现有的工作流程中。

Gemma 3的开发工具包括Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM和Gemma.cpp。

开发者可以在Google AI Studio中访问Gemma 3,或通过Kaggle或Hugging Face下载模型。

在自定义方面,Gemma 3附带了一个改进的代码库,其中包括用于高效微调和推理的配方。开发者可以通过Google Colab、Vertex AI甚至游戏GPU进行训练和微调模型。

Gemma 3提供了多种部署选项,包括Vertex AI、Cloud Run、Google GenAI API、Iocal环境等。

值得一提的是,英伟达直接优化了Gemma 3模型,以确保开发者在从Jetson Nano到最新的Blackwell芯片上都能获得最高性能。Gemma 3现已在英伟达API目录中,开发者只需调用API即可实现快速原型设计。

英伟达API目录:https://build.nvidia.com/search?q=gemma

Gemma 3还针对Google Cloud TPU进行了优化,并通过开源ROCm堆栈与AMD GPU集成。

结语:低硬件需求模型受捧,谷歌Gemma 3学术计划开启

对DeepSeek等模型的关注,凸显出开发者对硬件要求较低的大模型的兴趣。

因此,为了进一步促进学术研究突破,谷歌还推出了Gemma 3学术计划。学术研究人员可以申请Google Cloud积分(每个奖励价值10000美元),以加速他们基于Gemma 3的研究。申请表今天开放,并将持续开放四个星期。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
新华社消息|伊朗外交部发言人:美国提出的建议非常极端且不合理

新华社消息|伊朗外交部发言人:美国提出的建议非常极端且不合理

新华社
2026-03-30 09:45:54
四十六岁殷桃晒网球照,没修图没滤镜,球鞋带灰却美到骨子里

四十六岁殷桃晒网球照,没修图没滤镜,球鞋带灰却美到骨子里

TVB的四小花
2026-03-30 11:46:05
采耳变卖淫?女技师可变装,躺采色诱客人,有反应了就直接脱裤子

采耳变卖淫?女技师可变装,躺采色诱客人,有反应了就直接脱裤子

乌娱子酱
2025-03-19 10:27:30
张雪峰的灵车细节让人泪奔,车尾挂着一棵竹子,上面系着他的衣服

张雪峰的灵车细节让人泪奔,车尾挂着一棵竹子,上面系着他的衣服

魔都姐姐杂谈
2026-03-28 18:18:48
蒙古政坛彻底乱了!新任总理发动高层清算,对改革派睚眦必报

蒙古政坛彻底乱了!新任总理发动高层清算,对改革派睚眦必报

似水流年忘我
2026-03-21 04:08:54
张雪峰为何被公知攻击?项立刚的评价一针见血:他爱国,还挣了钱

张雪峰为何被公知攻击?项立刚的评价一针见血:他爱国,还挣了钱

谈史论天地
2026-03-29 13:30:50
打!倾家荡产也要打!以色列最新民调:75%民众要求死磕到底!

打!倾家荡产也要打!以色列最新民调:75%民众要求死磕到底!

兴史兴谈
2026-03-29 18:13:06
乒乓澳门世界杯首日:16人无爆冷,中日11人大获全胜孙颖莎剃光头

乒乓澳门世界杯首日:16人无爆冷,中日11人大获全胜孙颖莎剃光头

越岭寻踪
2026-03-31 00:38:28
收到1000镑的罚款,因为非法倒垃圾?他崩溃了:只扔了个信封!

收到1000镑的罚款,因为非法倒垃圾?他崩溃了:只扔了个信封!

英国那些事儿
2026-03-29 23:19:16
注意!陈垣宇赢球后,说了一件事情,对王楚钦很不利

注意!陈垣宇赢球后,说了一件事情,对王楚钦很不利

十点街球体育
2026-03-31 00:40:03
向佐终于围着老婆转了!偷偷去看郭碧婷,穿情侣装简直不要太配!

向佐终于围着老婆转了!偷偷去看郭碧婷,穿情侣装简直不要太配!

精彩背后的故事
2026-03-31 03:53:50
复婚二胎传闻落定七月,赵丽颖近况曝光让人揪心

复婚二胎传闻落定七月,赵丽颖近况曝光让人揪心

阿废冷眼观察所
2026-03-29 18:46:36
浙江6大房企全军覆没

浙江6大房企全军覆没

地产微资讯
2026-03-30 14:54:08
高德和交警联网了吗?网友:高德敢联网,就会失去大量客户

高德和交警联网了吗?网友:高德敢联网,就会失去大量客户

夜深爱杂谈
2025-12-15 23:14:05
中东王爷可能在抛售港股!

中东王爷可能在抛售港股!

金牛远望号
2026-03-30 19:27:28
几乎全是假货!利润高达2400%,为何有些消费者前赴后继争相购买

几乎全是假货!利润高达2400%,为何有些消费者前赴后继争相购买

米果说识
2026-03-30 14:32:41
真正好消息!中国大陆将有2家企业,能制造7nm芯片了?

真正好消息!中国大陆将有2家企业,能制造7nm芯片了?

互联网.乱侃秀
2026-03-28 14:19:21
比超高音速更快!中国白帝2-30首飞在即,性能曝光,碾压美X37B

比超高音速更快!中国白帝2-30首飞在即,性能曝光,碾压美X37B

闻识
2026-03-29 00:23:01
突然!紧急救市,强迫平仓!

突然!紧急救市,强迫平仓!

中国基金报
2026-03-30 16:43:49
现在才知道,夏侯渊战死,在古代战争史上,那是轰动的大事

现在才知道,夏侯渊战死,在古代战争史上,那是轰动的大事

掠影后有感
2026-03-30 10:38:02
2026-03-31 04:56:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11471文章数 117018关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

特朗普:对伊朗袭击以炼油厂的回应“很快到来”

头条要闻

特朗普:对伊朗袭击以炼油厂的回应“很快到来”

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

全红婵聊到体重哭了,每天只吃一顿饭

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

亲子
房产
健康
旅游
军事航空

亲子要闻

杰森抱着吉他给我们唱了几首,有个爱好生活挺丰富,听听唱的咋样

房产要闻

重磅!番禺20宗涉宅地亮相,万博CBD宅地将上新!

干细胞抗衰4大误区,90%的人都中招

旅游要闻

走!去苏州河畔新开的书香文化“大船”看看

军事要闻

第三艘航母出动数千名士兵抵达 美军大举增兵中东战场

无障碍浏览 进入关怀版