网易首页 > 网易号 > 正文 申请入驻

“谷歌版DeepSeek”发布!27B模型单GPU即可运行,击败满血DS V3

0
分享至

白交 发自 凹非寺
量子位 | 公众号 QbitAI

单GPU就能跑的最强模型来了!

谷歌最新模型Gemma 3,主打开源与高效。

27B轻松击败671B满血的DeepSeek V3、o3-mini、Llama-405B,仅次于R1。



而从所需算力来看,其他模型要实现差不多的性能,所需算力资源至少增加10倍,有的情况下甚至高达32倍。

在ChatBot Arena Imarena大模型竞技场中,Gemma 3也跻身Top 10,不仅在同等参数量模型中达到SOTA,开源模型里也仅次于R1。



网友们纷纷表示惊呆,尤其对单GPU就能跑、128K上下文印象深刻。





不过除了这剧情是不是有点似曾相识,有人注意到为啥没有跟QwQ 32B比较。





目前,Gemma 3可以直接在Google AI Studio上体验,在包括抱抱脸、Ollama或者Kaggle等平台下载。



可在单个GPU运行的最强模型

此次Gemma 3有四个版本,27B是最大,还有1B、4B、12B。既有预训练模型,也有通用指令微调版本。



展开来看,主要有这些特点:

  • 单GPU/TPU运行:Gemma 3在单GPU/TPU运行情况下,在LMArena排行榜的初步人类偏好评估中胜过Llama-405B、DeepSeek-V3和o3-mini。

如此高效的模型性能不在端侧应用部署可惜了。谷歌也专门给了教程和案例,手把手教的那种。

比如1B模型量化版在手机端运行,在三星Galaxy S24 Ultra上运行的性能如下:



还有在电脑Web端本地创建社媒内容。

MacBook Pro 2023(Apple M3 Pro 芯片)性能如下:



  • 多模态和多语言,可以分析图片、文本、短视频等模态。



语言语种方面,提供对超过35种语言的开箱即用支持;以及对超过140种语言的预训练支持。

  • 多工具支持灵活开发,支持Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和Gemma.cpp的等平台。
  • 128k Token上下文窗口

另外还支持函数调用、结构化输出,以帮助您自动执行任务并构建Agent,官方还引入了量化版本。

他们还推出了ShieldGemma 2:一款基于Gemma 3构建的4B图像安全检查器。开发人员可以定制 ShieldGemma 2来满足他们的安全需求。

更多技术细节

与模型一同发布的,还有一份25页的技术报告,里面有不少细节。




如何训练的?

此次结合蒸馏、强化学习和模型合并等方法,对Gemma的前训练和后期训练过程进行了优化。

Gemma 3使用了与Gemma 2一样的Tokenizer,支持140多种语言,并使用JAX框架在Google TPU上对1B的2T tokens、4B的4T tokens、12B的12T tokens和27B的14T tokens进行了训练。

在后训练方面,Gemma 3使用了4个组件:

  • 从较大的指令模型中提炼出Gemma 3预训练检查点。
  • RLHF,使模型预测与人类偏好保持一致。
  • 从机器反馈中强化学习RLMF,以增强数学推理能力。
  • 执行反馈强化学习(RLEF),以提高编码能力。



这种方法提高了数学、编码和指令跟踪方面的性能,使其在LMArena分数达到了1338分。





与之前的版本相比情况:



正文最后一页还放了主要作者们,共同一作共有16位。



OMT:英伟达直接参与优化

除此之外,在技术报告里还看到了这些亮点。

首先,英伟达直接参与了Gemma 3模型的优化,以确保其在任何规格的GPU上都能获得最佳性能,包括Jetson Nano 到最新的Blackwell芯片。

而在英伟达API目录中也出现了Gemma 3,只需调用API即可快速进行原型设计。

针对谷歌自家的TPU,Gemma 3也进行了优化,并通过开源ROCmTM堆栈与AMD GPU集成。还有CPU的解决方案。

Gemma 3还附带了改进的代码库,其中包括高效微调和推理的配方。开发者可以根据特定需求来定制和调整模型。

在其他模型火热的当下,Gemma系列已经来到了一周年,下载量已经默默超过1亿次,在社区中又超过60000个变体诞生。

如今在开源模型这块的竞争,又激烈了不少。

最后,感兴趣的朋友可直接戳下方链接哦~
https://aistudio.google.com/prompts/new_chat

参考链接:
[1]https://blog.google/technology/developers/gemma-3/
[2]https://x.com/sundarpichai/status/1899779090472644881?s=46
[3]https://developers.googleblog.com/en/introducing-gemma3/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小米新机官宣:4月发布,同档无敌!

小米新机官宣:4月发布,同档无敌!

小兔子发现大事情
2025-03-27 17:29:53
大马丁:如果我们能连续赢得两届世界杯,那么我会从国家队退役

大马丁:如果我们能连续赢得两届世界杯,那么我会从国家队退役

直播吧
2025-03-27 11:37:18
比特朗普还狠?新总理一上台就对华出手,中方回应侮辱性极强!

比特朗普还狠?新总理一上台就对华出手,中方回应侮辱性极强!

视野聚椒
2025-03-27 10:18:57
2.4亿单身青年不婚不育,温铁军“怒斥”:问题根源不在年轻人

2.4亿单身青年不婚不育,温铁军“怒斥”:问题根源不在年轻人

历史有些冷
2025-03-26 17:50:08
江西女教师回娘家探亲失踪,12年不断托梦给哥哥:我在香炉里

江西女教师回娘家探亲失踪,12年不断托梦给哥哥:我在香炉里

悬案解密档案
2025-03-24 15:43:32
上午10点!国足曝出重要计划:中国足协做出英明决策,球迷齐声点赞

上午10点!国足曝出重要计划:中国足协做出英明决策,球迷齐声点赞

游古史
2025-03-27 18:09:14
75-80岁,还能达到这13条,你就是十万里挑一的老人,堪比神仙

75-80岁,还能达到这13条,你就是十万里挑一的老人,堪比神仙

情感大使馆
2025-03-25 12:59:37
大量AMD四核小主机流入闲鱼,8W低功耗可刷飞牛,二手最低39元

大量AMD四核小主机流入闲鱼,8W低功耗可刷飞牛,二手最低39元

闲搞机
2025-03-27 11:09:35
上午被免职,下午被带走!连续24年上春晚却突然消失,发生了什么

上午被免职,下午被带走!连续24年上春晚却突然消失,发生了什么

人间颂
2025-03-17 13:33:56
大跌!特朗普签了: 永久25%关税

大跌!特朗普签了: 永久25%关税

暴财经
2025-03-27 10:55:45
深圳楼市全军覆没,深圳楼市深圳湾房价突破170000元一平

深圳楼市全军覆没,深圳楼市深圳湾房价突破170000元一平

有事问彭叔
2025-03-26 18:23:00
将超《泰坦尼克号》 成全球第四!库克是忠实观众

将超《泰坦尼克号》 成全球第四!库克是忠实观众

3DM游戏
2025-03-27 15:21:04
视力仅剩0.1!厦门很多人都在用,医生:严重可致失明

视力仅剩0.1!厦门很多人都在用,医生:严重可致失明

Yes厦门
2025-03-27 17:44:18
劝告邱毅不要在错误的道路越走越远

劝告邱毅不要在错误的道路越走越远

娱乐督察中
2025-03-23 18:58:19
普通人哭了!子女中考享“绿色通道”,只要年入50万

普通人哭了!子女中考享“绿色通道”,只要年入50万

慕士塔格
2025-03-27 17:18:33
北约秘书长警告:若俄罗斯对波兰或其他盟国发动任何攻击,北约将作出“毁灭性”回应

北约秘书长警告:若俄罗斯对波兰或其他盟国发动任何攻击,北约将作出“毁灭性”回应

环球网资讯
2025-03-26 21:44:14
身份证快到期了提前多久更换,都有哪些材料要准备和注意事项

身份证快到期了提前多久更换,都有哪些材料要准备和注意事项

锤不倒的拖油瓶
2025-03-27 05:29:05
调整!今晚中央五套直播CBA有变:CCTV5、CCTV5+都不播,附上赛程

调整!今晚中央五套直播CBA有变:CCTV5、CCTV5+都不播,附上赛程

阿览
2025-03-27 13:43:04
布泽尔:西部我看好火箭 如此有天赋的年轻球队在季后赛很危险

布泽尔:西部我看好火箭 如此有天赋的年轻球队在季后赛很危险

直播吧
2025-03-27 16:04:48
八炯,就是检举亚亚之人!两岸一红一绿网红,你支持谁?

八炯,就是检举亚亚之人!两岸一红一绿网红,你支持谁?

大风文字
2025-03-27 17:22:34
2025-03-27 19:43:00
量子位 incentive-icons
量子位
追踪人工智能动态
10233文章数 176075关注度
往期回顾 全部

科技要闻

谷歌终止开源安卓?公司否认

头条要闻

曾任“湄公河惨案”的专案组组长受审 被控受贿1.21亿

头条要闻

曾任“湄公河惨案”的专案组组长受审 被控受贿1.21亿

体育要闻

利拉德无限期缺阵,雄鹿还要继续战斗

娱乐要闻

首次曝光!金赛纶轻生前聊天曝光!

财经要闻

地王潮再起!

汽车要闻

搭乾崑智驾 阿维塔06预售21.59万元起

态度原创

教育
亲子
房产
健康
公开课

教育要闻

最多7天!绵阳各学校清明放假时间出炉

亲子要闻

亲子运动会上来自爸爸的胜负欲,别人是弹射起步,他直接弹射起飞,网友:摔倒的时候孩子一脸懵圈

房产要闻

重磅利好!海南中学正式签约,江东又要开挂了!

嚼槟榔+吸烟+HPV感染=口腔癌?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版