网易首页 > 网易号 > 正文 申请入驻

“谷歌版DeepSeek”发布!27B模型单GPU即可运行,击败满血DS V3

0
分享至

白交 发自 凹非寺
量子位 | 公众号 QbitAI

单GPU就能跑的最强模型来了!

谷歌最新模型Gemma 3,主打开源与高效。

27B轻松击败671B满血的DeepSeek V3、o3-mini、Llama-405B,仅次于R1。

而从所需算力来看,其他模型要实现差不多的性能,所需算力资源至少增加10倍,有的情况下甚至高达32倍。

在ChatBot Arena Imarena大模型竞技场中,Gemma 3也跻身Top 10,不仅在同等参数量模型中达到SOTA,开源模型里也仅次于R1。

网友们纷纷表示惊呆,尤其对单GPU就能跑、128K上下文印象深刻。

不过除了这剧情是不是有点似曾相识,有人注意到为啥没有跟QwQ 32B比较。

目前,Gemma 3可以直接在Google AI Studio上体验,在包括抱抱脸、Ollama或者Kaggle等平台下载。

可在单个GPU运行的最强模型

此次Gemma 3有四个版本,27B是最大,还有1B、4B、12B。既有预训练模型,也有通用指令微调版本。

展开来看,主要有这些特点:

  • 单GPU/TPU运行:Gemma 3在单GPU/TPU运行情况下,在LMArena排行榜的初步人类偏好评估中胜过Llama-405B、DeepSeek-V3和o3-mini。

如此高效的模型性能不在端侧应用部署可惜了。谷歌也专门给了教程和案例,手把手教的那种。

比如1B模型量化版在手机端运行,在三星Galaxy S24 Ultra上运行的性能如下:

还有在电脑Web端本地创建社媒内容。

MacBook Pro 2023(Apple M3 Pro 芯片)性能如下:

  • 多模态和多语言,可以分析图片、文本、短视频等模态。

语言语种方面,提供对超过35种语言的开箱即用支持;以及对超过140种语言的预训练支持。

  • 多工具支持灵活开发,支持Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和Gemma.cpp的等平台。
  • 128k Token上下文窗口

另外还支持函数调用、结构化输出,以帮助您自动执行任务并构建Agent,官方还引入了量化版本。

他们还推出了ShieldGemma 2:一款基于Gemma 3构建的4B图像安全检查器。开发人员可以定制 ShieldGemma 2来满足他们的安全需求。

更多技术细节

与模型一同发布的,还有一份25页的技术报告,里面有不少细节。


如何训练的?

此次结合蒸馏、强化学习和模型合并等方法,对Gemma的前训练和后期训练过程进行了优化。

Gemma 3使用了与Gemma 2一样的Tokenizer,支持140多种语言,并使用JAX框架在Google TPU上对1B的2T tokens、4B的4T tokens、12B的12T tokens和27B的14T tokens进行了训练。

在后训练方面,Gemma 3使用了4个组件:

  • 从较大的指令模型中提炼出Gemma 3预训练检查点。
  • RLHF,使模型预测与人类偏好保持一致。
  • 从机器反馈中强化学习RLMF,以增强数学推理能力。
  • 执行反馈强化学习(RLEF),以提高编码能力。

这种方法提高了数学、编码和指令跟踪方面的性能,使其在LMArena分数达到了1338分。

与之前的版本相比情况:

正文最后一页还放了主要作者们,共同一作共有16位。

OMT:英伟达直接参与优化

除此之外,在技术报告里还看到了这些亮点。

首先,英伟达直接参与了Gemma 3模型的优化,以确保其在任何规格的GPU上都能获得最佳性能,包括Jetson Nano 到最新的Blackwell芯片。

而在英伟达API目录中也出现了Gemma 3,只需调用API即可快速进行原型设计。

针对谷歌自家的TPU,Gemma 3也进行了优化,并通过开源ROCmTM堆栈与AMD GPU集成。还有CPU的解决方案。

Gemma 3还附带了改进的代码库,其中包括高效微调和推理的配方。开发者可以根据特定需求来定制和调整模型。

在其他模型火热的当下,Gemma系列已经来到了一周年,下载量已经默默超过1亿次,在社区中又超过60000个变体诞生。

如今在开源模型这块的竞争,又激烈了不少。

最后,感兴趣的朋友可直接戳下方链接哦~
https://aistudio.google.com/prompts/new_chat

参考链接:
[1]https://blog.google/technology/developers/gemma-3/
[2]https://x.com/sundarpichai/status/1899779090472644881?s=46
[3]https://developers.googleblog.com/en/introducing-gemma3/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
处长把我踢出工作群还标“编外”,隔天求我救急?我:没权限!

处长把我踢出工作群还标“编外”,隔天求我救急?我:没权限!

晓艾故事汇
2026-03-21 15:19:51
别再说微胖的女生穿紧身牛仔裤显胖了!这身材谁看了不迷糊

别再说微胖的女生穿紧身牛仔裤显胖了!这身材谁看了不迷糊

牛弹琴123456
2026-03-22 13:59:13
1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

微野谈写作
2026-01-27 06:00:03
杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

杜月笙的识人术:只看对方的一个站姿,就能知道他是龙还是虫

千秋文化
2026-03-23 20:09:06
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
公积金新调整!4月1日起,职工可自愿提高缴存比例

公积金新调整!4月1日起,职工可自愿提高缴存比例

另子维爱读史
2026-03-25 22:28:47
顺德女老板,叫板国际巨头,一年卖出5个亿

顺德女老板,叫板国际巨头,一年卖出5个亿

最华人
2026-03-25 12:33:15
4000吨稀土被转运美国?大陆停供台湾稀土!台学者:不如直接统一

4000吨稀土被转运美国?大陆停供台湾稀土!台学者:不如直接统一

小舟谈历史
2026-03-19 17:27:44
第六险来了!一文读懂“长护险”

第六险来了!一文读懂“长护险”

极目新闻
2026-03-26 07:21:00
大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

侃球熊弟
2026-03-26 00:36:57
短短1年,灵活就业者暴增4千万

短短1年,灵活就业者暴增4千万

深度报
2026-03-23 21:47:58
姐弟闹掰?李鑫拒绝录口供,直言这样下去姐弟没得做,李林哭了!

姐弟闹掰?李鑫拒绝录口供,直言这样下去姐弟没得做,李林哭了!

李橑在北漂
2026-03-26 01:56:27
谭瑞松,被判死缓

谭瑞松,被判死缓

新京报政事儿
2026-03-25 17:17:03
致命围堵!7500人强攻哈尔克岛,伊朗生死线告急

致命围堵!7500人强攻哈尔克岛,伊朗生死线告急

孤城落叶
2026-03-25 14:06:37
52年岳飞后人找毛主席求安排工作,主席听完沉默片刻,说了句话让他当场愣住

52年岳飞后人找毛主席求安排工作,主席听完沉默片刻,说了句话让他当场愣住

老杉说历史
2026-03-13 23:00:06
6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

孤酒老巷QA
2026-03-25 20:19:35
姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

懂球帝
2026-03-26 04:09:06
雷军晒成绩:小米SU7、YU7双双第一!

雷军晒成绩:小米SU7、YU7双双第一!

快科技
2026-03-26 13:09:04
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
2026-03-26 14:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12346文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
艺术
游戏
手机
数码

教育要闻

2027届注意:暑期实习=秋招通行证,错过等一年

艺术要闻

哪一座桥不是风景?

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

手机要闻

三星One UI 9前瞻:小部件更方正、Now Bar动画更丝滑

数码要闻

Intel史上最先进!酷睿Ultra 300系列vPro平台发布

无障碍浏览 进入关怀版