网易首页 > 网易号 > 正文 申请入驻

谷歌狂卷小模型,20亿参数Gemma 2赶超GPT-3.5,实测iPhone上跑得飞快

0
分享至


智东西(公众号:zhidxcom
编译香草
编辑李水青

谷歌DeepMind的开源小模型家族,又迎来新成员!

智东西8月1日消息,今日凌晨,谷歌DeepMind开源了轻量级模型Gemma 2 2B,其在大模型竞技场上的分数超越了GPT-3.5、Llama 2 70B等更大参数的模型。

▲Gemma 2 2B

只有20亿参数使得Gemma 2 2B可以轻松在手机、PC等终端设备上快速运行。开发者实测在Google AI Studio上,其推理速度达到30~40 tokens/s。

▲开发者测试Gemma 2 2B

与Gemma 2 2B一起推出的,还有用于增强模型可解释性的工具Gemma Scope,以及用于过滤有害内容的安全分类模型ShieldGemma。

Gemma Scope基于稀疏自动编码器(SAE)放大模型中的特定点,并采用JumpReLU架构对其进行优化,从而帮助解析模型中处理的密集复杂信息,像一个显微镜一样让研究人员能“看到”模型内部。

ShieldGemma则针对仇恨言论、骚扰、色情内容、危险内容四个危害领域构建,在响应测试中超过GPT-4等基准模型。

Gemma系列模型最初在今年2月推出,是谷歌DeepMind在Gemini模型的经验基础上构建的开源模型。6月,谷歌推出第二代开源模型Gemma 2,包括9B、27B两种参数规模,其中27B模型迅速在LMSYS大模型竞技场上跃升开源模型前沿。

一、击败35倍参数大模型,比大小没难倒Gemma 2

Gemma 2 2B是从更大规模的模型中提炼而来的,是继27B、9B后谷歌推出的第三款Gemma 2模型。

作为一款只有20亿参数的轻量模型,Gemma 2 2B并没有牺牲性能来换轻便。在LMSYS大模型竞技场(Chatbot Arena)排行榜中,Gemma 2 2B以1126分的成绩超越了GPT-3.5,以及其数十倍参数规模的Mixtral 8x7B、Llama 2 70B模型。

▲Gemma 2 2B在大模型竞技场的成绩

有网友测试了Gemma 2 2B在众多大模型上“翻车”的9.9和9.11比大小问题,Gemma 2 2B迅速给出了正确答案。


▲Gemma 2 2B答题

运行速度是轻量级模型的一大优势。具体有多快呢?苹果机器学习研究员Awni Hannun在他的iPhone 15 pro上的MLX Swift测试了Gemma 2 2B,其推理速度肉眼可见的快。

▲Gemma 2 2B运行速度

开发者Tom Huang实测后称,其在Google AI Studio上运行速度大概30~40 tokens/s,“比苹果的模型推得快”。

在部署方面,Gemma 2 2B提供灵活的部署方式,可在各种硬件上高效运行,包括边缘设备、笔记本电脑,或是基于Vertex AI进行云部署。

开发者可以在Hugging Face、Kaggle等平台下载Gemma 2 2B的模型权重,用于研究和商业应用,也可以在Google AI Studio中试用其功能。

开源地址:

https://huggingface.co/google/gemma-2-2b

二、针对四类内容构建分类器,响应率优于GPT-4

为了提升模型的安全性和可访问性,谷歌推出了一套基于Gemma 2构建的安全内容分类器模型ShieldGemma,用于过滤AI模型的输入和输出,是对谷歌的负责任AI工具包中现有安全分类器套件的补充。

▲ShieldGemma工作原理

ShieldGemma针对仇恨言论、骚扰、色情内容、危险内容这四个危害领域构建,提供多种模型尺寸以满足不同的需求,包括2B、9B和27B。其中,2B参数模型适合在线分类任务,9B和27B版本则用于为离线应用程序提供更高性能。

在外部数据集上的测评结果中,ShieldGemma超越了OpenAI Mod、GPT-4等基线模型。

▲ShieldGemma测评结果

ShieldGemma的技术报告也同步公开,其中解读了该模型的构建方法、数据来源以及有效性。在四类有害内容的响应测试上,三个规模的ShieldGemma响应率都优于GPT-4。

▲ShieldGemma响应测试

技术报告地址:

https://storage.googleapis.com/deepmind-media/gemma/shieldgemma-report.pdf

三、大模型内部“显微镜”,零代码分析模型行为

为了研究语言模型内部的工作原理,谷歌推出一套全面、开放的稀疏自动编码器Gemma Scope。它就像一个显微镜,能帮助研究人员“看到”模型内部,从而更好地理解工作原理。

Gemma Scope使用稀疏自动编码器(SAE)放大模型中的特定点,这些SAE可帮助解析模型中处理的密集复杂信息,将其扩展为更易于分析和理解的形式。

▲使用SAE解释模型激活的程式化表示

通过研究这些扩展的视图,研究人员可以了解Gemma 2如何识别模式、处理信息,并最终做出预测,从而探索如何构建更易于理解、更可靠、更可靠的AI系统。

此前,对SAE的研究主要集中于研究微型模型或大型模型中,单层的内部工作原理。而Gemma Scope的突破之处在于,它在Gemma 2模型的每个层和子层输出上训练SAE。其共生成了400多个SAE,学习了3000多万个特征。

▲Gemma Scope的SAE发现特征的示例激活

Gemma Scope 还采用了全新的JumpReLU SAE架构进行训练。原始的SAE架构很难平衡检测哪些特征存在,和估计其强度这两个目标。JumpReLU架构可以更轻松地实现这种平衡,从而显著减少错误。

Gemma Scope共开放了超过400个免费SAE,涵盖Gemma 2 2B和9B的所有层,并提供交互式演示,研究人员不需要编写代码即可研究SAE特性并分析模型行为。

▲Gemma Scope交互式演示

演示地址:

https://www.neuronpedia.org/gemma-scope

技术报告地址:

https://storage.googleapis.com/gemma-scope/gemma-scope-report.pdf

结语:生成式AI的风,刮向小模型和AI安全

生成式AI发展至今,模型从“卷”参数“卷”规模,到现在“卷”轻便“卷”安全,体现了在技术落地的过程中,离用户更近、成本更低、更能满足特定需求的重要性。

AI PC、AI手机逐渐进入消费者的生活,在这个过程中,如何将大模型“塞进”小巧的终端设备,并且保障用户的隐私安全,是各大AI厂商亟待解决的问题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国最著名“叛国者”去世,逃亡99.9%概率死,0.1%奇迹改写一生

中国最著名“叛国者”去世,逃亡99.9%概率死,0.1%奇迹改写一生

近史谈
2026-02-11 19:15:10
上任仅8个月!热刺官宣解雇52岁主帅,带队近8轮不胜+距降级区5分

上任仅8个月!热刺官宣解雇52岁主帅,带队近8轮不胜+距降级区5分

我爱英超
2026-02-11 18:34:17
重磅官宣!消费100元,就能抽奖!春节期间,50城的有奖发票奖金超10个亿

重磅官宣!消费100元,就能抽奖!春节期间,50城的有奖发票奖金超10个亿

南方都市报
2026-02-11 12:04:35
395:2!美国涉台法案通过,解放军沉默数十小时,对台军改了称呼

395:2!美国涉台法案通过,解放军沉默数十小时,对台军改了称呼

策前论
2026-02-11 17:18:31
奖金34万!郑钦文2-1力克1米85重炮夺连胜:挑战世界第三

奖金34万!郑钦文2-1力克1米85重炮夺连胜:挑战世界第三

李喜林篮球绝杀
2026-02-11 11:09:36
浙江宁波一餐厅大圆桌可坐55人,网友调侃“有些菜,一旦错过就不再”;餐厅回应:年底人多,需提前3天预定

浙江宁波一餐厅大圆桌可坐55人,网友调侃“有些菜,一旦错过就不再”;餐厅回应:年底人多,需提前3天预定

极目新闻
2026-02-11 13:09:25
爱泼斯坦别墅内景曝光,老虎标本栩栩如生,男子跪地笑容阴森

爱泼斯坦别墅内景曝光,老虎标本栩栩如生,男子跪地笑容阴森

大鱼简科
2026-02-11 17:08:09
俄罗斯与欧盟会打起来吗?

俄罗斯与欧盟会打起来吗?

新民晚报
2026-02-11 10:51:31
短道速滑混接失误瞬间!林孝埈捂脸低头,王濛眼含热泪请求别指责

短道速滑混接失误瞬间!林孝埈捂脸低头,王濛眼含热泪请求别指责

篮球资讯达人
2026-02-11 00:25:23
卖不动了?特斯拉突然上架大量 Model Y 现车

卖不动了?特斯拉突然上架大量 Model Y 现车

XCiOS俱乐部
2026-02-11 18:46:57
郭德纲也没想到,距离过年仅剩4天,40岁岳云鹏高调官宣了喜讯!

郭德纲也没想到,距离过年仅剩4天,40岁岳云鹏高调官宣了喜讯!

离离言几许
2026-02-11 12:44:42
如今15年过去了,当初卖肾卖苹果手机的安徽小伙,活成了这个样子

如今15年过去了,当初卖肾卖苹果手机的安徽小伙,活成了这个样子

大鱼简科
2026-02-09 16:40:58
Coco直播自曝经济不好,谢贤没给她2000万分手费,遗憾没能结婚

Coco直播自曝经济不好,谢贤没给她2000万分手费,遗憾没能结婚

离离言几许
2026-02-11 12:44:06
CNN都看不下去了:“加拿大全额出资,特朗普竟还威胁阻挠”

CNN都看不下去了:“加拿大全额出资,特朗普竟还威胁阻挠”

参考消息
2026-02-11 14:37:02
这跟不穿有啥区别?格莱美红毯女星穿衣大胆,连美国网友都无语了

这跟不穿有啥区别?格莱美红毯女星穿衣大胆,连美国网友都无语了

梦醉为红颜一笑
2026-02-10 14:52:10
4599 元!新iPhone 价格再次下调!

4599 元!新iPhone 价格再次下调!

科技堡垒
2026-02-11 11:52:55
CBA官方罚单:赵睿严重不当评论停赛3场罚款5万 首钢罚5万

CBA官方罚单:赵睿严重不当评论停赛3场罚款5万 首钢罚5万

醉卧浮生
2026-02-11 20:42:55
国台办:春节是中华民族最重要的传统节日 民进党当局如果胆敢在祥和的节日里无端挑起事端 必须承担由此引发的一切恶果

国台办:春节是中华民族最重要的传统节日 民进党当局如果胆敢在祥和的节日里无端挑起事端 必须承担由此引发的一切恶果

闪电新闻
2026-02-11 15:49:24
两外国友人从海口打车到哈尔滨,司机:老婆以为是诈骗报了警,我39岁第一次出海南,还有幸看到了天安门

两外国友人从海口打车到哈尔滨,司机:老婆以为是诈骗报了警,我39岁第一次出海南,还有幸看到了天安门

极目新闻
2026-02-11 12:17:11
性感女老师与学生长期开房:照片流出,肮脏细节披露,官方回应

性感女老师与学生长期开房:照片流出,肮脏细节披露,官方回应

博士观察
2026-02-11 18:14:36
2026-02-11 22:39:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11219文章数 116968关注度
往期回顾 全部

科技要闻

V4来了?DeepSeek 灰度测试新版本

头条要闻

Seedance2.0火遍全球效果媲美好莱坞大片 老外求教程

头条要闻

Seedance2.0火遍全球效果媲美好莱坞大片 老外求教程

体育要闻

搞垮一个冬奥选手,只需要一首歌?

娱乐要闻

大孤山风波愈演愈烈 超50位明星扎堆

财经要闻

广州前首富被判无期 200亿集资窟窿何偿

汽车要闻

比亚迪最美B级SUV? 宋Ultra这腰线美翻了

态度原创

亲子
旅游
时尚
教育
家居

亲子要闻

保护孩子宝妈必学,警惕孩子的卫生强迫行为!

旅游要闻

来浦东过大年丨新春住宿消费券重磅来袭!最高立减800元,暖心助燃住在浦东

3种美翻天的穿搭,换个方式过春天

教育要闻

中国传媒大学2026年艺术类本科校考专业招生考试复试结果查询通知

家居要闻

简雅闲居 静享时光柔

无障碍浏览 进入关怀版