网易首页 > 网易号 > 正文 申请入驻

谷歌 Gemma 2 2B 发布火爆,小模型如何撑起大格局?

0
分享至

Gemma系列语言模型正在引领着一场“小”的技术革命。

作者丨陈鹭伊

编辑丨岑峰

语言模型的“小时代”正式到来?

北京时间8月1日凌晨(当地时间7月31日下午),Google深夜放出大招,发布了其Gemma系列开源语言模型的更新,在AI领域引发了巨大的震动。Google Developer的官方博客宣布,与6月发布的27B和9B参数版本相比,新的2B参数模型在保持卓越性能的同时,实现了“更小、更安全、更透明”的三大突破。

1

小,但更好

Gemma 2 2B版本,这一通过蒸馏学习技术精心打磨的成果,不仅优化了NVIDIA TensorRT-LLM库,更在边缘设备到云端的多种硬件上展现出了卓越的运行能力。

更重要的是,较小的参数量大大降低了研究和开发的门槛,使得Gemma 2 2B能够在Google Colab的免费T4 GPU服务上流畅运行,为用户带来了灵活且成本效益高的解决方案。

大模型竞技场LMsys上,Gemma 2 2B的发布也迅速引起了广泛关注。LMsys第一时间转发了Google Deepmind的推文,对超越了参数量10倍于Gemma 2 2B版本的“老前辈”GPT-3.5-Tubro表示祝贺。

Google在与OpenAI的LLM竞争中虽然未能胜出,但其SLM的发展势头却愈发强劲。今年二月,Google 推出了 Gemma 系列模型,这些模型设计更为高效和用户友好。Gemma 模型可以轻松运行在各种日常设备上,如智能手机、平板电脑和笔记本电脑,无需特殊硬件或复杂优化。

Gemma 2模型的技术创新点在于引入了Gemma Scope功能,这是一套开放的稀疏自编码器(Sparse AutoeEncoders, SAEs),新模型包含400多个SAEs,用于分析 Gemma 2 2B 和 9B 模型的每一层和子层,为研究人员提供了理解语言模型内部工作原理的强大工具。

Google Deepmind 语言模型可解释性团队则是通过官方博客对 Gemma Scope 进行了更多的技术分析。该团队称,Gemma Scope旨在帮助研究人员理解Gemma 2语言模型的内部工作原理,推动可解释性研究,构建更强大的系统,开发模型幻觉保护措施,防范自主AI代理的风险。稀疏自动编码器(SAE)将作为“显微镜”,帮助研究人员观察语言模型内部。

值得注意的是,尽管Gemma 2 2B为开发者提供了一种灵活且成本效益高的解决方案,但在训练阶段仍然需要投入大量的计算资源。根据Deepmind博客,Gemma Scope的训练使用了约相当于15%的Gemma 2 9B训练计算资源(或GPT3的22%训练计算资源)。

2

SLM与开源的“逆袭”

在Gemma 2 2B发布后,业界反响热烈。雷峰网GAIR硅谷自动驾驶峰会(2018)嘉宾、UC Berkeley教授Anca Dragan (推特:@ancadianadragan )第一时间发表多条推文对Gemma 2的SAE机制进行了解读。她表示,如此大的计算资源使得纯粹的学术研究机构难以参与其中,但之后学术界会进一步关注如何利用Gemma Scope的SAE机制来提高模型的解释性和AI的安全性。

计算语言学家、DAIR.AI的联合创始人Elvis Saravia (推特:@omarsar0 )也在第一时间对Gemma 2 2B进行了测试,对Gemma 2的SAE机制给予了高度评价。

随着2024年的到来,大模型的光环似乎正在逐渐褪去,而如何将模型做小,正成为今年语言模型发展的重要趋势。2023年的“百模大战”虽然激烈,但大模型的商业价值有限;相比之下,小模型在成本和效率上展现出了更大的优势。

甚至“暴力美学”的倡导者、OpenAI CEO Sam Altman也早早承认,“大模型”时代可能走向结束,未来我们会通过其他方式来改进它们。

在技术上,通过如蒸馏压缩和参数共享等手段,可以显著降低模型规模同时保持性能。Gemma 2 2B版本的亮眼表现,无疑为下一步的大模型研究提供了重要方向。

Google的另一系列语言模型Gemini,以其不公开源代码的特性,专为Google自家产品及开发者使用,与Gemma系列形成鲜明对比。而META的Llama系列则高举“开源”大旗,向OpenAI的GPT系列发起了强有力的挑战。

在过去一年中,OpenAI的GPT系列一直是这个领域无可争议的“王者”,在LMsys的“大模型竞技场”,GPT-4及其后续版本GPT4-o在大多数时间一直牢牢占据第一的位置,仅有一次被Claude 3.5 Sonnet短暂超越。

但在2024,开始有越来越多的模型向GPT系列发起了冲击。除了Google的Gemini和Gemma系列外,另一有力竞争者是META的Llama系列。与OpenAI的闭源(OpenAI也因此称为"Close AI")路径不同,META的Llama系列则是高举开源大旗的代表。

就在数天前,Meta CEO马克·扎克伯格(Mark Zuckerberg)在“史上最强开源模型”Llama 3.1发布之际,发表了题为“Open Source AI is the Path Forward”的公开信,强调了开源AI在推动AI发展中的重要性。

在Llama 3.1发布后,META AI首席人工智能学家、2018年图灵奖得主Yann Lecun(推特:@ylecun)除了发布了多篇技术角度的推文外,昨天还转发了科技网站Arstechnica的一篇关于“人工智能安全”法案SB1047看法的文章,为“开源AI”争取空间。

值得注意的是,虽然Llama系列在以大众评分为依据的LMsys“大模型竞技场”上不敌GPT-4系列,但在另一个以专家评分的竞技场“Scale Leadboard”上却在多个项目中超越了GPT-4系列。目前在Scale Leadboard的6个评测项目上,GPT-4系列仅在Spanish(西班牙语)和Methodology(方法论)上领先。

“Scale Leadboard”是由AI数据标注创企业Scale.ai所创立的排行榜。其创始人、95后华裔天才Alexanda Wang是当前硅谷最受关注的创业新星之一,目前Scale.ai为几乎所有领先的AI模型提供数据支持,并与OpenAI、Meta、微软等组织保持良好关系。目前Scale.ai的估值为138亿美元。

Gemma 2的发布,不仅是Google在AI领域的一次自我超越,更是对整个行业的一次挑战。无论是“小型化”还是“开源”,都预示着2024年将是语言模型研究的又一个春天。让我们拭目以待,Gemma 2代表的“小模型”将如何重塑AI的未来。

让大模型的暴风雨来得更猛烈些吧。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
合肥卤味怪老头遭轮番举报!锅边黑垢很厚,说话喷口水,不让问价

合肥卤味怪老头遭轮番举报!锅边黑垢很厚,说话喷口水,不让问价

阿雹娱乐
2026-06-21 20:31:56
斯诺克上海表演赛:赵心童0-2逆转,6-5险胜吴宜泽,斯佳辉轰147

斯诺克上海表演赛:赵心童0-2逆转,6-5险胜吴宜泽,斯佳辉轰147

刘姚尧的文字城堡
2026-06-21 10:03:15
吴越后台偶遇陈建斌侧身避开,成年人的边界,不必勉强大度

吴越后台偶遇陈建斌侧身避开,成年人的边界,不必勉强大度

草莓解说体育
2026-06-19 14:10:53
“斯塔默正考虑辞职”

“斯塔默正考虑辞职”

极目新闻
2026-06-21 13:12:41
全球还存在的7个流亡政府,他们都是谁?为何会流亡海外?

全球还存在的7个流亡政府,他们都是谁?为何会流亡海外?

七号说三国
2026-06-21 19:32:55
断子绝孙!无儿则族谱名下填“止”引争议,网友:多数家谱是废纸

断子绝孙!无儿则族谱名下填“止”引争议,网友:多数家谱是废纸

火山詩话
2026-06-20 15:09:51
我卖掉深圳的房子回县城,卡里躺着1000万却跟亲戚说我负债了。没两天,借给我钱的3个发小就上门来要钱了

我卖掉深圳的房子回县城,卡里躺着1000万却跟亲戚说我负债了。没两天,借给我钱的3个发小就上门来要钱了

黎兜兜
2026-06-06 14:35:15
一个被遗忘的女演员,年轻时倾国倾城,如今57岁样子已经认不出

一个被遗忘的女演员,年轻时倾国倾城,如今57岁样子已经认不出

她时尚丫
2026-06-05 19:58:37
上海这条地铁线,凭什么是全中国最能“印钞”的线?

上海这条地铁线,凭什么是全中国最能“印钞”的线?

小陆搞笑日常
2026-06-21 12:18:54
老胡这次彻底刷新了坏的下限!

老胡这次彻底刷新了坏的下限!

胖胖说他不胖
2026-06-08 11:50:14
7只半导体个股股东减持套现逾67亿,多路资金集体兑现

7只半导体个股股东减持套现逾67亿,多路资金集体兑现

第一财经资讯
2026-06-21 16:37:11
看台抢戏!巴西太太团全员出圈,比球员表现更出彩

看台抢戏!巴西太太团全员出圈,比球员表现更出彩

新民周刊
2026-06-21 10:08:28
战况突变!女排世联赛积分榜一夜大洗牌,中国女排晋级形势生变数

战况突变!女排世联赛积分榜一夜大洗牌,中国女排晋级形势生变数

史襉的生活科普
2026-06-21 17:14:19
一口破棺引爆瘟疫!刚果埃博拉全域扩散,外援已断无人可救

一口破棺引爆瘟疫!刚果埃博拉全域扩散,外援已断无人可救

怪味历史连连看
2026-06-21 00:47:32
乌克兰无人机一头撞上吊塔,莫斯科一片火海

乌克兰无人机一头撞上吊塔,莫斯科一片火海

烽火观天下
2026-06-20 11:53:27
2026年,“618”彻底熄火了

2026年,“618”彻底熄火了

新商业派
2026-06-18 15:41:55
日本毫米级门线悬案:门将极限扑救 VAR认定没有进球

日本毫米级门线悬案:门将极限扑救 VAR认定没有进球

快科技
2026-06-22 00:26:11
湖北省销量排名第一的车型:没有太多的悬念,一个月能销1232台

湖北省销量排名第一的车型:没有太多的悬念,一个月能销1232台

柳先说
2026-06-21 23:29:45
上海“单身霸总”患绝症,临终前托付母亲和房产!上百名美女被搭讪,聊天记录惊人…

上海“单身霸总”患绝症,临终前托付母亲和房产!上百名美女被搭讪,聊天记录惊人…

极目新闻
2026-06-21 10:54:45
巴萨马竞询价塞斯科遭曼联一口回绝,红魔明确表态:非卖品

巴萨马竞询价塞斯科遭曼联一口回绝,红魔明确表态:非卖品

海阔山遥YAO
2026-06-22 01:18:58
2026-06-22 02:28:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7380文章数 20758关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

艺术
家居
亲子
手机
公开课

艺术要闻

310米!欧盟第一高楼,坐落于波兰

家居要闻

绿意盎然 自然之境

亲子要闻

阿宝表演单杠,考考小姨们帮我数6分钟荡了多少圈?老妈数晕了

手机要闻

消息称供应链公司已向苹果首款折叠屏iPhone小批量供货

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版