网易首页 > 网易号 > 正文 申请入驻

突发!谷歌发布史上最强大模型Gemini,打爆GPT-4

0
分享至

金磊 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

传闻中的谷歌杀手锏Gemini,来了!

就在刚刚,谷歌CEO皮猜和哈萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。

标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。

具体来说,此次谷歌一共带来了Gemini的三个版本:

  • Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务
  • Gemini Pro:可扩展至各种任务的Gemini模型
  • Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)

其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平

而Gemini Pro从今天起,就会在Bard中实装上线。

同时,谷歌Gemini团队还公布了一份60页的详细技术报告。

消息一出,社交媒体瞬间炸了锅。

英伟达AI科学家Jim Fan就第一时间转发评论:

这是OpenAI王座的有力竞争者。

话不多说,一起来看更多细节。

谷歌史上最强大模型Gemini

在LLM中的表现,也正如我们刚才所述,32个基准测试中拿下30个SOTA。

其中,通用、推理、数学和编程等大方向的成绩如下表所示:

△Gemini 在包括文本和编码在内的一系列基准测试中达到SOTA

多模态方面,Gemini Ultra在新的MMMU基准测试中也获得了59.4%的SOTA分数。

这项基准测试是由跨不同领域的多模式任务组成,需要大模型进行一个深思熟虑的推理过程。

根据谷歌给出的图像基准测试结果来看,Gemini Ultra在没有OCR系统的帮助下,表现优于之前最先进的模型。

△Gemini 在一系列多模态基准测试中达到SOTA

接下来,我们以具体的案例来看一下Gemini的能力。

例如科学家们经常要面对从成千上万的文献中提取数据的难题,像下面这篇研究,作者就通过手动的方法从上万篇遗传学论文中创建了数据集。

像这样的数据集是需得随着时间流逝而进行更新的,但现实的情况是,自2021年以来,这个领域便已有超过200000篇新增的论文……

再像以往手动的方式显然是不可行的,不过现在有了Gemini,一切就变得简单了起来。

首先,通过自然语言的Prompt,告诉Gemini去过滤相关的科学论文:

只需片刻时间,Gemini就能找到相关论文和非相关的论文。

而后,继续用Prompt告诉Gemini去阅读相关论文,并提取关键数据,甚至是可以要求它添加注释的那种。

如果你给Gemini一个午休的时间长度,它就能阅读200000篇论文,从中筛选出250篇并提取数据!

并且由于Gemini是多模态的,我们还可以让它对上面的数据表格做进一步的深入操作,例如更新图表:

对于学生党来说,Gemini现在也可以成为非常得力的学习助手。

例如“喂”给Gemini一张手写物理题,它不仅能看懂,而且还可以辨别手写答案的对错。

在此基础上,若是选择一个错误的题目,我们还可以跟Gemini通过自然语言沟通,让它对每一个细节步骤进行详解。

在看图像做理解和推理方面,谷歌还亮出了更多有意思的案例。

例如替换图片素材的组合方式,Gemini就能像人一样精准猜中所指的电影名字

就连下面这种高难度的也能hold住:

再如寻找两张图片的相似之处:

更有意思的是,谷歌还特意用中文做了个demo,来展示Gemini对多张图片的组合理解能力:

那么接下来的问题就是:Gemini是如何做到的?

60页报告透露技术细节

谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。

因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。

这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。

而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。

谷歌对此表示:

这样的训练方法,有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模态模型;而且它的功能在几乎每个领域都是最先进的。

具体到模型架构方面,Gemini基于增强的Transformer decoder打造,采用了高效attention机制(如multi-query attention),支持32k上下文长度。

尽管没有透露Ultra和Pro版本的具体参数规模,但技术报告中提到,谷歌使用TPUv5e和TPUv4来训练Gemini。

训练Gemini Ultra使用了跨多个数据中心的大量TPUv4。这意味着与谷歌此前的主力大模型PaLM-2相比,Gemini在规模上显著增大。

此前,PaLM-2被曝参数规模为3400亿。

Gemini Pro实装上线

竞争对手那边,OpenAI的GPTs惊艳全世界,微软的Copilot更是先一步渗透进全线产品。

因此Gemini一出,谷歌也当即强调:Gemini将通过谷歌产品推向数十亿用户

率先上线的是Gemini Pro。从今天起,谷歌的聊天机器人Bard将由Gemini Pro微调版本驱动。谷歌表示:

这是Bard自推出以来的最大升级。

谷歌还打算把Gemini引入手机:Pixel 8 Pro将是第一款运行Gemini Nano的智能手机。

另外,谷歌计划在接下来几个月中,将Gemini全面推向搜索、广告、Chrome和Duet AI等产品线。

根据官方数据,Gemini能使用户的搜索生成体验(SGE)速度更快、质量更高,比如在美国使用英语搜索延迟能减少40%。

值得关注还有,就在Gemini正式亮相的同时,谷歌还推出了专为大模型而设计的新一代TPU——Cloud TPU v5p。

那么,你觉得这一波,谷歌能赶上OpenAI的脚步吗?

参考链接:
[1]https://blog.google/technology/ai/google-gemini-ai
[2]https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
[3]https://youtu.be/jV1vkHv4zq8?si=jjAw0uV0dkpP3eVT

责任编辑:朴琳清_NBJS24703

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
荒唐不可怕,可怕的是荒唐了几十年,没人问一句“凭什么”!

荒唐不可怕,可怕的是荒唐了几十年,没人问一句“凭什么”!

阿离家居
2026-03-20 04:49:00
人到60岁后,最值得打的4种疫苗,每一针都可能在关键时刻救命!

人到60岁后,最值得打的4种疫苗,每一针都可能在关键时刻救命!

医学科普汇
2026-03-20 20:25:06
米内罗伤了,申花没吴曦球满天飞 中场1个不能缺 薛庆浩场均神扑

米内罗伤了,申花没吴曦球满天飞 中场1个不能缺 薛庆浩场均神扑

替补席看球
2026-03-21 17:53:45
古代的公主出嫁前,宫女为何要先去驸马家过一夜?原因其实很简单

古代的公主出嫁前,宫女为何要先去驸马家过一夜?原因其实很简单

千秋文化
2026-03-17 22:17:10
解放前的西藏有多黑暗?触目惊心,少女沦为玩物,农民不如耗牛

解放前的西藏有多黑暗?触目惊心,少女沦为玩物,农民不如耗牛

新一说史
2026-03-12 19:26:35
强势晋级!上海女排3-1双杀山东,主场碾压挺进决赛

强势晋级!上海女排3-1双杀山东,主场碾压挺进决赛

金毛爱女排
2026-03-21 18:03:45
雷军真的怕了!不敢再公布SU7的订单量,是34分钟1.5万锁单太少?

雷军真的怕了!不敢再公布SU7的订单量,是34分钟1.5万锁单太少?

互联网.乱侃秀
2026-03-21 11:33:19
高岗遗孀李力群活到100岁,晚年说起毛主席那段往事,满怀感念

高岗遗孀李力群活到100岁,晚年说起毛主席那段往事,满怀感念

寄史言志
2026-03-19 20:10:09
2013年,康熙传位遗诏问世,揭秘了真实的雍正夺位之谜

2013年,康熙传位遗诏问世,揭秘了真实的雍正夺位之谜

谈古论今历史有道
2026-03-21 12:45:03
外国明明也有高酒精度的烈酒,为啥老外还是会喝不惯中国的白酒?

外国明明也有高酒精度的烈酒,为啥老外还是会喝不惯中国的白酒?

向航说
2026-03-16 00:40:03
特朗普没想到的一幕:王毅连接两个电话,以色列对华做出正式承诺

特朗普没想到的一幕:王毅连接两个电话,以色列对华做出正式承诺

剧短情长
2026-03-21 17:23:10
金融圈突发!陈兵,主动投案!

金融圈突发!陈兵,主动投案!

中国基金报
2026-03-20 21:50:38
赖清德宣布重启两个核电厂,罗智强:证实国民党比民进党有远见多了

赖清德宣布重启两个核电厂,罗智强:证实国民党比民进党有远见多了

海峡导报社
2026-03-21 18:33:02
台外事部门负责人表态,愿与王毅外长会面:会主动伸出手和他握手

台外事部门负责人表态,愿与王毅外长会面:会主动伸出手和他握手

触摸史迹
2026-03-20 15:03:22
913唯一幸存者临终首次开口:我曾举枪瞄准林彪,扣动扳机那一刻他回头看了我一眼

913唯一幸存者临终首次开口:我曾举枪瞄准林彪,扣动扳机那一刻他回头看了我一眼

寄史言志
2026-03-18 17:25:06
王艺竹哑火娜塔疲惫周页彤火力全开江苏扳平天津

王艺竹哑火娜塔疲惫周页彤火力全开江苏扳平天津

二爷台球解说
2026-03-21 17:46:12
正式退役!整整28年啊,终于可以退役了,神射手终于圆梦了

正式退役!整整28年啊,终于可以退役了,神射手终于圆梦了

球童无忌
2026-03-21 00:47:48
46岁董洁同框56岁闫妮,穿一万块白衬衫配微喇裤,一脸苦相很疲惫

46岁董洁同框56岁闫妮,穿一万块白衬衫配微喇裤,一脸苦相很疲惫

寻墨阁
2026-03-18 20:48:19
中越谈完,董军将启程回国,越南领导人立下军令状,向美传递信号

中越谈完,董军将启程回国,越南领导人立下军令状,向美传递信号

不似少年游
2026-03-21 07:11:23
台当局紧张坏了,大陆对台湾同胞做出一项公开承诺!赖清德慌了神

台当局紧张坏了,大陆对台湾同胞做出一项公开承诺!赖清德慌了神

小蒋爱唠嗑
2026-03-21 03:30:35
2026-03-21 20:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12320文章数 176418关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

体育要闻

谁在决定字母哥未来?

娱乐要闻

CMG盛典获奖名单:章子怡高叶同获影后

财经要闻

通胀警报拉响,加息潮要来了?

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

数码
健康
亲子
房产
公开课

数码要闻

迷你主机新玩法:双系统+AI一键装

转头就晕的耳石症,能开车上班吗?

亲子要闻

萌娃问妈妈爸爸是不是她生的,下一句你绝对猜不到,太逗了

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版