网易首页 > 网易号 > 正文 申请入驻

谷歌最强大AI模型Gemini 3来了!推理能力实现重大突破!图像生成、编程与AI搜索全面增强

0
分享至

当地时间11月18日,Alphabet旗下的谷歌正式发布备受期待的该司迄今最强大人工智能(AI)模型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用。这是谷歌首次在新模型发布当天就将其整合到搜索产品中,显示出公司加快AI技术商业化的决心。

Alphabet首席执行官桑达尔·皮查伊当天表示,新AI模型将针对更复杂的问题提供更优答案。"用户只需更少的提示,即可获得所需结果。"此外,新模型在编程、应用开发与图像生成方面的能力也大幅增强。


图片来源:每经记者 郑雨航 摄

Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及其企业级产品。该模型将自周二起向部分订阅用户开放,并将在未来几周更大范围上线。

此次发布距离谷歌推出Gemini 2.5仅八个月,距离Gemini 2.0上线也仅11个月。引爆生成式AI热潮的OpenAI已于今年8月份发布GPT-5。

皮查伊写道:“令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中全面铺开。”

据谷歌披露的数据显示,Gemini应用目前月活跃用户已达6.5亿,而AI Overviews拥有20亿月活用户。OpenAI则在8月表示,ChatGPT周活跃用户已突破7亿。

谷歌高管在新闻发布会上强调,在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先地位。Gemini 3在全球AI模型LMArena排行榜上以1501分的历史最高分登顶,在衡量通用推理能力的Humanity's Last Exam基准测试中获得37.5%的最高分,超越了此前由GPT-5 Pro保持的31.64%纪录。该模型还在数学、多模态理解和事实准确性等多个维度刷新了行业标准。

谷歌AI研究实验室DeepMind的CEO Demis Hassabis表示,Gemini 3是"世界上最好的多模态理解模型",也是公司迄今最强大的智能体和代码生成模型。谷歌CEO Sundar Pichai在博客中称其为"我们最智能的模型",能够"将任何想法变为现实"。

推理能力实现重大突破

Gemini 3在推理能力上取得了显著进步,在多项学术级基准测试中展现出博士水平的表现。该模型在GPQA Diamond测试中获得91.9%的高分,在数学领域的MathArena Apex基准测试中取得23.4%的新成绩,在事实准确性方面于SimpleQA Verified测试中达到72.1%的得分。

在多模态推理方面,Gemini 3同样表现出色,在MMMU-Pro测试中获得81%的分数,在Video-MMMU测试中达到87.6%。这意味着该模型能够高度可靠地处理科学和数学等广泛领域的复杂问题。


谷歌产品负责人Tulsee Doshi表示:"在Gemini 3身上,我们看到了推理能力的巨大飞跃。它的响应深度和细微程度是我们以前从未见过的。"

除标准版本外,谷歌还推出了Gemini 3 Deep Think增强推理模式,该模式在Humanity's Last Exam测试中达到41.0%的成绩,在GPQA Diamond测试中获得93.8%的分数。在ARC-AGI-2测试中,Deep Think模式创下了45.1%的前所未有成绩,展示了其解决新颖挑战的能力。谷歌表示,该模式正在接受额外的安全评估,将在未来几周内向Google AI Ultra订阅用户开放。


开发者工具全面升级

在代码生成领域,Gemini 3被谷歌称为"迄今构建的最佳vibe coding和智能体编码模型"。该模型在WebDev Arena排行榜上以1487分的高分登顶,在衡量模型通过终端操作计算机能力的Terminal-Bench 2.0测试中获得54.2%的分数,在评估代码智能体的SWE-bench Verified基准测试中达到76.2%,远超Gemini 2.5 Pro的表现。

开发者可以通过Google AI Studio、Vertex AI、Gemini CLI以及Cursor、GitHub、JetBrains、Manus和Replit等第三方平台访问Gemini 3。

谷歌同时推出了以智能体为先的全新开发平台Google Antigravity,该平台利用Gemini 3的高级推理、工具使用和智能体编码能力,将AI辅助从开发者工具箱中的一个工具转变为主动合作伙伴。DeepMind首席技术官Koray Kavukcuoglu表示:"智能体可以在你的编辑器、终端和浏览器之间工作,以最佳方式帮助你构建应用程序。"

多模态理解与智能体能力并进

Gemini 3保留了该系列模型从一开始就具备的跨模态信息综合能力,能够无缝处理文本、图像、视频、音频和代码等多种模态信息,并配备100万token的上下文窗口。

Hassabis举例说,如果用户想学习传统的烹饪,Gemini 3可以破译并翻译不同语言的手写食谱,制作成可分享的家庭食谱书。如果用户想了解新主题,可以提供学术论文、长视频讲座或教程,Gemini 3能够生成交互式闪卡、可视化或其他格式的内容帮助用户掌握材料。该模型甚至可以分析用户匹克球比赛的视频,识别改进空间并生成整体动作改善的训练计划。

在智能体能力方面,Gemini 3在测试长期规划能力的Vending-Bench 2排行榜上位居榜首。该模型能够在整整一年的模拟运营中保持一致的工具使用和决策能力,在不偏离任务的情况下实现更高回报。这意味着Gemini 3能够通过结合更深入的推理与改进的工具使用,代表用户导航更复杂的多步骤工作流程,例如预订本地服务或整理收件箱。

发布即上线多个核心产品

谷歌此次采取了积极的产品策略,在Gemini 3发布首日就将其整合到多个核心产品中。这是谷歌首次在新模型发布当天就将其应用于搜索产品,标志着公司AI商业化战略的重要转变。

在搜索方面,AI Mode现在使用Gemini 3来实现新的生成式用户界面体验,包括沉浸式视觉布局、交互式工具和模拟,所有这些都根据用户查询实时生成。在Gemini App中,所有用户都可以使用Gemini 3,Google AI Pro和Ultra订阅用户还可以在AI Mode搜索中使用该模型。

在安全性方面,谷歌表示Gemini 3是其迄今最安全的模型,经历了谷歌AI模型史上最全面的安全评估。该模型显示出更低的谄媚性、更强的提示注入抵抗力,以及通过网络攻击滥用的更好防护。除了根据其前沿安全框架进行的内部测试外,谷歌还与世界领先的领域专家合作进行评估,向英国AISI等机构提供早期访问权限,并获得了Apollo、Vaultis和Dreadnode等行业专家的独立评估。

每日经济新闻综合公开资料

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曾琦医生的事还没过去,又来个劲爆的!

曾琦医生的事还没过去,又来个劲爆的!

诗意世界
2025-11-11 10:42:51
特朗普不去,普京也不去,中方通知日本,不会在G20见高市早苗

特朗普不去,普京也不去,中方通知日本,不会在G20见高市早苗

头条爆料007
2025-11-19 08:06:47
杨毅爆料:巴黎奥运会时,队内没人盼着樊振东夺冠

杨毅爆料:巴黎奥运会时,队内没人盼着樊振东夺冠

花心电影
2025-11-18 09:43:41
李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

古希腊掌管月桂的神
2025-11-17 13:59:26
“曾经的骄傲,变成了这副德行”,家长晒211女儿变化,看清现实

“曾经的骄傲,变成了这副德行”,家长晒211女儿变化,看清现实

妍妍教育日记
2025-11-17 17:50:34
明天(11月20日)的剧本来了,你准备好了吗?

明天(11月20日)的剧本来了,你准备好了吗?

一担金
2025-11-19 14:22:58
机关事业单位退休人员迎来好消息,除了养老金外,还有一笔钱能领

机关事业单位退休人员迎来好消息,除了养老金外,还有一笔钱能领

社保小达人
2025-10-27 14:50:06
要来了!一汽丰田全新RAV4荣放将于11月19日首发,或广州车展上市

要来了!一汽丰田全新RAV4荣放将于11月19日首发,或广州车展上市

趣味萌宠的日常
2025-11-19 10:52:54
谁在纵容《好东西》这种烂片到处拿奖?

谁在纵容《好东西》这种烂片到处拿奖?

木风的影视剧综Vista
2025-11-17 20:51:38
岛内风向大变,郑丽文送大陆一句话,特朗普:再不出手就没机会了

岛内风向大变,郑丽文送大陆一句话,特朗普:再不出手就没机会了

章幃户外
2025-11-19 14:23:12
精于算计的国人,正在遭遇反噬

精于算计的国人,正在遭遇反噬

深度报
2025-09-21 22:57:11
高市早苗的面相,早有注定!

高市早苗的面相,早有注定!

燕梳楼频道
2025-11-17 12:28:50
Anthropic CEO:最快明年,一半初级白领下岗!失业率将达10%-20%

Anthropic CEO:最快明年,一半初级白领下岗!失业率将达10%-20%

新智元
2025-11-18 20:18:54
恩爱人设崩塌?罗晋唐嫣又被曝离婚,让人担心的事情还是发生了

恩爱人设崩塌?罗晋唐嫣又被曝离婚,让人担心的事情还是发生了

白面书誏
2025-11-19 14:38:34
全网热议!西安供暖“强制收费”引众怒,这次很难收场

全网热议!西安供暖“强制收费”引众怒,这次很难收场

娱乐洞察点点
2025-11-19 13:16:18
4-2神剧情 命运5次互换 补时绝杀 FIFA第38掀翻小组第1晋级世界杯

4-2神剧情 命运5次互换 补时绝杀 FIFA第38掀翻小组第1晋级世界杯

狍子歪解体坛
2025-11-19 06:36:11
危险的信号,美国只消耗全世界7%的铜,却囤积了40%多的铜库存

危险的信号,美国只消耗全世界7%的铜,却囤积了40%多的铜库存

沧海旅行家
2025-11-19 14:35:41
退票率飙至7.6%,日本电影《鬼灭之刃》上座率大跌!

退票率飙至7.6%,日本电影《鬼灭之刃》上座率大跌!

北京商报
2025-11-19 13:24:36
倒闭14万家!曾年赚22亿的奶茶之王,加盟商怒挂条幅:血本无归!

倒闭14万家!曾年赚22亿的奶茶之王,加盟商怒挂条幅:血本无归!

青眼财经
2025-11-13 23:02:27
无缘亚洲杯正赛,中国香港主帅:原本为童话般结局做好了准备

无缘亚洲杯正赛,中国香港主帅:原本为童话般结局做好了准备

懂球帝
2025-11-19 08:23:09
2025-11-19 15:51:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1405664文章数 2720100关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

男子吐槽乱插队被80多岁老人打伤 对方喊话"谁敢拦我"

头条要闻

男子吐槽乱插队被80多岁老人打伤 对方喊话"谁敢拦我"

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

旅游
数码
本地
公开课
军事航空

旅游要闻

安徽肥东:新地名串出新风景

数码要闻

闪存全面大幅涨价 最高涨幅达38.46%

本地新闻

第十二届影展携手重庆来福士丨两江交汇,光影共生

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

量大管饱 中国军网在海外发布备战视频

无障碍浏览 进入关怀版