网易首页 > 网易号 > 正文 申请入驻

谷歌凌晨突然发布Gemini 3,提供先进推理功能

0
分享至

DoNews11月19日消息,今天,谷歌正式发布 Gemini 3。它不仅是全球领先的多模态理解模型,更是谷歌迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型,能够提供更丰富的可视化效果和更深度的交互体验——而这一切都构建在最先进的推理能力之上。


谷歌于今日推出 Gemini 3 Pro 预览版,将其集成到 Google 的全栈产品中。用户在日常生活中即可使用它来学习、构建和规划一切事务。

同时,谷歌还推出了 Gemini 3 Deep Think 模式——这一增强型推理模式将 Gemini 3 的性能再次提升至全新高度。该模式在向 Google AI Ultra 订阅用户开放前,会首先供安全测试人员试用。

推理能力

凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro 能够将任何创意变为现实。在每个关键的 AI 基准测试中,它的性能均显著超越 2.5 Pro。

它在 LMArena 排行榜上以 1501 的突破性 Elo 评分高居榜首。其在推理能力上展现出博士水平,在“人类终极考试”中(未使用任何工具的情况下得分率达 37.5%)及 GPQA Diamond 基准测试中(准确率高达 91.9%)均获得最高分。

此外,它在数学领域为前沿模型树立了全新标杆,在 MathArena Apex 测试中,以 23.4% 达到了最先进水平(State-of-the-Art)。

除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。

这意味着 Gemini 3 Pro 具备高度可靠性,能够有效解决跨越科学和数学等广泛主题的复杂问题。


Gemini 3 在一系列关键 AI 基准测试中达到了最先进水平

Gemini 3 Pro 为每一次交互带来了全新的深度和细致入微的体验。它的回复智能、简洁、直接,它会告诉用户真正需要了解的信息,而不仅仅是用户希望听到的。Gemini 3 Pro 提供了理解信息和自我表达的全新途径,无论是通过生成高保真可视化代码来解析深奥的科学概念,还是进行创意头脑风暴,都能为用户提供强大助力。

深度思考

Gemini 3 的“深度思考模式”(Deep Think mode)进一步拓展了智能的边界,为 Gemini 3 的推理和多模态理解能力带来了跨越式提升,能够助力您攻克更复杂的难题。


Gemini 3 的“深度思考模式”(Deep Think mode)在一些最具挑战性的 AI 基准测试中表现出色

在测试中,Gemini 3 Deep Think 在“人类最终考试”(Humanity's Last Exam)中的表现(未使用工具的情况下达到 41.0%)以及在 GPQA Diamond 测试中的表现(达到 93.8%),均超越了 Gemini 3 Pro 已经令人印象深刻的成绩。

此外,它还在 ARC-AGI -2 基准测试中取得了 45.1% 的突破性成绩(启用代码执行),充分展现了其解决新型挑战的能力。

学习一切

Gemini 从设计之初,就致力于无缝整合任何主题的跨模态信息,涵盖文本、图像、视频、音频和代码。Gemini 3 以其领先的推理能力、视觉与空间理解能力、多语言性能以及 100 万令牌的上下文窗口,进一步突破了多模态推理的前沿,帮助您以最适合自己的方式进行学习。

举例来说,如果您想学习烹饪家族传统菜肴,Gemini 3 可以解读并翻译不同语言的手写菜谱,整理成一本可分享的家族食谱。又或者,当您希望研究一个新主题时,只需提供学术论文、冗长的视频讲座或教程,它便能生成用于交互式闪卡、可视化图表或其他形式的代码,帮助您快速掌握素材。它甚至可以分析您匹克球比赛的视频,识别技术短板,并生成全面提升动作技巧的训练计划。

为了帮助您更好地理解网络信息,Search 中的 AI 模式 (AI Mode) 现已整合 Gemini 3,带来全新的生成式用户界面(Generative UI)体验,例如沉浸式视觉布局、交互式工具和模拟,所有内容均可根据您的查询实时生成。

构建一切

在 2.5 Pro 成功的基础上,Gemini 3 兑现了帮助开发者将创意变为现实的承诺。它在零样本生成(Zero-shot Generation)方面表现出色,能够处理复杂的提示和指令,从而渲染出更丰富、更具交互性的网页用户界面(Web UI)。

Gemini 3 是我们迄今为止构建的最出色的氛围编程(Vibe Coding)和智能体编程(Agentic Coding)模型——让我们的产品更具自主性,同时提高开发者生产力。它在 WebDev Arena 排行榜上以令人瞩目的 1487 ELO 名列前茅。

在 Terminal-Bench 2.0 测试中(一个测试模型通过终端操作计算机的工具使用能力)上也取得 54.2% 的好成绩;同时,在衡量编程智能体(coding agents)的 SWE-bench Verified(76.2%)基准测试中,其表现远超 2.5 Pro。

您现在可以通过 Google AI Studio、Vertex AI、Gemini CLI 以及我们全新的智能体开发平台 Google Antigravity 中使用 Gemini 3 进行开发和构建。同时,它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台上线。

全新的以智能体为核心的开发体验

随着 Gemini 3 模型智能的不断加速,我们有机会重新构想整个开发者体验(developer experience)。今天,我们正式发布 Google Antigravity,我们全新的智能体开发平台,让开发者能够在更高层次上,以任务为导向的方式进行开发。

Google Antigravity 利用 Gemini 3 的高级推理、工具使用和智能编码能力,将 AI 辅助从开发者工具包中的工具转变为一个活跃的伙伴。尽管 Google Antigravity 的核心仍沿用熟悉的 AI 集成开发环境(IDE),但其智能体已被提升到一个专属的界面,并被赋予直接访问编辑器、终端和浏览器的权限。

现在,智能体能够代表您自主规划和执行复杂的端到端软件任务,并在此过程中自行验证代码。

除了 Gemini 3 Pro 之外,Google Antigravity 还深度整合了我们最新的用于浏览器控制的 Gemini 2.5 Computer Use 模型,以及我们广受好评的图像编辑模型 Nano Banana(Gemini 2.5 Image)。

规划一切

自从 Gemini 2 开启智能体时代以来,我们取得了巨大的进展,不仅提升了 Gemini 的编码智能体(coding agent)能力,还提高了它在更长周期内可靠地提前规划能力。Gemini 3 在 Vending-Bench 2 排行榜上名列榜首,印证了这一点。

该基准测试通过管理模拟自动售货机业务来测试长周期规划能力。Gemini 3 在整整一年的模拟运营过程中,保持了工具使用和决策的一致性,在没有偏离任务的前提下,带来了更高的回报。


Gemini 3 Pro 展示了更优秀的长期规划能力,与其他前沿模型相比,能够产生显著更高的回报

这意味着 Gemini 3 能更好地帮助您完成日常事务。凭借更深入的推理能力和更稳定的工具使用,Gemini 3 能在您的控制和指导下,帮您完成整个复杂、多步骤的工作流程——例如整理 Gmail 收件箱或规划完整的旅行行程。

Google AI Ultra 订阅者今天就可以在 Gemini 应用中使用 Gemini Agent 来体验这些智能体能力。我们在提升 Gemini 的智能体能力方面收获良多,我们也很快会将这些功能扩展到更多 Google 产品,非常期待看到您如何使用它。

负责任地构建 Gemini 3

Gemini 3 是谷歌迄今为止最安全的模型,并且接受了 Google AI 模型中最全面的一套安全评估。该模型展现了更低的谄媚性(sycophancy),更高的抗提示注入(prompt injection)能力,并强化了抵御网络攻击滥用的保护措施。

除了对谷歌前沿安全框架(Frontier Safety Framework)中关键领域进行内部测试外,谷歌还与全球前沿领域的专家合作进行了评估,向英国人工智能安全研究所(UK AISI)等机构提供了早期访问,并获得了 Apollo、Vaultis、Dreadnode 等行业专家的独立评估意见。更多信息,详见 Gemini 3 模型卡。

下一个时代

这仅仅是 Gemini 3 时代的开始。从今天起, Gemini 3 逐步向用户开放,供您试用体验:

适用于所有 Gemini app 的用户,以及在 Search 的 AI Mode 下的 Google AI Pro 和 Ultra 订阅用户。

适用于 AI Studio 中 Gemini API 的开发者,我们全新的智能体开发平台 Google Antigravity 以及 Gemini CLI。

适用于 Vertex AI 和 Gemini Enterprise 的企业用户。

对于 Gemini 3 “深度思考模式”(Deep Think mode),我们正在投入更多时间进行安全评估并收集安全测试人员的反馈,预计将在未来几周内向 Google AI Ultra 订阅用户开放该功能。

谷歌计划很快发布 Gemini 3 系列中的其他模型,以便您能够借助 AI 完成更多任务。我们期待收到您的反馈,也期待看到您使用 Gemini 进行学习、构建和规划的成果。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
iPhone 18 Pro Max被曝机身尺寸变化不大 厚度达8.8mm

iPhone 18 Pro Max被曝机身尺寸变化不大 厚度达8.8mm

CNMO科技
2026-03-12 09:30:35
欧冠1/8决赛首回合综述:闪耀哥5连胜神挡杀神,英超6队得2分丢16球

欧冠1/8决赛首回合综述:闪耀哥5连胜神挡杀神,英超6队得2分丢16球

足球报
2026-03-12 08:38:06
中网友疯传张娜拉去世!公司职员也被发现死亡!经纪公司回应

中网友疯传张娜拉去世!公司职员也被发现死亡!经纪公司回应

陌上桃花开的
2026-03-10 17:51:41
个大有啥用?跑跳都不行,在场4打5+罚球3中0,再迷信她付出代价

个大有啥用?跑跳都不行,在场4打5+罚球3中0,再迷信她付出代价

南海浪花
2026-03-12 09:01:11
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
刘飞儿过年又长大了,直言买不到合适的衣服,称自己不是A8是大G

刘飞儿过年又长大了,直言买不到合适的衣服,称自己不是A8是大G

新游戏大妹子
2026-03-11 12:28:07
北京商场“脱衣门”:那个穿耐克的女人,把全家的脸都丢光了

北京商场“脱衣门”:那个穿耐克的女人,把全家的脸都丢光了

王晓爱体彩
2026-03-12 00:34:19
大结局来了?特朗普强势宣布结束战争,以色列也不得不出来表态 !

大结局来了?特朗普强势宣布结束战争,以色列也不得不出来表态 !

Ck的蜜糖
2026-03-11 17:19:49
伊朗导弹击中耶路撒冷,驻有美军基地多国传出爆炸声

伊朗导弹击中耶路撒冷,驻有美军基地多国传出爆炸声

界面新闻
2026-03-02 15:09:03
特朗普人还没到,先改访华规格,中方已得到消息:美国要弯道超车

特朗普人还没到,先改访华规格,中方已得到消息:美国要弯道超车

吴蒂旅行ing
2026-03-11 19:18:02
“马上林冲,马下武松”其实下半句才是精华,知道的人却凤毛麟角

“马上林冲,马下武松”其实下半句才是精华,知道的人却凤毛麟角

铭记历史呀
2026-03-11 17:26:05
江郎才尽!随着欧冠0:3完败皇马,瓜迪奥拉已到离开曼城之时!

江郎才尽!随着欧冠0:3完败皇马,瓜迪奥拉已到离开曼城之时!

田先生篮球
2026-03-12 11:55:32
伊朗这次玩得挺花!

伊朗这次玩得挺花!

梳子姐
2026-03-12 08:23:09
豆包悄悄更新!超强专家模式,搞定你90%的复杂工作!

豆包悄悄更新!超强专家模式,搞定你90%的复杂工作!

秋叶PPT
2026-03-11 08:20:55
5年2.4亿美元合同!湖人真的拼了,还想要字母哥

5年2.4亿美元合同!湖人真的拼了,还想要字母哥

德译洋洋
2026-03-12 12:47:53
第37波!美军已伤亡147人!特朗普逼盟友下场,最大赢家竟然是它

第37波!美军已伤亡147人!特朗普逼盟友下场,最大赢家竟然是它

薛小荣
2026-03-11 19:31:49
最新中国船员战区通讯录音曝光,多艘中国货船被公司要求撤离霍尔木兹海峡

最新中国船员战区通讯录音曝光,多艘中国货船被公司要求撤离霍尔木兹海峡

爆角追踪
2026-03-11 12:37:33
中东突发!两艘油轮遭袭并起火,已有1人死亡!刚刚,油价飙涨!特朗普最新发声

中东突发!两艘油轮遭袭并起火,已有1人死亡!刚刚,油价飙涨!特朗普最新发声

中国基金报
2026-03-12 08:39:42
入伍三年回家要离婚,却见妻子抱着两岁娃喂饭,我爸从里屋走出来

入伍三年回家要离婚,却见妻子抱着两岁娃喂饭,我爸从里屋走出来

晓艾故事汇
2026-03-09 14:06:57
1949年初卫立煌流亡香港,毛主席下令:立刻通知合肥县保护家属

1949年初卫立煌流亡香港,毛主席下令:立刻通知合肥县保护家属

北海史记
2026-03-09 15:26:48
2026-03-12 13:28:49
DoNews incentive-icons
DoNews
不局限于对互联网行业的追踪与探索,更要向未来、向未知的方向迈进。
105937文章数 26807关注度
往期回顾 全部

科技要闻

腾讯"养虾"暴涨后,百度急得在门口"装虾"

头条要闻

牛弹琴:伊朗开出停战三大条件 这是让美国"投降"啊

头条要闻

牛弹琴:伊朗开出停战三大条件 这是让美国"投降"啊

体育要闻

要脸,还是要83分纪录?

娱乐要闻

李湘瘦身惊艳亮相肖邦之夜 携女儿出席

财经要闻

卢锋:从特朗普团队群演看时代变局

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

亲子
时尚
家居
数码
教育

亲子要闻

临摹的方法找到了,这下会画虾了

今年春天最时髦的6组搭配,照着穿美出新高度!

家居要闻

触感本真 家的迹象

数码要闻

七彩虹主板更新适配英特尔酷睿Ultra新U,背插3.0新品主板发布!

教育要闻

六年级附加题:填分数,方法不好想到

无障碍浏览 进入关怀版