网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌Gemini 3夜袭全球，暴击GPT-5.1！奥特曼罕见祝贺

2025-11-19 04:13:22　来源: 新智元

北京举报

0

分享至

　　新智元报道

　　编辑：桃子好困

　　【新智元导读】凌晨，谷歌终极杀器Gemini 3重磅来袭，一出手就是Pro顶配版，号称「史上最强推理+多模态+氛围编程」三合一AI战神！基准测试横扫全场，就连GPT-5.1也被斩于马下，AI的下一个时代开启。

　　它来了，它来了！

　　就在刚刚，万众期待的年度压轴之王，谷歌新一代旗舰Gemini 3炸裂登场。

　　而且，一上来就是顶配的Gemini 3 Pro——

　　迄今推理最强，多模态理解最强，以及「智能体」+「氛围编程」最强的模型！

　　强到什么程度？

　　发布一小时后，就连OpenAI CEO奥特曼，都亲自发推表示祝贺！

　　而且，还是区分大小写的版本。（不知道是不是亲自试了一下）

　　从实测来看，也的确如此。

　　在众多基准测试中，Gemini 3 Pro一举封神——

　　不仅相较于2.5 Pro实现了性能的全方位跃升，甚至直接把OpenAI刚上新的GPT-5.1甩出了好几条街。

　　用谷歌的话来总结，Gemini 3 Pro顶尖的核心在于这三点——

　　霸榜LMArena（1501分）和WebDev（1487分）

　　人类最后考试（HLE）刷出45.8%最高分，人类博士级推理

　　长程任务规划Vending-Bench 2上的王者

　　不仅如此，增强推理模式下的Gemini 3 Deep Think，更是在HLE拿下41%、GPQA 93.8%，以及ARC-AGI-2上45.1%的成绩。

　　这一天，注定是被载入史册的一天。Gemini 3一露面，全网彻底沸腾。

　　Gemini 3正开启AI下一个时代，准备好上车了吗？

　　即日起，Gemini 3 Pro预览版将全面上线。

　　而Deep Think模式还需要一段时日，才会向Google AI Ultra订阅用户开放。

　　三大重点（浓缩版）

　　Gemini 3的诞生，标志着谷歌在通往AGI的道路上，迈出了又一大步！

　　首先，它思考能力特别强，能深入理解问题，回答更有见地。

　　尤其是，特别擅长回答各种复杂的科学问题。

　　用代码构建、解构和重组详细的3D体素艺术

　　其次，它有着世界领先的多模态理解力，不论是文字、视频，还是代码都不在话下。

　　比如解读长视频，或是把论文变成互动指南，Gemini3都可以接得住。

　　在氛围编程上，Gemini 3直接刷爆了天花板。

　　简单一句话，它就能做出一个美观且灵动的应用。而且，还能精准get意图，知道如何去实现。

　　同时，它的智能体编码本领更强了，无缝衔接现有工具，与全新平台Google Antigravity搭配，堪称天作之合。

　　Gemini 3 Pro

　　博士级推理碾压一切

　　凭借顶尖推理与多模态能力，Gemini 3 Pro可以将任何想法变为现实！

　　它全面碾压前代2.5 Pro，所有核心基准测试成绩，断层领先。

　　·LMArena排行榜上名列榜首，狂揽1501 Elo突破性高分；

　　·人类最后考试（HLE）上，在不使用任何工具的情况下拿下37.5%成绩；

　　·GPQA Diamond上斩获91.9%的高分，展现出博士级的推理能力；

　　·MathArena Apex上以23.4%刷新SOTA，在数学领域树立新标杆。

　　在一系列关键AI基准测试中，Gemini 3遥遥领先

　　除了在文本测试中的优异表现，Gemini 3 Pro还是多模态王者——

　　MMMU-Pro强势斩获81%高分，以及Video-MMMU更以87.6%成绩，重新定义了多模态推理。

　　它还在SimpleQA Verified上获72.1%业界领先分数，在事实准确性方面进步巨大。

　　这意味着 Gemini 3 Pro具备超高可靠性攻克科学、数学等众多领域的复杂问题的能力。

　　每一次交互，Gemini 3 Pro都带着前所未有的「深度和细腻度」。

　　它的回答聪明、简洁、直接，摒弃了陈词滥调和奉承，提供真正的见解——告诉你需要听到的，而不仅仅是你想听到的。

　　它就像一位真正的思想伙伴，提供理解信息和表达自我的新方式。

　　不管是生成高保真可视化代码，阐释晦涩的科学概念，还是展开一场激发创造性的头脑风暴，Gemini 3 Pro都能做到。

　　Gemini 3可以编写托卡马克装置中等离子体流动的可视化代码，并写一首捕捉聚变物理学精髓的诗

　　在Google AI Studio上，Gemini 3 Pro的API定价如下——

　　Gemini 3 Deep Think

　　智能新高峰

　　这一次，Gemini 3 Deep Think正式开启「深度思考」新纪元，让智能的边界再次拓展。

　　它在Gemini 3推理和多模态理解能力的基础上，实现了质的飞跃，更能攻克复杂问题。

　　多项基准测试中，Gemini 3 Deep Think表现超越Gemini 3 Pro：

　　在HLE和GPQA Diamond上，分别拿下了41%（不使用工具）和93.8%的优异成绩。

　　而且，更在ARC-AGI-2（带代码执行，ARC Prize Verified）中创下45.1%历史新高，一展应对未知与新颖问题的强大能力。

　　Gemini 3 Deep Think在一些最具挑战性的AI基准测试中表现出色

　　重塑世界，新时代开启

　　可以说，Gemini 3正式开启了新一轮的全模态革命！

　　百万token，全模态爆发

　　从诞生之初，Gemini就为「跨多模态」而生，包括文本、图像、视频、音频、代码，能在各种信息形态中，自由穿梭。

　　Gemini 3更是实现了破级进阶，整合最先进的推理、视觉和空间理解、领先的多语言性能，以及100万token上下文。

　　它能够帮助人们，以最适合自己的方式进行学习。

　　假设你想学习家族传统的烹饪方法，Gemini 3可以破译并将不同语言的手写食谱，翻译成一本可共享的家庭食谱。

　　或是想要学习一个新主题，直接扔给它学术论文、长视频讲座或教程，Gemini 3自动生成交互式抽认卡、可视化效果或其他格式的代码。

　　它甚至可以分析匹克球比赛视频，找出可以改进的地方，并生成针对性的训练计划以全面提升表现。

　　不仅如此，在搜索中的AI模式（AI Mode），现可用Gemini 3实现新的生成式UI体验。

　　包括沉浸式视觉布局，以及交互式工具和模拟，所有这些都是根据查询完全即时生成。

　　在搜索中的AI模式下，可通过生成式UI学习像RNA聚合酶如何工作这样的复杂主题

　　氛围编程，纯靠嘴

　　在2.5 Pro成功的基础上，Gemini 3兑现了——为开发者将任何想法变为现实的承诺。

　　它在零样本学习（zero-shot）生成方面表现出色，并能处理复杂的提示词和指令，以渲染更丰富、更具交互性的 Web UI。

　　如前所述，Gemini 3是谷歌迄今为止打造的最优秀的「氛围编程」和智能体编码模型。

　　在WebDev Arena排行榜上，Gemini 3以1487 Elo高分强势登顶。

　　它在Terminal-Bench 2.0上也获得了54.2%高分，该测试衡量模型通过终端操作计算机的工具使用能力；

　　并且在衡量编码智能体SWE-bench Verified测试上，以76.2%成绩远超2.5 Pro。

　　接下来一波演示中，便可见识Gemini 3真正实力。

　　编写一个复古3D太空飞船游戏，要有丰富的视觉效果，以及更强的交互性——没问题。

　　借助着色器，构建一个可玩的科幻世界——so easy。

　　打造一个更丰富、更具交互性的Web UI和应用程序——还是轻松搞定！

　　前端不再需要人类，是真的...

　　目前，全球开发者可在GoogleAIStudio、Vertex AI、GeminiCLI，以及全新智能体开发平台Google Antigravity中使用Gemini 3进行构建。

　　它也接入了多个第三方平台，包括Cursor、GitHub、JetBrains、Manus、Replit等。

　　长程规划，人类手替

　　自谷歌通过Gemini 2开启智能体时代以来，一直在不断进化。

　　他们不仅提升了Gemini的编码智能体能力，还提高了其在更长时间范围内可靠规划未来的能力。

　　而这一切，刚刚在Vending-Bench 2排行榜上得到实力认证——

　　Gemini 3以绝对优势登顶。

　　而这个测试，通过模拟运营一个自动售货机业务，深度考验AI在复杂场景下的长程规划能力。

　　令人欣喜的是，在整个模拟运营年度中，Gemini 3 Pro通过保持一致的工具使用和决策，在不偏离任务的情况下，实现了更高的回报。

　　与其他前沿模型相比，Gemini 3 Pro展示了更好的长程规划能力，从而产生显著更高的回报

　　这意味着， Gemini 3能在日常生活中更好地帮人类完成任务。

　　它把更深度的推理与改进、更一致的工具使用相结合，通过从头到尾处理更复杂、多步骤的工作流来代表人采取行动。

　　就比如，帮你预定本地服务，或是整理收件箱。而人类，全程只需把控方向，下达指令。

　　今天起，Google AI Ultra订阅用户可在Gemini应用中，通过Gemini Agent抢先体验智能体能力。

　　「谷歌反重力」

　　革命性智能体开发平台

　　Gemini 3的问世，谷歌在智能体能力上已开始迈入一个新的阶段：

　　模型能够在多个平台上长时间运行，且无需人工干预。

　　虽尚未达到「完全无人干预+连续运行数天」的程度，但谷歌正日益接近这样一个世界——

　　不再通过单个提示词或工具调用，而是在更高的抽象层面上与智能体进行交互。

　　因此，谷歌智能体开发平台Google Antigravity正式上线，一个让开发者以「任务」为维度与智能体协同的全新平台。

　　借助Gemini 3高级推理、工具使用和智能体编码能力，Google Antigravity将AI辅助从开发者工具包中的一种工具，升级为全程参与的主动协作者。

　　在熟悉的AI IDE体验基础上，Google Antigravity为智能体开辟一个专用界面，可直接访问编辑器、终端和浏览器。

　　现在，智能体可以代表你自主规划并同时执行复杂的端到端软件任务，同时验证其生成的代码。

　　如下案例中，在Google Antigravity上，用Gemini 3驱动飞行跟踪应用程序的「端到端智能体工作流」。

　　该智能体独立规划、编写应用程序代码，并通过基于浏览器的计算机操作验证其执行。

　　除了Gemini 3 Pro，Google Antigravity还与Gemini 2.5 计算机使用模型，以及图像编辑模型Nano Banana（Gemini 2.5 Image）紧密集成。

　　网友玩疯了

　　现在，Gemini 3承包了全网热点，一系列惊艳实测demo全部放出了。

　　Google AI Studio负责人Logan进行了弹跳球测试，并且难度提升了10倍。

　　结果，Gemini 3 Pro一次就完美搞定！（并非N选一，真的是第一个提示词就生成了）

　　曾在Anthropic担任AI工程师的MagicPath创始人Pietro Schirano，首先让Gemini 3 Pro创建了一个3D乐高编辑器。

　　没想到，它仅凭一次生成就完美实现了用户界面、复杂的空间逻辑以及所有功能。

　　同时，Gemini 3 Pro在游戏开发方面的表现也令人惊叹。

　　仅仅通过一个文本提示词，它就重现了经典的iOS游戏《荒谬钓鱼》（Ridiculous Fishing），甚至包括了音效和背景音乐。

　　此外，它还完成了一项之前大模型几乎都做不到的任务——构建一个功能完备的Game Boy模拟器。

　　而且没错，它甚至直接用SVG绘制出了Game Boy的外观。

　　最值得一提的是，Gemini 3竟完全在谷歌TPU上完成训练。这就是谷歌的护城河。

　　参考资料：

　　https://blog.google/products/gemini/gemini-3/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Gemini 3.5 Pro继续跳票，谷歌端上三款Flash模型强行交作业

机器之心Pro 2026-07-22 19:59:18
0 跟贴 0
Robot Phone，荣耀给出了AI手机的新模式？

钛媒体APP 2026-07-21 12:27:11
2 跟贴 2

暑假购机推荐：nova 16系列39天达成百万销量，消费者真香之选

雷科技 2026-07-22 11:25:29
4 跟贴 4

AI战争（美国篇）

虎嗅APP 2026-07-20 06:04:06
3 跟贴 3
谷歌「史上最差」AI模型发布！ Gemini 3.5 Pro延期

新智元 2026-07-22 08:14:35
0 跟贴 0

Gemini三箭齐发！实测让人失望，但谷歌AI未来可期？

雷科技 2026-07-22 19:15:41
0 跟贴 0

美股盘前要闻一览：Anthropic拟采购最多2吉瓦的AMD最新一代芯片；苹果iPhone18系列已量产；谷歌、特斯拉等Q2财报盘后来袭

财联社 2026-07-22 20:59:06
0 跟贴 0
机器之心逛谷歌，分享最热的Self-Improving

机器之心Pro 2026-06-16 12:45:36
0 跟贴 0

玩家设“假Boss”钓鱼谷歌AI，Gemini已悄悄上钩，社区直呼游戏圈首例

山月不知2 2026-07-22 19:15:31
0 跟贴 0
谷歌财报前瞻：模型能力再次成为关注焦点

财联社 2026-07-22 18:23:14
0 跟贴 0
「美股盘前」谷歌、特斯拉财报明早公布；存储芯片、光通信股下跌，SK海力士跌超5%；苹果iPhone 18系列据悉已进入量产阶段；超微电脑涨超15%，季度新增订单超过600亿美元

每日经济新闻 2026-07-22 18:43:19
0 跟贴 0
Claude design限速，谷歌开源轻松做动态网页，实力打脸？

机器之心Pro 2026-04-29 17:20:04
0 跟贴 0
100多万人围观！没头没腿，神似充电宝的机器人全网走红？

机器之心Pro 2026-06-17 18:52:08
0 跟贴 0
他做出爆火的谷歌CLI工具转头却被开除了

量子位 2026-06-28 18:42:01
0 跟贴 0
平民三巨头平替Fable 5！性能追平，成本砍半

量子位 2026-06-21 09:58:58
0 跟贴 0
68万年终奖变成6千，我没闹，准时上下班，不维护公司程序半月后

巨海克 2026-07-22 06:54:31
0 跟贴 0
还得多打一拳，这钱你得挣出来，逻辑满分

罐罐追影 2026-07-21 10:37:39
1 跟贴 1
高速口看到奥特曼打怪兽拍摄者：我也没喝啊

薪火视点 2026-07-20 10:51:35
71 跟贴 71
板块模型11

小明不讲理 2026-07-21 01:52:58
1 跟贴 1
杭州路边出现“胶囊小吃车”，需2万押金+每月1200多元租金，自带油烟机和空调，有夫妻摆摊4天每天近1000元流水

极目新闻 2026-07-22 10:40:59
6894 跟贴 6894
罗马尼亚国家地籍局遭网络攻击，黑客论坛挂牌出售数据

硅屿手记 2026-07-21 15:16:01
0 跟贴 0
罗马尼亚土地与房产管理机构遭遇网络攻击，服务被迫中断

IT之家 2026-07-21 15:17:39
0 跟贴 0
好多新功能啊！特斯拉发布 2026 夏季大更新

XCiOS俱乐部 2026-07-22 08:28:11
223 跟贴 223
两名男孩坐在电视机前看奥特曼，迪迦出来那一刻立刻模仿

重庆城市TV 2026-07-21 15:20:49
0 跟贴 0
今年上半年就业形势保持总体平稳

央视新闻客户端 2026-07-22 10:04:00
7214 跟贴 7214
雍正王朝，老八巅峰时刻，大阿哥的传位逻辑很荒唐

若一说剧 2026-07-21 19:16:05
14 跟贴 14
华为天才少年创业，全球首个虚实融合的实时交互视频模型来了

机器之心Pro 2026-02-09 10:21:10
0 跟贴 0
男子用天然的石头，拼了一个奥特曼摆件，网友：这个艺术成分很高啊

都市观察 2026-07-21 10:03:06
0 跟贴 0
老百姓奥特曼的现状，辛酸和无助时刻伴随着提欧

听风剪影 2026-07-21 12:16:47
3 跟贴 3
国外课堂可视化教学，让生活在城市里的孩子知道，什么叫土壤保水！

坚持搞笑 2026-07-19 10:35:03
1 跟贴 1
怪兽父母家里进鬼了都不知道，你骑了个什么玩意回来

笨狗旺财历险记 2026-07-21 19:52:54
0 跟贴 0
巴拿马表示中巴已就海运协定续签达成共识外交部回应

环球网资讯 2026-07-21 16:17:03
1424 跟贴 1424
开始以为是有动物，挖开了地板，奥特曼又可以演一集了！

二货逗笑排行榜 2026-07-22 11:36:08
1 跟贴 1
别只知道玛伽大蛇，深度解析欧布几大元素魔王兽

听风剪影 2026-07-22 13:52:59
1 跟贴 1
奥特曼和达里奥的十年恩怨，如何走到全面开战？

量子位 2026-04-06 05:39:19
0 跟贴 0
奥特大力士比赛推石头

子桑鹰脉 2026-07-21 03:52:23
0 跟贴 0
日本IP“冰火两重天”：高达、海贼王持续走高，奥特曼等面临困境，新作难当大任

三文娱 2026-07-22 18:54:28
0 跟贴 0
新创华携九大IP亮相2026LEC授权展，面包超人获奖

雷报pro 2026-07-22 09:46:32
0 跟贴 0
飞机上一儿童私自打开客舱充气救生衣，南航客服回应：确有该情况，乘务长和安全员发现后立即介入，已对设备进行更换，未影响飞行安全

大风新闻 2026-07-21 21:46:02
756 跟贴 756
哈尔滨市城区供热起止时间拟调整｜征求意见中——

哈尔滨新闻网 2026-07-22 13:29:58
90 跟贴 90

黄渤不甘2亿亏损，集结17星力战周星驰新片

黄渤不甘2亿亏损，集结17星力战周星驰新片

孤傲何妨初

2026-07-22 05:38:58

屠宰工说漏嘴：猪肉不香，因为猪活着时胃就烂了

屠宰工说漏嘴：猪肉不香，因为猪活着时胃就烂了

三农雷哥

2026-07-22 17:45:35

跳水反弹再跳水，韩国股市跌到熔断，暂停韩国综合指数程序化卖单交易！三星电子、SK海力士双双跌超4%！

跳水反弹再跳水，韩国股市跌到熔断，暂停韩国综合指数程序化卖单交易！三星电子、SK海力士双双跌超4%！

每日经济新闻

2026-07-22 11:41:49

剧情反转！帕金斯爆料：詹姆斯原本已有决定，关键时刻临时改主意

剧情反转！帕金斯爆料：詹姆斯原本已有决定，关键时刻临时改主意

夜白侃球

2026-07-22 12:35:44

见过世面的人终会领悟：性格越善良的人，被人做局后越容易废在报复上；能让对方畏惧你的，从不是以牙还牙，而是这两种别人学不来的能力

见过世面的人终会领悟：性格越善良的人，被人做局后越容易废在报复上；能让对方畏惧你的，从不是以牙还牙，而是这两种别人学不来的能力

心理观察局

2026-07-22 07:01:07

日本司法大臣抵达基辅，向乌军阵亡者献花，东京继续支持乌克兰

日本司法大臣抵达基辅，向乌军阵亡者献花，东京继续支持乌克兰

桂系007

2026-07-21 18:26:04

六名中国选手全部摘金，中国队团体总分第一！

六名中国选手全部摘金，中国队团体总分第一！

政知新媒体

2026-07-21 23:16:02

耐克将清退中国数千在线经销商，滔搏股价暴跌20%

耐克将清退中国数千在线经销商，滔搏股价暴跌20%

懂球帝

2026-07-22 13:09:29

刚刚宣布！中国公民免签再延长至2027年底！澳洲也出手，全体注意...

刚刚宣布！中国公民免签再延长至2027年底！澳洲也出手，全体注意...

澳洲红领巾

2026-07-22 15:16:37

中美俄意见一致，宁可让日本从地球上消失，也坚决不允许它拥核！

中美俄意见一致，宁可让日本从地球上消失，也坚决不允许它拥核！

兵鉴史

2026-07-21 18:43:52

历史上“最懒”的诗人：一生就写了一首诗，只有两句，人人都会背

历史上“最懒”的诗人：一生就写了一首诗，只有两句，人人都会背

凉州辞

2026-07-21 11:40:03

我一直在等你：那不是等待，是我在时间中为你预留的一段未完成

我一直在等你：那不是等待，是我在时间中为你预留的一段未完成

疾跑的小蜗牛

2026-07-22 21:00:57

白色版小米澎程N90实车沙漠路测照曝光这颜值如何？

白色版小米澎程N90实车沙漠路测照曝光这颜值如何？

CNMO科技

2026-07-22 15:51:07

马斯克说，比亚迪车很烂！王传福说，比亚迪分分钟造出特斯拉！

马斯克说，比亚迪车很烂！王传福说，比亚迪分分钟造出特斯拉！

混沌录

2026-07-20 19:23:06

29国签约，新组织落户中国！日本另起炉灶，特朗普最怕的事来了

29国签约，新组织落户中国！日本另起炉灶，特朗普最怕的事来了

芳芳历史烩

2026-07-22 14:11:01

太阳报：2034沙特世界杯可能因天气推迟至2035年

太阳报：2034沙特世界杯可能因天气推迟至2035年

懂球帝

2026-07-21 23:05:34

知名女主播意外走G！泳池跳水严重翻车！多个直播间集体被封！众水友黑屏吃瓜直呼慷慨！

知名女主播意外走G！泳池跳水严重翻车！多个直播间集体被封！众水友黑屏吃瓜直呼慷慨！

新浪财经

2026-07-22 12:37:56

日媒宣称：中国若再进行导弹试射，日本或讨论突破“核门槛”

日媒宣称：中国若再进行导弹试射，日本或讨论突破“核门槛”

快乐彼岸

2026-07-22 20:59:18

落魄时大伯资助了我20万，五年后我装穷回来，大伯竟这样对我

落魄时大伯资助了我20万，五年后我装穷回来，大伯竟这样对我

千秋文化

2026-07-18 18:54:47

留洋失败，回国封神：20岁杜月徵用562分钟4球，揭穿中国足球谎言

留洋失败，回国封神：20岁杜月徵用562分钟4球，揭穿中国足球谎言

落夜足球

2026-07-22 14:04:26

AI产业主平台领航智能+时代

15758文章数 66965关注度

往期回顾全部

数码要闻

终于看到降价希望了！机构预测NAND闪存供应2027下半年改善

头条要闻

女生高考后和妈妈"扛砖赚学费"被质疑摆拍当事人发声

头条要闻

女生高考后和妈妈"扛砖赚学费"被质疑摆拍当事人发声

体育要闻

阿根廷的亚军：单核足球的极限？

娱乐要闻

47岁汤唯宣布二胎产子大女儿10岁

财经要闻

宜家出售八城"蓝盒子" 30年大店逻辑生变

科技要闻

马斯克看笑了：谷歌什么都有偏偏没最强AI

汽车要闻

上汽贾健旭谈汽车全球化：出海要合规欧洲人只爱小车是误解

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

时尚

本地

数码

教育

家居要闻

2026建博会(广州) 公装联探展交流活动

赫本小白裙，简单纯粹！

本地新闻

杭州诗意路名，自带氛围感

数码要闻

全本土BOM：佰维推出宽温大容量2.5" SATA固态硬盘TGS601

教育要闻

EC=4cm，求阴影部分的面积

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版