网易首页 > 网易号 > 正文 申请入驻

谷歌深夜炸场:Gemini 3正式发布!自ChatGPT发布以来最激动人心的事件

0
分享至


刚刚,谷歌Gemini 3正式发布,我的初步体验和第一感觉是这玩意完全超越GPT-5 和 Claude sonnet 4.5,强到离谱,编程和写作都达到了T0级别,可以说这是自从OpenAI 发布ChatGPT以来,最令我心跳不已的事件,现在就可以在Gemini App和 Google AI Studio中使用了

随手测试:直接看效果(更详细的测试随后几天奉上)

1.制作速度可调的电风扇svg


2.模拟弹力球从空中一层一层掉落并弹起的物理过程(目前我测过的只有Claude sonnet 4.5可以抽卡成功)


3.模拟核聚变过程并添加背景乐(这个是复现谷歌官方的)

官方的发布核心信息要点:

谷歌官方把Gemini 3定义为“通往AGI之路的又一大步”。它不仅在多模态理解上全球领先,更是谷歌迄今为止最强大的Agent(智能体)和“Vibe Coding”模型。

此次发布包含两个核心版本:Gemini 3 Pro(即日预览上线)以及增强推理模式的Gemini 3 Deep Think

与此同时,谷歌宣布Gemini 3即刻全面接入谷歌生态——从Search(搜索)到AI Studio,再到全新的Agent开发平台Google Antigravity

一起来看Gemini 3到底有多强。

数据屠榜:LMArena突破1501分

Gemini 3 Pro主打深度推理和多模态能力,在每一项主流AI基准测试中都大幅超越了Gemini 2.5 Pro


推理与数学:

LMArena Leaderboard:以1501 Elo的突破性得分登顶。

Humanity’s Last Exam(人类最后一次考试):在不使用工具的情况下得分为37.5%,展现出博士级推理能力

GPQA Diamond:得分91.9%

MathArena Apex:达到23.4%,确立了前沿模型在数学领域的SOTA(State-of-the-art)新标准

多模态与事实性:

MMMU-Pro:81%。
Video-MMMU:87.6%,重新定义多模态推理。
SimpleQA Verified:72.1%(SOTA),在事实准确性上取得重大进展。

官方强调,Gemini 3 Pro不再是简单的问答,而是能够理解语境和意图,“不仅能读懂文字和图像,更能读懂空气(reading the room)”。它可以摒弃陈词滥调,提供真知灼见,甚至能通过生成代码将晦涩的科学概念转化为高保真的可视化效果

Deep Think模式:推理能力的阶跃

除了Pro版本,谷歌还祭出了大杀器——Gemini 3 Deep Think

这是一种增强推理模式,旨在解决最复杂的难题。测试数据显示,其性能进一步超越了本就强悍的Pro版本:


Humanity’s Last Exam:41.0%(无工具)

GPQA Diamond:93.8%

ARC-AGI-2:取得了前所未有的45.1%(含代码执行,ARC Prize Verified),证明了其解决新颖挑战的能力。

Deep Think模式将在未来几周内向Google AI Ultra订阅用户开放。

Google Antigravity:重塑开发者体验

随着Gemini 3的发布,谷歌推出了全新的Agent开发平台——Google Antigravity

这不只是一个AI IDE,它将Agent提升到了核心地位

自主权:Agent拥有对编辑器、终端和浏览器的直接访问权限

能力:利用Gemini 3的推理和工具使用能力,Agent可以自主规划并执行复杂的端到端软件任务,同时自我验证代码

模型组合:该平台不仅集成了Gemini 3 Pro,还紧密耦合了最新的Gemini 2.5 Computer Use模型(用于浏览器控制)和顶级图像编辑模型Nano Banana(Gemini 2.5 Image)。

在编码能力基准测试中,Gemini 3同样表现出色:

WebDev Arena:1487 Elo,位居榜首。

SWE-bench Verified:76.2%,大幅超越2.5 Pro,这一项没有超越Claude sonnet 4.5

Terminal-Bench 2.0:54.2%,展示了通过终端操作计算机的能力。

全能助手:从学习到规划

Gemini 3不仅面向开发者,更旨在帮助普通用户“学习、构建和规划一切”。

学习(Learn):

利用100万token的上下文窗口,它可以综合处理文本、图像、视频、音频和代码

示例: 它可以解读不同语言的手写食谱并整理成家庭烹饪书;通过分析匹克球(Pickleball)比赛视频,生成针对性的训练计划。

搜索进化: 在Search的AI模式中,Gemini 3支持生成式UI体验,能根据查询即时生成交互式工具和沉浸式视觉布局

规划(Plan):

Gemini 3在长时程规划上取得了长足进步

Vending-Bench 2测试: 该测试要求管理模拟自动售货机业务。Gemini 3 Pro在全年的模拟运营中保持了一致的决策力,未偏离任务,并带来了更高的回报,位居榜首

这由意味着它能更好地处理预订服务、整理收件箱等现实生活中的多步骤工作流

谷歌宣布,这是首次在发布首日就将新一代Gemini模型引入搜索(Search)。

具体推出计划如下:

普通用户:Gemini App及Search中的AI模式(针对Google AI Pro和Ultra订阅用户)即日起可用

开发者:通过Google AI Studio、Google Antigravity、Gemini CLI及Vertex AI访问

企业用户: 通过Vertex AI和Gemini Enterprise访问。

Deep Think模式:需等待安全评估,预计数周后向Ultra订阅用户开放。

劈柴哥表示,过去两年,AI Overviews月活已达20亿,Gemini App月活超6.5亿。Gemini 3的发布,标志着谷歌以“全栈式AI”策略,正式将Gemini部署到了谷歌的每一个角落

参考:

https://blog.google/products/gemini/gemini-3/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=-development

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太无耻!男子陈某被捕,10天找了5个美女:无非就是想白嫖

太无耻!男子陈某被捕,10天找了5个美女:无非就是想白嫖

潇湘晨报
2025-11-19 09:20:30
不好,开始还钱了!!

不好,开始还钱了!!

TopView
2025-11-18 11:32:38
刘强东三亚敬酒爆火:豪气干一壶酒,这才是大佬最真实的江湖气!

刘强东三亚敬酒爆火:豪气干一壶酒,这才是大佬最真实的江湖气!

商悟社
2025-11-18 14:32:26
靠农业农村部来解决农民规模性返乡返贫?让城市民营经济重焕活力才是唯一解决之道

靠农业农村部来解决农民规模性返乡返贫?让城市民营经济重焕活力才是唯一解决之道

虎说八道1
2025-11-19 07:04:50
10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

可达鸭面面观
2025-11-19 08:59:19
嘻哈天王被太妹绿了!

嘻哈天王被太妹绿了!

八卦疯叔
2025-11-19 09:30:03
特朗普:美国当年“愚蠢地”放手,导致台湾现在生产了几乎100%的芯片,太丢脸了

特朗普:美国当年“愚蠢地”放手,导致台湾现在生产了几乎100%的芯片,太丢脸了

极目新闻
2025-11-18 22:18:48
深圳一模特大赛冠军因突破大众审美认知引发争议,有评委发文称“连评分表都没看到”,一联合主办单位回应只赞助了几千块

深圳一模特大赛冠军因突破大众审美认知引发争议,有评委发文称“连评分表都没看到”,一联合主办单位回应只赞助了几千块

极目新闻
2025-11-19 10:38:42
《哈佛深红》丨前哈佛大学校长萨默斯追求中国女性时,爱泼斯坦是他的“僚机”

《哈佛深红》丨前哈佛大学校长萨默斯追求中国女性时,爱泼斯坦是他的“僚机”

邸报
2025-11-18 10:03:34
中方代表:日本毫无资格要求成为安理会常任理事国

中方代表:日本毫无资格要求成为安理会常任理事国

国际在线
2025-11-19 07:07:07
【扫“苗”】插裤兜,非常罕见的送别动作!日方接受吗?

【扫“苗”】插裤兜,非常罕见的送别动作!日方接受吗?

新民周刊
2025-11-19 09:26:23
台湾名师区桂芝大声质问和痛斥国民党“反共”、丧失“中国”党魂

台湾名师区桂芝大声质问和痛斥国民党“反共”、丧失“中国”党魂

文史旺旺旺
2025-11-18 19:36:13
汪峰没想到,女友森林北一张体检结果,让53岁的他里子面子都没了

汪峰没想到,女友森林北一张体检结果,让53岁的他里子面子都没了

冷紫葉
2025-11-18 22:35:54
15号模特广东冠军后续:一身赘肉是何来头?最新回应:会给交代!

15号模特广东冠军后续:一身赘肉是何来头?最新回应:会给交代!

阿纂看事
2025-11-19 09:07:36
打脸!本赛季表现远超预期5大球员:湖人独占两席,基迪比肩乔丹

打脸!本赛季表现远超预期5大球员:湖人独占两席,基迪比肩乔丹

兵哥篮球故事
2025-11-19 11:55:54
几十万香港人到广东买社保医保!参保人:月交898元,退休后领4年就能回本;公立医疗排队动辄两三年,自费比内地贵几倍

几十万香港人到广东买社保医保!参保人:月交898元,退休后领4年就能回本;公立医疗排队动辄两三年,自费比内地贵几倍

每日经济新闻
2025-11-18 23:38:06
16名台湾游客点披萨被骂“狗屎中国人”!市政府“灭火”

16名台湾游客点披萨被骂“狗屎中国人”!市政府“灭火”

意烩
2025-11-18 01:35:04
世界太魔幻,高中学历骗子成我国大学首席科学家,学术圈怎么了?

世界太魔幻,高中学历骗子成我国大学首席科学家,学术圈怎么了?

李将平老师
2025-11-18 20:28:43
意大利哭晕 世界杯附加赛死亡签表浮现 首轮或遇2苦主+决赛碰波兰

意大利哭晕 世界杯附加赛死亡签表浮现 首轮或遇2苦主+决赛碰波兰

我爱英超
2025-11-19 07:14:36
半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单

半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单

潇湘晨报
2025-11-18 23:47:14
2025-11-19 12:11:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
976文章数 373关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

女子参加模特大赛夺"广东冠军" 因突破大众审美引争议

头条要闻

女子参加模特大赛夺"广东冠军" 因突破大众审美引争议

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

脱胎换骨的优秀底盘Get 新款享界S9动态驾驶体验

态度原创

健康
教育
旅游
房产
数码

警惕超声报告这六大"坑"

教育要闻

家里欠债百万,学霸用刷题方法写网文还清债务?这才是降维打击!

旅游要闻

嘿重庆丨一踏上这条悬空栈桥,要出片的心马上稳了

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

数码要闻

Keychron发布三款Q HE 8K键盘新品:结合TMR与8000Hz回报

无障碍浏览 进入关怀版