网易首页 > 网易号 > 正文 申请入驻

谷歌深夜炸场:Gemini 3正式发布!自ChatGPT发布以来最激动人心的事件

0
分享至


刚刚,谷歌Gemini 3正式发布,我的初步体验和第一感觉是这玩意完全超越GPT-5 和 Claude sonnet 4.5,强到离谱,编程和写作都达到了T0级别,可以说这是自从OpenAI 发布ChatGPT以来,最令我心跳不已的事件,现在就可以在Gemini App和 Google AI Studio中使用了

随手测试:直接看效果(更详细的测试随后几天奉上)

1.制作速度可调的电风扇svg


2.模拟弹力球从空中一层一层掉落并弹起的物理过程(目前我测过的只有Claude sonnet 4.5可以抽卡成功)


3.模拟核聚变过程并添加背景乐(这个是复现谷歌官方的)

官方的发布核心信息要点:

谷歌官方把Gemini 3定义为“通往AGI之路的又一大步”。它不仅在多模态理解上全球领先,更是谷歌迄今为止最强大的Agent(智能体)和“Vibe Coding”模型。

此次发布包含两个核心版本:Gemini 3 Pro(即日预览上线)以及增强推理模式的Gemini 3 Deep Think

与此同时,谷歌宣布Gemini 3即刻全面接入谷歌生态——从Search(搜索)到AI Studio,再到全新的Agent开发平台Google Antigravity

一起来看Gemini 3到底有多强。

数据屠榜:LMArena突破1501分

Gemini 3 Pro主打深度推理和多模态能力,在每一项主流AI基准测试中都大幅超越了Gemini 2.5 Pro


推理与数学:

LMArena Leaderboard:以1501 Elo的突破性得分登顶。

Humanity’s Last Exam(人类最后一次考试):在不使用工具的情况下得分为37.5%,展现出博士级推理能力

GPQA Diamond:得分91.9%

MathArena Apex:达到23.4%,确立了前沿模型在数学领域的SOTA(State-of-the-art)新标准

多模态与事实性:

MMMU-Pro:81%。
Video-MMMU:87.6%,重新定义多模态推理。
SimpleQA Verified:72.1%(SOTA),在事实准确性上取得重大进展。

官方强调,Gemini 3 Pro不再是简单的问答,而是能够理解语境和意图,“不仅能读懂文字和图像,更能读懂空气(reading the room)”。它可以摒弃陈词滥调,提供真知灼见,甚至能通过生成代码将晦涩的科学概念转化为高保真的可视化效果

Deep Think模式:推理能力的阶跃

除了Pro版本,谷歌还祭出了大杀器——Gemini 3 Deep Think

这是一种增强推理模式,旨在解决最复杂的难题。测试数据显示,其性能进一步超越了本就强悍的Pro版本:


Humanity’s Last Exam:41.0%(无工具)

GPQA Diamond:93.8%

ARC-AGI-2:取得了前所未有的45.1%(含代码执行,ARC Prize Verified),证明了其解决新颖挑战的能力。

Deep Think模式将在未来几周内向Google AI Ultra订阅用户开放。

Google Antigravity:重塑开发者体验

随着Gemini 3的发布,谷歌推出了全新的Agent开发平台——Google Antigravity

这不只是一个AI IDE,它将Agent提升到了核心地位

自主权:Agent拥有对编辑器、终端和浏览器的直接访问权限

能力:利用Gemini 3的推理和工具使用能力,Agent可以自主规划并执行复杂的端到端软件任务,同时自我验证代码

模型组合:该平台不仅集成了Gemini 3 Pro,还紧密耦合了最新的Gemini 2.5 Computer Use模型(用于浏览器控制)和顶级图像编辑模型Nano Banana(Gemini 2.5 Image)。

在编码能力基准测试中,Gemini 3同样表现出色:

WebDev Arena:1487 Elo,位居榜首。

SWE-bench Verified:76.2%,大幅超越2.5 Pro,这一项没有超越Claude sonnet 4.5

Terminal-Bench 2.0:54.2%,展示了通过终端操作计算机的能力。

全能助手:从学习到规划

Gemini 3不仅面向开发者,更旨在帮助普通用户“学习、构建和规划一切”。

学习(Learn):

利用100万token的上下文窗口,它可以综合处理文本、图像、视频、音频和代码

示例: 它可以解读不同语言的手写食谱并整理成家庭烹饪书;通过分析匹克球(Pickleball)比赛视频,生成针对性的训练计划。

搜索进化: 在Search的AI模式中,Gemini 3支持生成式UI体验,能根据查询即时生成交互式工具和沉浸式视觉布局

规划(Plan):

Gemini 3在长时程规划上取得了长足进步

Vending-Bench 2测试: 该测试要求管理模拟自动售货机业务。Gemini 3 Pro在全年的模拟运营中保持了一致的决策力,未偏离任务,并带来了更高的回报,位居榜首

这由意味着它能更好地处理预订服务、整理收件箱等现实生活中的多步骤工作流

谷歌宣布,这是首次在发布首日就将新一代Gemini模型引入搜索(Search)。

具体推出计划如下:

普通用户:Gemini App及Search中的AI模式(针对Google AI Pro和Ultra订阅用户)即日起可用

开发者:通过Google AI Studio、Google Antigravity、Gemini CLI及Vertex AI访问

企业用户: 通过Vertex AI和Gemini Enterprise访问。

Deep Think模式:需等待安全评估,预计数周后向Ultra订阅用户开放。

劈柴哥表示,过去两年,AI Overviews月活已达20亿,Gemini App月活超6.5亿。Gemini 3的发布,标志着谷歌以“全栈式AI”策略,正式将Gemini部署到了谷歌的每一个角落

参考:

https://blog.google/products/gemini/gemini-3/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=-development

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
祁连山舰换装燎原-1,中国两栖作战开启激光防御新模式!

祁连山舰换装燎原-1,中国两栖作战开启激光防御新模式!

杨风
2025-11-17 22:08:47
苹果:iOS26.1更新后必关10个设置,关闭后省电25%+流畅度翻倍。

苹果:iOS26.1更新后必关10个设置,关闭后省电25%+流畅度翻倍。

小柱解说游戏
2025-11-18 11:28:19
太及时了!防止规模性返乡滞乡,农民工的工作“出口”是关键

太及时了!防止规模性返乡滞乡,农民工的工作“出口”是关键

火山诗话
2025-11-18 09:14:18
女性“高潮”的秘密:别再假装了,教你的伴侣如何带你到达巅峰

女性“高潮”的秘密:别再假装了,教你的伴侣如何带你到达巅峰

精彩分享快乐
2025-11-12 00:05:03
三人在车内使用无人机、箭矢等非法狩猎野猪,黑龙江警方:已采取刑事强制措施

三人在车内使用无人机、箭矢等非法狩猎野猪,黑龙江警方:已采取刑事强制措施

三湘都市报
2025-11-18 11:18:43
伦敦金属交易所正式将人民币剔除出其商品结算范围。

伦敦金属交易所正式将人民币剔除出其商品结算范围。

流苏晚晴
2025-11-18 20:15:51
梅根·马克尔婚后遭菲利普亲王严厉指责,内幕曝光震惊王室

梅根·马克尔婚后遭菲利普亲王严厉指责,内幕曝光震惊王室

智慧生活笔记
2025-11-19 03:08:57
亚洲杯预选赛:0-1,人口第一大国队遭世界第183掀翻,5轮0胜垫底

亚洲杯预选赛:0-1,人口第一大国队遭世界第183掀翻,5轮0胜垫底

侧身凌空斩
2025-11-18 23:59:03
科创信息被立案调查,受损股民可要求赔偿

科创信息被立案调查,受损股民可要求赔偿

深蓝财经
2025-11-18 08:44:00
狗咬人命案中申倩才是高手,她一个决定让9人闯宅者追悔莫及,讽刺

狗咬人命案中申倩才是高手,她一个决定让9人闯宅者追悔莫及,讽刺

七月生活情感驿站
2025-11-17 14:09:02
徐波生了300个孩子?揭露了人类社会的本质问题

徐波生了300个孩子?揭露了人类社会的本质问题

历史总在押韵
2025-11-17 00:05:07
章泽天携8岁女儿亮相伦敦!“京东长公主”真容曝光后全网都炸了

章泽天携8岁女儿亮相伦敦!“京东长公主”真容曝光后全网都炸了

萌姐
2025-11-17 19:15:11
11.11元秒杀到小米冰箱却无法发货?官方回应:系统配置错误,补偿30元

11.11元秒杀到小米冰箱却无法发货?官方回应:系统配置错误,补偿30元

扬子晚报
2025-11-18 07:17:13
“取消双休”登上热搜!行内人警告:公务员不是焦点,你在劫难逃

“取消双休”登上热搜!行内人警告:公务员不是焦点,你在劫难逃

行走的知识库
2025-11-18 09:15:22
8800万镑砸向皇马!曼城瞄准20岁新星,瓜帅钦点德布劳内接班人

8800万镑砸向皇马!曼城瞄准20岁新星,瓜帅钦点德布劳内接班人

夜白侃球
2025-11-18 10:31:35
篮下威慑力相当惊人!活塞内线新星的表现让人想到曾经的霍华德?

篮下威慑力相当惊人!活塞内线新星的表现让人想到曾经的霍华德?

稻谷与小麦
2025-11-19 01:05:49
女足莱曼分享家中被盗后一片狼藉:下次请顺便帮我打扫一下

女足莱曼分享家中被盗后一片狼藉:下次请顺便帮我打扫一下

懂球帝
2025-11-19 00:46:50
薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

薄一波晚年反省,当年不该支持此人上台,他给国家带来大麻烦

扬平说史
2025-11-06 20:22:42
中方已经没有退路!美军为中美选好了主战场,开始准备大规模冲突

中方已经没有退路!美军为中美选好了主战场,开始准备大规模冲突

优趣纪史记
2025-11-19 00:56:12
亚朵大战全季,传统五星级酒店输麻了

亚朵大战全季,传统五星级酒店输麻了

IC实验室
2025-11-13 15:50:52
2025-11-19 05:28:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
976文章数 371关注度
往期回顾 全部

科技要闻

谷歌CEO警告:若AI泡沫破裂,没公司能幸免

头条要闻

27岁女孩家门口遇害 妈妈痛哭:墙上还有女儿血迹

头条要闻

27岁女孩家门口遇害 妈妈痛哭:墙上还有女儿血迹

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

健康
家居
数码
教育
军事航空

警惕超声报告这六大"坑"

家居要闻

彰显奢华 意式经典风格

数码要闻

华为MatePad系列平板“PC多屏协同”功能正式回归

教育要闻

留学降温“AI化留学”泛滥海归人设崩塌?

军事要闻

日媒扬言要"击沉福建舰" 专家:玩火自焚

无障碍浏览 进入关怀版