网易首页 > 网易号 > 正文 申请入驻

谷歌深夜炸场:Gemini 3正式发布!自ChatGPT发布以来最激动人心的事件

0
分享至


刚刚,谷歌Gemini 3正式发布,我的初步体验和第一感觉是这玩意完全超越GPT-5 和 Claude sonnet 4.5,强到离谱,编程和写作都达到了T0级别,可以说这是自从OpenAI 发布ChatGPT以来,最令我心跳不已的事件,现在就可以在Gemini App和 Google AI Studio中使用了

随手测试:直接看效果(更详细的测试随后几天奉上)

1.制作速度可调的电风扇svg


2.模拟弹力球从空中一层一层掉落并弹起的物理过程(目前我测过的只有Claude sonnet 4.5可以抽卡成功)


3.模拟核聚变过程并添加背景乐(这个是复现谷歌官方的)

官方的发布核心信息要点:

谷歌官方把Gemini 3定义为“通往AGI之路的又一大步”。它不仅在多模态理解上全球领先,更是谷歌迄今为止最强大的Agent(智能体)和“Vibe Coding”模型。

此次发布包含两个核心版本:Gemini 3 Pro(即日预览上线)以及增强推理模式的Gemini 3 Deep Think

与此同时,谷歌宣布Gemini 3即刻全面接入谷歌生态——从Search(搜索)到AI Studio,再到全新的Agent开发平台Google Antigravity

一起来看Gemini 3到底有多强。

数据屠榜:LMArena突破1501分

Gemini 3 Pro主打深度推理和多模态能力,在每一项主流AI基准测试中都大幅超越了Gemini 2.5 Pro


推理与数学:

LMArena Leaderboard:以1501 Elo的突破性得分登顶。

Humanity’s Last Exam(人类最后一次考试):在不使用工具的情况下得分为37.5%,展现出博士级推理能力

GPQA Diamond:得分91.9%

MathArena Apex:达到23.4%,确立了前沿模型在数学领域的SOTA(State-of-the-art)新标准

多模态与事实性:

MMMU-Pro:81%。
Video-MMMU:87.6%,重新定义多模态推理。
SimpleQA Verified:72.1%(SOTA),在事实准确性上取得重大进展。

官方强调,Gemini 3 Pro不再是简单的问答,而是能够理解语境和意图,“不仅能读懂文字和图像,更能读懂空气(reading the room)”。它可以摒弃陈词滥调,提供真知灼见,甚至能通过生成代码将晦涩的科学概念转化为高保真的可视化效果

Deep Think模式:推理能力的阶跃

除了Pro版本,谷歌还祭出了大杀器——Gemini 3 Deep Think

这是一种增强推理模式,旨在解决最复杂的难题。测试数据显示,其性能进一步超越了本就强悍的Pro版本:


Humanity’s Last Exam:41.0%(无工具)

GPQA Diamond:93.8%

ARC-AGI-2:取得了前所未有的45.1%(含代码执行,ARC Prize Verified),证明了其解决新颖挑战的能力。

Deep Think模式将在未来几周内向Google AI Ultra订阅用户开放。

Google Antigravity:重塑开发者体验

随着Gemini 3的发布,谷歌推出了全新的Agent开发平台——Google Antigravity

这不只是一个AI IDE,它将Agent提升到了核心地位

自主权:Agent拥有对编辑器、终端和浏览器的直接访问权限

能力:利用Gemini 3的推理和工具使用能力,Agent可以自主规划并执行复杂的端到端软件任务,同时自我验证代码

模型组合:该平台不仅集成了Gemini 3 Pro,还紧密耦合了最新的Gemini 2.5 Computer Use模型(用于浏览器控制)和顶级图像编辑模型Nano Banana(Gemini 2.5 Image)。

在编码能力基准测试中,Gemini 3同样表现出色:

WebDev Arena:1487 Elo,位居榜首。

SWE-bench Verified:76.2%,大幅超越2.5 Pro,这一项没有超越Claude sonnet 4.5

Terminal-Bench 2.0:54.2%,展示了通过终端操作计算机的能力。

全能助手:从学习到规划

Gemini 3不仅面向开发者,更旨在帮助普通用户“学习、构建和规划一切”。

学习(Learn):

利用100万token的上下文窗口,它可以综合处理文本、图像、视频、音频和代码

示例: 它可以解读不同语言的手写食谱并整理成家庭烹饪书;通过分析匹克球(Pickleball)比赛视频,生成针对性的训练计划。

搜索进化: 在Search的AI模式中,Gemini 3支持生成式UI体验,能根据查询即时生成交互式工具和沉浸式视觉布局

规划(Plan):

Gemini 3在长时程规划上取得了长足进步

Vending-Bench 2测试: 该测试要求管理模拟自动售货机业务。Gemini 3 Pro在全年的模拟运营中保持了一致的决策力,未偏离任务,并带来了更高的回报,位居榜首

这由意味着它能更好地处理预订服务、整理收件箱等现实生活中的多步骤工作流

谷歌宣布,这是首次在发布首日就将新一代Gemini模型引入搜索(Search)。

具体推出计划如下:

普通用户:Gemini App及Search中的AI模式(针对Google AI Pro和Ultra订阅用户)即日起可用

开发者:通过Google AI Studio、Google Antigravity、Gemini CLI及Vertex AI访问

企业用户: 通过Vertex AI和Gemini Enterprise访问。

Deep Think模式:需等待安全评估,预计数周后向Ultra订阅用户开放。

劈柴哥表示,过去两年,AI Overviews月活已达20亿,Gemini App月活超6.5亿。Gemini 3的发布,标志着谷歌以“全栈式AI”策略,正式将Gemini部署到了谷歌的每一个角落

参考:

https://blog.google/products/gemini/gemini-3/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=-development

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿努廷,“狂飙突进”

阿努廷,“狂飙突进”

中国新闻周刊
2026-03-25 22:26:41
没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

岁月有情1314
2026-03-26 12:13:10
Manus的两名联合创始人被告知不要离开中国

Manus的两名联合创始人被告知不要离开中国

新浪财经
2026-03-26 13:50:59
4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

混沌录
2026-03-25 15:50:11
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
大陆对全体台胞发出邀请:两岸统一之时,即可从台岛自驾直达北京

大陆对全体台胞发出邀请:两岸统一之时,即可从台岛自驾直达北京

小童历史
2026-03-25 18:20:29
伊朗军方:霍尔木兹海峡局势发展由伊朗掌控

伊朗军方:霍尔木兹海峡局势发展由伊朗掌控

澎湃新闻
2026-03-26 01:17:13
突发!以色列彻底失控!

突发!以色列彻底失控!

财经要参
2026-03-26 21:58:11
砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

娱乐圈的笔娱君
2026-03-26 12:15:32
现货黄金跌幅扩大至2.5%

现货黄金跌幅扩大至2.5%

财联社
2026-03-27 00:24:12
伊朗称已组织超百万人为地面战斗做准备

伊朗称已组织超百万人为地面战斗做准备

财联社
2026-03-26 22:50:26
曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

我爱英超
2026-03-26 20:47:14
万科高管被要求退还薪酬

万科高管被要求退还薪酬

地产微资讯
2026-03-26 12:22:04
联大通过决议,宣布“最严重反人类罪”

联大通过决议,宣布“最严重反人类罪”

澎湃新闻
2026-03-26 11:03:06
人狂自有天收

人狂自有天收

李老逵乱摆龙门阵
2025-09-11 09:01:28
翻到张雪峰2016年婚纱照,瞬间看哭了!

翻到张雪峰2016年婚纱照,瞬间看哭了!

魔都姐姐杂谈
2026-03-26 22:06:50
突发,雷军辞职董事长!

突发,雷军辞职董事长!

品牌头版
2026-03-26 14:46:17
尺度大到曾下架!模特冠军泳装大雷出演影游即将发售

尺度大到曾下架!模特冠军泳装大雷出演影游即将发售

游民星空
2026-03-26 11:58:13
手机放床头辐射伤身?央视实验给出答案:这样放手机,辐射降10倍

手机放床头辐射伤身?央视实验给出答案:这样放手机,辐射降10倍

天气观察站
2026-03-24 19:02:53
中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

每日经济新闻
2026-03-26 13:25:09
2026-03-27 03:16:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1035文章数 396关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
数码
教育
手机
军事航空

转头就晕的耳石症,能开车上班吗?

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版