网易首页 > 网易号 > 正文 申请入驻

谷歌Gemini 3杀疯了!碾压GPT-5.1,AI全模态时代来了

0
分享至



当AI领域还在热议GPT-5.1的创新突破时,谷歌用一款颠覆性产品打破了所有平静。年度压轴旗舰Gemini3的炸裂登场,不仅让全网瞬间沸腾,更让OpenAICEO奥特曼都在发布一小时后亲自发推祝贺。



这款被冠以“迄今推理最强、多模态理解最强、智能体与氛围编程最强”的新一代模型,以断层领先的基准测试成绩、全方位升级的核心能力,正式宣告AI行业迈入全新时代。从博士级推理到纯自然语言编程,从长程任务规划到跨模态交互,Gemini3正在重新定义智能的边界,也让每个人对未来科技生活有了全新想象。



一、基准测试封神:碾压级性能刷新行业天花板

Gemini3的强势,首先体现在横扫各大权威基准测试的绝对实力。作为首发顶配版本,Gemini3Pro在核心性能上实现了对前代2.5Pro的全方位超越,更将OpenAI刚推出的GPT-5.1远远甩在身后。



在衡量模型综合能力的LMArena排行榜上,Gemini3Pro狂揽1501Elo的突破性高分,稳稳占据榜首位置;WebDevArena测试中,1487Elo的成绩让它成为编程领域的绝对王者。更令人惊叹的是其“博士级”推理能力——在被称为“人类最后考试”的HLE测试中,它刷新了45.8%的最高分纪录,GPQADiamond测试更是斩获91.9%的优异成绩,意味着在复杂科学问题、专业学术领域,它已具备顶尖人类专家的分析水平。

针对更具挑战性的复杂任务,增强推理模式下的Gemini3DeepThink表现更为惊艳。在HLE测试中拿下41%的成绩,GPQADiamond测试达到93.8%,而在ARC-AGI-2测试中更是创下45.1%的历史新高,展现出应对未知新颖问题的超强能力。多模态领域同样所向披靡,MMMU-Pro测试81%的得分、Video-MMMU测试87.6%的成绩,重新定义了AI对文本、图像、视频等多种信息形态的理解能力。

值得一提的是,Gemini3的所有训练均在谷歌自研TPU上完成,这种软硬件协同的技术优势,成为其性能碾压的核心“护城河”,也让行业看到了全栈AI技术布局的巨大潜力。

二、全模态爆发:100万token解锁多元交互场景

如果说超强推理是Gemini3的核心大脑,那么跨模态理解与交互能力就是它连接世界的全能感官。从诞生之初,Gemini系列就以“跨多模态”为核心定位,而Gemini3则实现了质的飞跃,整合了最先进的视觉与空间理解、领先的多语言性能,以及高达100万token的上下文窗口,让复杂信息处理变得游刃有余。

在学习场景中,Gemini3成为高效的私人导师。它能破译不同语言的手写家族食谱,将其转化为可共享的标准家庭食谱;面对晦涩的学术论文或冗长的视频讲座,它可自动生成交互式抽认卡、可视化效果和配套代码,让知识吸收更高效。甚至在运动领域,它能分析匹克球比赛视频,精准找出技术短板并生成针对性训练计划,让专业指导触手可及。

搜索体验也因Gemini3迎来革命性升级。在搜索的AI模式下,它能根据查询即时生成沉浸式视觉布局、交互式工具和模拟场景。想要了解RNA聚合酶的工作原理?它会直接生成动态可视化界面,用直观的方式拆解复杂的生物过程,让知识获取从“阅读”变成“体验”。这种全模态交互能力,打破了信息形态的壁垒,让AI真正融入学习、工作、生活的各个场景。

三、氛围编程革命:一句话搞定复杂应用开发

对于开发者而言,Gemini3带来的“氛围编程”能力堪称颠覆性突破。所谓“氛围编程”,核心就是让开发者仅凭自然语言描述,就能快速生成功能完备、交互流畅的应用程序,彻底降低开发门槛,释放创意空间。

Gemini3在编程领域的实力得到多项权威测试认证。Terminal-Bench2.0测试中,54.2%的得分证明了它通过终端操作计算机的超强工具使用能力;SWE-benchVerified测试76.2%的成绩,远超前代模型,成为顶尖的编码智能体。实际应用中,它的表现更是让人惊叹:仅凭一句话描述,就能生成带有丰富视觉效果和交互逻辑的复古3D太空飞船游戏;借助着色器构建可玩的科幻世界、打造复杂的WebUI应用,对它而言都轻松自如。

网友的实测案例更直观展现了其编程实力:有开发者让它创建3D乐高编辑器,它一次生成就完美实现了用户界面、复杂空间逻辑和全部功能;有人要求重现经典iOS游戏《荒谬钓鱼》,它不仅还原了核心玩法,还自带音效和背景音乐;更令人震撼的是,它成功构建了功能完备的GameBoy模拟器,甚至用SVG绘制出了还原度极高的设备外观——这些以往需要专业团队耗时数周的工作,如今只需一个提示词就能完成。

目前,全球开发者可通过GoogleAIStudio、VertexAI、GeminiCLI等平台使用Gemini3,它还接入了Cursor、GitHub、JetBrains等多个第三方工具,让编程效率实现指数级提升。

四、智能体进化:长程规划成为人类“超级手替”

如果说编程能力解放了开发者的双手,那么升级后的智能体功能,则让Gemini3成为适用于所有人的“超级手替”。谷歌自Gemini2开启智能体时代以来,持续优化模型的长程规划能力,而Gemini3在Vending-Bench2排行榜上的登顶,标志着这项技术已走向成熟。

Vending-Bench2测试通过模拟运营自动售货机业务,深度考验AI在复杂场景下的长程规划与决策能力。Gemini3Pro在整个模拟运营年度中,通过一致的工具使用和精准决策,在不偏离核心任务的前提下实现了更高回报,展现出远超同类模型的长程规划实力。这种能力落地到现实生活中,意味着它能帮你完成预订本地服务、整理收件箱等多步骤复杂任务,你只需下达核心指令,其余流程全由AI自主推进。

为了让智能体能力发挥更大价值,谷歌同步推出了革命性智能体开发平台GoogleAntigravity。这个全新平台以“任务”为核心维度,让智能体从开发者工具包中的辅助工具,升级为全程参与的主动协作者。在平台上,智能体可直接访问编辑器、终端和浏览器,自主规划并执行端到端的复杂软件任务,还能自动验证生成代码的有效性。例如在开发飞行跟踪应用程序时,Gemini3驱动的智能体可独立完成需求分析、代码编写、功能测试全流程,大幅提升开发效率。

目前,GoogleAIUltra订阅用户已可在Gemini应用中抢先体验智能体能力,而随着平台的不断完善,更多用户将享受到AI带来的高效生活。



五、全民狂欢:实测热潮见证AI新力量

Gemini3的发布不仅引发行业震动,更在全网掀起了实测热潮,网友们的创意玩法让这款强大模型的应用场景变得更加丰富。



GoogleAIStudio负责人Logan进行的弹跳球测试,在难度提升10倍的情况下,Gemini3Pro仅凭第一个提示词就完美完成任务,展现出超强的指令理解与执行能力。曾任职于Anthropic的AI工程师PietroSchirano,用它生成3D乐高编辑器并一次性成功,让网友惊呼“AI正在重构开发逻辑”。还有网友尝试让它解决复杂的科学问题,它不仅能编写托卡马克装置中等离子体流动的可视化代码,还能创作捕捉聚变物理学精髓的诗歌,将理性科技与感性创意完美融合。

这些实测案例不仅验证了Gemini3的强大性能,更让普通用户直观感受到AI技术的进步。从专业领域的深度应用到日常生活的趣味体验,Gemini3正在打破AI与普通人之间的壁垒,让智能科技变得触手可及。

结语

Gemini3的横空出世,不仅是谷歌在AGI道路上迈出的重要一步,更标志着AI行业正式进入全模态、强推理、高自主的新时代。博士级的推理能力、无往不利的多模态交互、颠覆行业的氛围编程、贴心实用的智能体服务,让这款模型从技术标杆变成了真正能赋能每个人的工具。



即日起,Gemini3Pro预览版已全面上线,而DeepThink模式也将在后续向GoogleAIUltra订阅用户开放。随着技术的不断普及和应用场景的持续拓展,我们有理由相信,Gemini3将重新定义工作与生活的方式,让更多人享受到智能科技带来的便利与乐趣。在这场AI驱动的变革中,无论是开发者、专业人士还是普通用户,都能找到属于自己的“智能升级”方式,共同迎接更高效、更具创造力的未来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你见过哪些长大不避嫌的家庭?网友:我就遇到这样的家庭,太乱了

你见过哪些长大不避嫌的家庭?网友:我就遇到这样的家庭,太乱了

带你感受人间冷暖
2025-11-01 00:05:14
英伟达美股盘前涨近6%

英伟达美股盘前涨近6%

财联社
2025-11-20 17:02:05
一女子捡到玉手镯卖了二十万,半年后,发现玉手镯在丈夫的包里

一女子捡到玉手镯卖了二十万,半年后,发现玉手镯在丈夫的包里

阿天爱旅行
2025-11-18 11:20:18
赢下全运会羽毛球混双金牌,“雅思组合”精彩谢幕

赢下全运会羽毛球混双金牌,“雅思组合”精彩谢幕

环球网资讯
2025-11-20 18:10:32
军援关键铁路线被破坏!波兰外长:宁愿吃草也不再当俄罗斯殖民地

军援关键铁路线被破坏!波兰外长:宁愿吃草也不再当俄罗斯殖民地

鹰眼Defence
2025-11-18 17:49:10
震惊!2026世界杯出现两支荷兰队,原因太神秘!

震惊!2026世界杯出现两支荷兰队,原因太神秘!

澜归序
2025-11-20 02:40:56
1990年,德国为了统一被迫放弃19万平方千米的土地,并写进宪法

1990年,德国为了统一被迫放弃19万平方千米的土地,并写进宪法

博览历史
2025-11-16 18:45:03
琉球不属日本,50年代琉球老照片:街头到处是中文,琉球女孩漂亮

琉球不属日本,50年代琉球老照片:街头到处是中文,琉球女孩漂亮

法老不说教
2025-11-19 15:02:39
“漏X装”,火了!

“漏X装”,火了!

微微热评
2025-11-19 14:51:31
柯文哲结局已定,岛内曝退党潮,大陆判断没错,两岸统一大势所趋

柯文哲结局已定,岛内曝退党潮,大陆判断没错,两岸统一大势所趋

起喜电影
2025-11-19 09:17:26
喻恩泰和妻子婚内双出轨,聊天记录不堪入目,妻子约P喜欢大的

喻恩泰和妻子婚内双出轨,聊天记录不堪入目,妻子约P喜欢大的

社会酱
2025-11-19 17:42:35
人类灭亡大局已定?科学家算出人类灭绝的日期,人类准备好了吗?

人类灭亡大局已定?科学家算出人类灭绝的日期,人类准备好了吗?

奥字侃剧
2025-10-06 15:08:18
浙经贸的三分钟战士大二弟弟火了

浙经贸的三分钟战士大二弟弟火了

杭城村叔
2025-09-11 12:54:47
中方暂停进口日本水产品,日本学者:高市早苗让日本国民成了牺牲品

中方暂停进口日本水产品,日本学者:高市早苗让日本国民成了牺牲品

环球网资讯
2025-11-20 07:15:05
邱泽许玮甯婚纱照公开,两人将于11月28日补办婚礼,女方透露想生二胎

邱泽许玮甯婚纱照公开,两人将于11月28日补办婚礼,女方透露想生二胎

鲁中晨报
2025-11-20 11:05:02
日经225指数涨幅扩大至4%

日经225指数涨幅扩大至4%

界面新闻
2025-11-20 08:26:39
宋佳拒绝和钟楚曦自拍,表情微妙一点不惯着,两次占C位吃相难看

宋佳拒绝和钟楚曦自拍,表情微妙一点不惯着,两次占C位吃相难看

银河史记
2025-11-18 22:18:27
详解毕福剑事件始未,世间再无“毕姥爷”!

详解毕福剑事件始未,世间再无“毕姥爷”!

好运来好运
2024-07-30 06:39:24
日本通告全球,扬言驱逐中方驻日大使,话音刚落,中方官宣新武器

日本通告全球,扬言驱逐中方驻日大使,话音刚落,中方官宣新武器

青橘罐头
2025-11-16 09:20:22
特斯拉起诉30多家中国公司,因购买车辆未跑足2万公里

特斯拉起诉30多家中国公司,因购买车辆未跑足2万公里

风风顺
2025-11-20 16:11:52
2025-11-20 18:55:00
魏家东 incentive-icons
魏家东
一个人的营销商学院!
2098文章数 12103关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

男子开奥迪上班被婚车车队当成头车 7台奥迪跟到工厂

头条要闻

男子开奥迪上班被婚车车队当成头车 7台奥迪跟到工厂

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

换购价15.98万起 广汽丰田全新威兰达上市

态度原创

房产
艺术
手机
旅游
军事航空

房产要闻

超95亿!三亚巨量资产,突然甩出!

艺术要闻

陈洪绶:花鸟册二十开

手机要闻

消息称vivo X Fold6走普及路线,正测试骁龙8 Gen 4

旅游要闻

初冬的台儿庄古城褪喧嚣之韵绘诗意长卷

军事要闻

日本称已向美国出口爱国者导弹

无障碍浏览 进入关怀版