网易首页 > 网易号 > 正文 申请入驻

奥特曼都点赞,谷歌Gemini 3 Pro到底强在哪?

0
分享至



谷歌可算是发布Gemini 3 Pro了,很突然,而且很“低调”。

虽然谷歌在Gemini 3 Pro之前发布了图片编辑模型Nano Banana,进而刷了一波存在感。但是在基座模型方面,谷歌已经静默太久。

过去这大半年,大家都在热议OpenAI的新动作,或者感叹Claude在代码领域的统治力,唯独没有人提及8个月没有版本号升级的Gemini。

纵使谷歌的云业务和财报再漂亮,可在AI开发者的核心圈子里,谷歌的存在感仍然被一点点的稀释。

好在的是,小榜在第一时间体验过后发现,Gemini 3 Pro并没有让我们失望。

但现在还不能过早下结论。因为现在的AI赛道早就已经过了靠参数量吓人的阶段,大家都在卷应用、卷落地、卷成本。

谷歌能不能适应新版本和新环境,还是个未知数。



01

我让Gemini 3 Pro用一句话来形容自己,它是这么回答我的。

“不再急于向世界证明自己有多聪明,而是开始琢磨如何让自己变得更有用。”——Gemini 3 Pro

在LMArena排行榜上,Gemini 3 Pro以1501的Elo分数登顶,这是AI模型在综合能力评估中的新纪录。这是一个相当优秀的成绩,就连奥特曼也发推表示祝贺。



数学能力测试中,该模型在AIME2025(美国数学邀请赛)的代码执行模式下达到了100%的准确率。在GPQADiamond科学知识测试中,Gemini 3 Pro的准确率为91.9%。

MathArenaApex数学竞赛的测试结果显示,Gemini 3 Pro获得了23.4%的得分,而其他主流模型的得分普遍在2%以下。此外,在名为Humanity'sLastExam的测试中,该模型在不使用工具的情况下达到了37.5%的得分。

Google在此次更新中引入了名为“vibecoding”的代码生成功能。这项功能允许用户通过自然语言描述需求,系统随后生成相应的代码和应用程序。

在Canvas编程环境的测试中,用户描述“制作一个可以调节转速的电风扇”后,系统在约30秒内生成了包含旋转动画、速度控制滑块和开关按钮的完整代码。



官方展示的案例还包括核聚变过程的可视化模拟。

在交互方式上,Gemini 3 Pro增加了“生成式界面”(GenerativeUI)功能。与传统AI助手只返回文本回答不同,该系统可以根据查询内容自动生成定制化的界面布局。

例如,当用户询问量子计算相关问题时,系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。

针对不同受众的同一问题,系统会生成不同的界面设计,举个简单例子,向儿童和成人解释同一概念时,会采用不同的呈现方式。儿童的就会偏可爱,成人则会偏简洁明了。

Google Labs中提供的Visual Layout实验功能展示了这种界面的应用,用户可以获得杂志风格的视图布局,包含图片、模块和可调节的UI元素。

此次发布还包含了名为Gemini Agent的智能体系统,目前处于实验阶段。该系统可以执行多步骤任务,并连接到Gmail、Google Calendar和Reminders等谷歌服务。

在收件箱管理场景中,系统可以自动筛选邮件、标记优先级和起草回复。旅行规划是另一个应用场景,用户只需提供目的地和大致时间,系统会查询日历、搜索航班和酒店选项,并添加行程安排。而这项功能目前仅向美国地区的Google AI Ultra订阅用户开放。

在多模态处理方面,Gemini 3 Pro基于稀疏混合专家架构构建,支持文本、图像、音频和视频输入。模型的上下文窗口为100万token,意味着可以处理较长的文档或视频内容。

加拿大劳瑞尔大学历史学教授Mark Humphries的测试显示,该模型在识别18世纪手写文稿时的字符错误率为0.56%,相比前代版本降低了50%到70%。

Google表示,训练数据包括公开网络文档、代码、图像、音频和视频内容,后训练阶段使用了强化学习技术。

Google还推出了名为Gemini 3 Deep Think的优化版本,专门用于复杂推理任务。该模式目前正在进行安全评估,计划在未来几周向Google AI Ultra订阅者开放。

在Google Search的AI模式中,用户可以点击“thinking”选项卡查看该模式的推理过程。与标准模式相比,Deep Think模式会在生成回答前进行更多步骤的分析。

除了官方提供的资料外,我还将Gemini 3 Pro和ChatGPT-5.1进行了对比。

第一个对比就是生成图片。

提示词:给我生成一张iPhone17

ChatGPT-5.1



Gemini 3 Pro



主观上来讲,ChatGPT-5.1更符合我的需求,因此这回合是ChatGPT-5.1胜出。

第二个对比的就是两者的智能体水平。

提示词:去给我研究研究字母榜这个微信公众号,然后评论一下这个号的水平

GPT-5.1



Gemini 3 Pro



虽然从主观上来讲,我更喜欢Gemini 3 Pro的解读,但是太过于鼓吹,ChatGPT-5.1能发现小榜还有所不足,更客观真实。

最后是代码能力,也是目前所有大模型最关注的一块。

我选的项目是GitHub上最近星数非常高的项目,叫做LightRAG。这是通过整合图结构来增强上下文感知和高效信息检索,从而改进检索增强生成,实现了更高的准确性和更快的响应时间。项目地址
https://github.com/HKUDS/LightRAG

提示词:跟我说说这个项目如何

GPT-5.1



Gemini 3 Pro



同时,Gemini 3 Pro也获得了业内人士的高度评价。







02

虽然Gemini 3 Pro发布的非常低调,但实际上谷歌已经为Gemini 3 Pro预热了很久。

在谷歌第三季度财报电话会上,谷歌CEO皮查伊说了这么一句话:“Gemini 3 Pro将在2025年内发布。”没有具体日期,没有更多细节,却拉开了科技行业一场营销大戏的序幕。

谷歌不断释放信号,让整个AI社区保持高度关注,却始终拒绝给出任何确定的发布时间表。

从10月开始,各种“意外泄露”接踵而至。10月23日开始流传一份日历,在其11月12日“Gemini 3 Pro Release”的内部日历截图疯传。



而且眼尖的开发者还在Vertex AI的API文档中发现了“
gemini-3-pro-preview-11-2025”的字样。



紧接着,Reddit 和 X上开始出现各种截图。有用户声称在 Gemini Canvas 工具中看到了新模型的身影,有人在移动应用的某些版本中发现了异常的模型标识。

然后就是,下面这张测试数据开始在社交媒体流传。



这些“泄露”看似偶然,实则构成了一场精心编排的预热。

每一次泄露都恰到好处地展示了Gemini 3 Pro 的某项核心能力,每一次讨论都将期待值推向新的高度。而 谷歌官方账号的态度则耐人寻味,他们会转发社区的讨论,会用“即将到来”这样的措辞吊胃口,甚至谷歌AI实验室的高层,还在关于发布日期预测的推文下回复了两个“思考”表情符号,但就是不肯说出一个准确日期。

预热了将近1个月,谷歌终于将新鲜的Gemini 3 Pro端了上来。然而Gemini 3 Pro性能虽然强劲,但是谷歌的更新频率多少让人有点着急。

早在今年3月份的时候,谷歌就发布了Gemini 2.5 Pro的预览版本,后续又陆续推出了Gemini 2.5 Flash预览版等衍生预览版本。直至Gemini 3 Pro问世,Gemini系列在此期间无任何版本号升级。

可谷歌的对手们并不会等待Gemini。

OpenAI在8月7日推出了GPT-5,并在11月12日进一步升级到 GPT-5.1。而且这段时间里,OpenAI还推出了自己的AI浏览器Atlas,直指谷歌腹地。

Anthropic 的迭代速度更为密集:2月24日发布 Claude 3.7 Sonnet(首个混合推理模型),5月22日推出 Claude Opus 4 和 Sonnet 4,8月5日发布 Claude Opus 4.1,9月29日推出 Claude Sonnet 4.5,10月15日又发布了 Claude Haiku 4.5。

这一系列攻势打得谷歌有些措手不及,不过目前来看,谷歌顶住了。



03

谷歌之所以耗时8个月才更新Gemini 3 Pro,最大的原因可能来自于人员上的变更。

2025年7月至8月前后,微软对谷歌发起了一波猛烈的人才攻势,成功招募了超过20名DeepMind的核心专家和高管。

这其中就包括DeepMind高级产品总监(Senior Director of Product)戴夫·希创(Dave Citron),负责其核心AI产品的落地。以及Gemini的工程副总裁 (VP of Engineering)阿玛尔·苏布拉马尼亚(Amar Subramanya),他是 Google最重要模型Gemini的核心工程负责人之一。

另外一方面,谷歌Nano Banana团队曾表示,谷歌在发布Gemini 2.5 Pro后很长一段时间里,都在纠结AI生图领域,进而放缓了基座模型的更新。

谷歌认为,只有攻克了角色一致性 (Character Consistency)、语境编辑(In-context Editing)、文字乱码(Text Rendering)这三个生成图片领域的难关后,才能让基座模型的表现更好。

Nano Banana团队表示,模型不仅能“画得好看”,更重要的是能“听懂人话”并“受人控制”,从而让 AI 生图真正进入商业落地阶段。

这时回头来看Gemini 3 Pro,它是一份合格的答卷,但在这个只争朝夕的 AI 战场,及格早已不够。

谷歌既然选择了在此时此刻交卷,就必须准备好面对最苛刻的阅卷人,那些已经被竞品“喂刁”了口味的用户和开发者。接下来的几个月,将不是模型参数的比拼,而是生态整合能力的肉搏。谷歌这头大象不仅要学会跳舞,还得跳得比所有人都快。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
万达继续出售资产 20亿元转让上海颛桥万达广场

万达继续出售资产 20亿元转让上海颛桥万达广场

财联社
2026-02-27 12:50:11
夜间气温达零下30℃!泽连斯基:乌面临几十年来最难冬天,下轮会谈或在阿布扎比

夜间气温达零下30℃!泽连斯基:乌面临几十年来最难冬天,下轮会谈或在阿布扎比

红星新闻
2026-02-27 17:33:09
当时很多蒙古考察日记中,都提到蒙古人性交随意,得病者极多!

当时很多蒙古考察日记中,都提到蒙古人性交随意,得病者极多!

老范谈史
2026-02-24 14:51:55
中国台湾女童在日本街头拍照时遭日本女子故意撞倒,施暴者先肘击男性再推倒两名小女孩,疑似日本“撞人族” 专挑弱势目标冲撞

中国台湾女童在日本街头拍照时遭日本女子故意撞倒,施暴者先肘击男性再推倒两名小女孩,疑似日本“撞人族” 专挑弱势目标冲撞

观威海
2026-02-27 10:07:13
狐狸尾巴露出来了?默茨访华说漏嘴,中方当面回复,措辞极不寻常

狐狸尾巴露出来了?默茨访华说漏嘴,中方当面回复,措辞极不寻常

青烟小先生
2026-02-28 09:39:29
惊呆了!12岁小女孩抱弟弟如同妈妈般自然,背后真相感人至深!

惊呆了!12岁小女孩抱弟弟如同妈妈般自然,背后真相感人至深!

复转小能手
2026-02-27 21:40:57
马筱梅儿子被质疑不是新生儿,疑在大S忌日出生,行程被扒惹争议

马筱梅儿子被质疑不是新生儿,疑在大S忌日出生,行程被扒惹争议

古希腊掌管月桂的神
2026-02-25 12:42:43
快可电子:越南工厂年产能约3000万套接线盒,美国工厂年产能约1000万套接线盒

快可电子:越南工厂年产能约3000万套接线盒,美国工厂年产能约1000万套接线盒

每日经济新闻
2026-02-27 17:18:15
体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

带你感受人间冷暖
2026-02-24 01:03:13
爆冷!2026 金球奖热门大洗牌:C 罗 40 岁仍冲冠,梅西逆袭归来

爆冷!2026 金球奖热门大洗牌:C 罗 40 岁仍冲冠,梅西逆袭归来

澜归序
2026-02-28 03:12:50
国际篮联正式致歉!日本媒体点名郭士强,认为中国男篮胜之不武

国际篮联正式致歉!日本媒体点名郭士强,认为中国男篮胜之不武

十点街球体育
2026-02-27 20:17:35
巴拿马赶在仲裁前动手,中国四大反制措施将继续加强

巴拿马赶在仲裁前动手,中国四大反制措施将继续加强

忠于法纪
2026-02-28 09:21:54
俄罗斯“居住服役”法令颁布华人蜂拥回国,机票暴涨200%

俄罗斯“居住服役”法令颁布华人蜂拥回国,机票暴涨200%

史政先锋
2026-02-27 14:48:38
父亲年前从国企退休,我以为退休金也就三四千块钱

父亲年前从国企退休,我以为退休金也就三四千块钱

五元讲堂
2026-02-25 14:26:11
男篮更衣室不断庆祝!唯独一人没参与,坐在角落大口喘气

男篮更衣室不断庆祝!唯独一人没参与,坐在角落大口喘气

体育哲人
2026-02-27 17:07:27
欧冠16强抽签出炉附赛程:皇马vs曼城!晋级悬念不大 8强基本如下

欧冠16强抽签出炉附赛程:皇马vs曼城!晋级悬念不大 8强基本如下

小火箭爱体育
2026-02-27 20:54:30
突然!大涨76.6%!苏州32个板块房价集体暴涨!

突然!大涨76.6%!苏州32个板块房价集体暴涨!

苏南房地产观察
2026-02-26 16:10:16
男子过年杀鸭杀出多颗黄金,重量超6克

男子过年杀鸭杀出多颗黄金,重量超6克

南国今报
2026-02-27 10:51:20
伊朗总统说伊朗无意发展核武器!美国总统特朗普多次称,美国不允许伊朗拥有核武器

伊朗总统说伊朗无意发展核武器!美国总统特朗普多次称,美国不允许伊朗拥有核武器

每日经济新闻
2026-02-27 19:55:21
WTT大满贯!女单4强对阵出炉,张本美和强势横扫,王曼昱苦战逆转

WTT大满贯!女单4强对阵出炉,张本美和强势横扫,王曼昱苦战逆转

削桐作琴
2026-02-27 18:12:24
2026-02-28 10:27:00
字母榜 incentive-icons
字母榜
让未来不止于大。
2252文章数 8044关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

牛弹琴:伊朗面临生死存亡关键时刻 信号已经很明显了

头条要闻

牛弹琴:伊朗面临生死存亡关键时刻 信号已经很明显了

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

本地
教育
时尚
艺术
家居

本地新闻

津南好·四时总相宜

教育要闻

刚刚!考研,出分!(附历年国家线)

被章若楠、秦岚带火的鞋子竟然是它?春天这样穿又美又气质!

艺术要闻

这幅草书中19个字,您能一眼看懂吗?“徐娘半老”含义引热议!

家居要闻

素色肌理 品意式格调

无障碍浏览 进入关怀版