网易首页 > 网易号 > 正文 申请入驻

奥特曼都点赞,谷歌Gemini 3 Pro到底强在哪?

0
分享至


谷歌可算是发布Gemini 3 Pro了,很突然,而且很“低调”。

虽然谷歌在Gemini 3 Pro之前发布了图片编辑模型Nano Banana,进而刷了一波存在感。但是在基座模型方面,谷歌已经静默太久。

过去这大半年,大家都在热议OpenAI的新动作,或者感叹Claude在代码领域的统治力,唯独没有人提及8个月没有版本号升级的Gemini。

纵使谷歌的云业务和财报再漂亮,可在AI开发者的核心圈子里,谷歌的存在感仍然被一点点的稀释。

好在的是,小榜在第一时间体验过后发现,Gemini 3 Pro并没有让我们失望。

但现在还不能过早下结论。因为现在的AI赛道早就已经过了靠参数量吓人的阶段,大家都在卷应用、卷落地、卷成本。

谷歌能不能适应新版本和新环境,还是个未知数。


01

我让Gemini 3 Pro用一句话来形容自己,它是这么回答我的。

“不再急于向世界证明自己有多聪明,而是开始琢磨如何让自己变得更有用。”——Gemini 3 Pro

在LMArena排行榜上,Gemini 3 Pro以1501的Elo分数登顶,这是AI模型在综合能力评估中的新纪录。这是一个相当优秀的成绩,就连奥特曼也发推表示祝贺。


数学能力测试中,该模型在AIME2025(美国数学邀请赛)的代码执行模式下达到了100%的准确率。在GPQADiamond科学知识测试中,Gemini 3 Pro的准确率为91.9%。

MathArenaApex数学竞赛的测试结果显示,Gemini 3 Pro获得了23.4%的得分,而其他主流模型的得分普遍在2%以下。此外,在名为Humanity'sLastExam的测试中,该模型在不使用工具的情况下达到了37.5%的得分。

Google在此次更新中引入了名为“vibecoding”的代码生成功能。这项功能允许用户通过自然语言描述需求,系统随后生成相应的代码和应用程序。

在Canvas编程环境的测试中,用户描述“制作一个可以调节转速的电风扇”后,系统在约30秒内生成了包含旋转动画、速度控制滑块和开关按钮的完整代码。


官方展示的案例还包括核聚变过程的可视化模拟。

在交互方式上,Gemini 3 Pro增加了“生成式界面”(GenerativeUI)功能。与传统AI助手只返回文本回答不同,该系统可以根据查询内容自动生成定制化的界面布局。

例如,当用户询问量子计算相关问题时,系统可能生成包含概念解释、动态图表和相关论文链接的交互式界面。

针对不同受众的同一问题,系统会生成不同的界面设计,举个简单例子,向儿童和成人解释同一概念时,会采用不同的呈现方式。儿童的就会偏可爱,成人则会偏简洁明了。

Google Labs中提供的Visual Layout实验功能展示了这种界面的应用,用户可以获得杂志风格的视图布局,包含图片、模块和可调节的UI元素。

此次发布还包含了名为Gemini Agent的智能体系统,目前处于实验阶段。该系统可以执行多步骤任务,并连接到Gmail、Google Calendar和Reminders等谷歌服务。

在收件箱管理场景中,系统可以自动筛选邮件、标记优先级和起草回复。旅行规划是另一个应用场景,用户只需提供目的地和大致时间,系统会查询日历、搜索航班和酒店选项,并添加行程安排。而这项功能目前仅向美国地区的Google AI Ultra订阅用户开放。

在多模态处理方面,Gemini 3 Pro基于稀疏混合专家架构构建,支持文本、图像、音频和视频输入。模型的上下文窗口为100万token,意味着可以处理较长的文档或视频内容。

加拿大劳瑞尔大学历史学教授Mark Humphries的测试显示,该模型在识别18世纪手写文稿时的字符错误率为0.56%,相比前代版本降低了50%到70%。

Google表示,训练数据包括公开网络文档、代码、图像、音频和视频内容,后训练阶段使用了强化学习技术。

Google还推出了名为Gemini 3 Deep Think的优化版本,专门用于复杂推理任务。该模式目前正在进行安全评估,计划在未来几周向Google AI Ultra订阅者开放。

在Google Search的AI模式中,用户可以点击“thinking”选项卡查看该模式的推理过程。与标准模式相比,Deep Think模式会在生成回答前进行更多步骤的分析。

除了官方提供的资料外,我还将Gemini 3 Pro和ChatGPT-5.1进行了对比。

第一个对比就是生成图片。

提示词:给我生成一张iPhone17

ChatGPT-5.1


Gemini 3 Pro


主观上来讲,ChatGPT-5.1更符合我的需求,因此这回合是ChatGPT-5.1胜出。

第二个对比的就是两者的智能体水平。

提示词:去给我研究研究字母榜这个微信公众号,然后评论一下这个号的水平

GPT-5.1


Gemini 3 Pro


虽然从主观上来讲,我更喜欢Gemini 3 Pro的解读,但是太过于鼓吹,ChatGPT-5.1能发现小榜还有所不足,更客观真实。

最后是代码能力,也是目前所有大模型最关注的一块。

我选的项目是GitHub上最近星数非常高的项目,叫做LightRAG。这是通过整合图结构来增强上下文感知和高效信息检索,从而改进检索增强生成,实现了更高的准确性和更快的响应时间。项目地址https://github.com/HKUDS/LightRAG

提示词:跟我说说这个项目如何

GPT-5.1


Gemini 3 Pro


同时,Gemini 3 Pro也获得了业内人士的高度评价。




02

虽然Gemini 3 Pro发布的非常低调,但实际上谷歌已经为Gemini 3 Pro预热了很久。

在谷歌第三季度财报电话会上,谷歌CEO皮查伊说了这么一句话:“Gemini 3 Pro将在2025年内发布。”没有具体日期,没有更多细节,却拉开了科技行业一场营销大戏的序幕。

谷歌不断释放信号,让整个AI社区保持高度关注,却始终拒绝给出任何确定的发布时间表。

从10月开始,各种“意外泄露”接踵而至。10月23日开始流传一份日历,在其11月12日“Gemini 3 Pro Release”的内部日历截图疯传。


而且眼尖的开发者还在Vertex AI的API文档中发现了“gemini-3-pro-preview-11-2025”的字样。


紧接着,Reddit 和 X上开始出现各种截图。有用户声称在 Gemini Canvas 工具中看到了新模型的身影,有人在移动应用的某些版本中发现了异常的模型标识。

然后就是,下面这张测试数据开始在社交媒体流传。


这些“泄露”看似偶然,实则构成了一场精心编排的预热。

每一次泄露都恰到好处地展示了Gemini 3 Pro 的某项核心能力,每一次讨论都将期待值推向新的高度。而 谷歌官方账号的态度则耐人寻味,他们会转发社区的讨论,会用“即将到来”这样的措辞吊胃口,甚至谷歌AI实验室的高层,还在关于发布日期预测的推文下回复了两个“思考”表情符号,但就是不肯说出一个准确日期。

预热了将近1个月,谷歌终于将新鲜的Gemini 3 Pro端了上来。然而Gemini 3 Pro性能虽然强劲,但是谷歌的更新频率多少让人有点着急。

早在今年3月份的时候,谷歌就发布了Gemini 2.5 Pro的预览版本,后续又陆续推出了Gemini 2.5 Flash预览版等衍生预览版本。直至Gemini 3 Pro问世,Gemini系列在此期间无任何版本号升级。

可谷歌的对手们并不会等待Gemini。

OpenAI在8月7日推出了GPT-5,并在11月12日进一步升级到 GPT-5.1。而且这段时间里,OpenAI还推出了自己的AI浏览器Atlas,直指谷歌腹地。

Anthropic 的迭代速度更为密集:2月24日发布 Claude 3.7 Sonnet(首个混合推理模型),5月22日推出 Claude Opus 4 和 Sonnet 4,8月5日发布 Claude Opus 4.1,9月29日推出 Claude Sonnet 4.5,10月15日又发布了 Claude Haiku 4.5。

这一系列攻势打得谷歌有些措手不及,不过目前来看,谷歌顶住了。


03

谷歌之所以耗时8个月才更新Gemini 3 Pro,最大的原因可能来自于人员上的变更。

2025年7月至8月前后,微软对谷歌发起了一波猛烈的人才攻势,成功招募了超过20名DeepMind的核心专家和高管。

这其中就包括DeepMind高级产品总监(Senior Director of Product)戴夫·希创(Dave Citron),负责其核心AI产品的落地。以及Gemini的工程副总裁 (VP of Engineering)阿玛尔·苏布拉马尼亚(Amar Subramanya),他是 Google最重要模型Gemini的核心工程负责人之一。

另外一方面,谷歌Nano Banana团队曾表示,谷歌在发布Gemini 2.5 Pro后很长一段时间里,都在纠结AI生图领域,进而放缓了基座模型的更新。

谷歌认为,只有攻克了角色一致性 (Character Consistency)、语境编辑(In-context Editing)、文字乱码(Text Rendering)这三个生成图片领域的难关后,才能让基座模型的表现更好。

Nano Banana团队表示,模型不仅能“画得好看”,更重要的是能“听懂人话”并“受人控制”,从而让 AI 生图真正进入商业落地阶段。

这时回头来看Gemini 3 Pro,它是一份合格的答卷,但在这个只争朝夕的 AI 战场,及格早已不够。

谷歌既然选择了在此时此刻交卷,就必须准备好面对最苛刻的阅卷人,那些已经被竞品“喂刁”了口味的用户和开发者。接下来的几个月,将不是模型参数的比拼,而是生态整合能力的肉搏。谷歌这头大象不仅要学会跳舞,还得跳得比所有人都快。


欢迎在评论区留言~
如需开白请加小编微信:dongfangmark



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
12月1日起执行!人社部重磅新规落地,关乎退休人员养老金和医保

12月1日起执行!人社部重磅新规落地,关乎退休人员养老金和医保

李博世财经
2025-11-19 10:19:04
穿白制服的空姐

穿白制服的空姐

喜欢历史的阿繁
2025-10-22 07:37:49
A股:明天,11月20日,历史要重演了?

A股:明天,11月20日,历史要重演了?

明心
2025-11-19 16:14:53
这3种菜不起眼,却比黄芪补气,比当归补血,别不懂吃

这3种菜不起眼,却比黄芪补气,比当归补血,别不懂吃

诗意世界
2025-09-15 20:59:33
别再问骗子郭伟如何能当首席科学家 该问为何江苏科技大学甘愿被骗

别再问骗子郭伟如何能当首席科学家 该问为何江苏科技大学甘愿被骗

Thurman在昆明
2025-11-19 12:59:27
流量太可怕了!“冷美人”在病房开启首次直播,在线人数超10万…

流量太可怕了!“冷美人”在病房开启首次直播,在线人数超10万…

火山诗话
2025-11-19 20:50:35
《鬼灭之刃》票房大跌。热度下降多次空场!《哪吒2》惨遭拉踩!

《鬼灭之刃》票房大跌。热度下降多次空场!《哪吒2》惨遭拉踩!

艳姐的搞笑视频
2025-11-19 21:06:04
外交部第五次在记者会上敦促日方收回错误言论

外交部第五次在记者会上敦促日方收回错误言论

中国青年报
2025-11-19 17:31:44
王思聪新女友被曝光!身材比懒懒还辣,亲自帮拎包正在“甜蜜期”

王思聪新女友被曝光!身材比懒懒还辣,亲自帮拎包正在“甜蜜期”

观察鉴娱
2025-11-19 09:37:05
数据!中国围棋2025年大丰收,除LG杯外,5场世界大赛,4场夺冠!

数据!中国围棋2025年大丰收,除LG杯外,5场世界大赛,4场夺冠!

L76号
2025-11-19 16:38:15
新Model Y,简直了

新Model Y,简直了

放毒
2025-11-19 16:49:47
076突然掉头返航,美军发现问题不对!

076突然掉头返航,美军发现问题不对!

星辰故事屋
2025-11-19 14:03:19
心痛!宁波一5个月大婴儿因心脏手术离世,眼角还挂着泪痕

心痛!宁波一5个月大婴儿因心脏手术离世,眼角还挂着泪痕

恪守原则和底线
2025-11-18 10:47:58
下半年首场寒潮进入尾声 多地最高气温累计升幅将达10℃左右

下半年首场寒潮进入尾声 多地最高气温累计升幅将达10℃左右

极目新闻
2025-11-19 19:40:19
詹姆斯复出首秀:11+12助攻创多项历史第一 吐舌大笑提前打卡

詹姆斯复出首秀:11+12助攻创多项历史第一 吐舌大笑提前打卡

醉卧浮生
2025-11-19 14:00:57
天大的讽刺!释永信被正式批捕后,才知道她是多么令人钦佩

天大的讽刺!释永信被正式批捕后,才知道她是多么令人钦佩

陈博世财经
2025-11-19 17:02:58
81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

81岁林豆豆现状:已退休23年,独居在北京老房子,用阅读打发时间

揽星河的笔记
2025-11-12 12:36:17
被逼迫辞职后,高市体面认输,再也不敢叫板中国,洪秀柱一语成谶

被逼迫辞职后,高市体面认输,再也不敢叫板中国,洪秀柱一语成谶

历来纵横
2025-11-19 14:35:14
娃哈哈经销商大会:“消失”的宗馥莉,冷清的现场,1个小时的会议和5个亿的收入增长

娃哈哈经销商大会:“消失”的宗馥莉,冷清的现场,1个小时的会议和5个亿的收入增长

食品内参
2025-11-19 10:48:27
中企正式宣布!计划2026年量产光刻机,外媒:ASML最怕的来了

中企正式宣布!计划2026年量产光刻机,外媒:ASML最怕的来了

白梦日记
2025-11-17 21:14:05
2025-11-19 22:16:49
直面派 incentive-icons
直面派
讲述值得讲述的真实故事
230文章数 235关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

公开爱泼斯坦案文件只等特朗普签字 重量级名字或出现

头条要闻

公开爱泼斯坦案文件只等特朗普签字 重量级名字或出现

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

数码
教育
亲子
游戏
公开课

数码要闻

为企业而生 新一代鸿蒙电脑及鸿蒙电脑企业版将开启商用PC新格局

教育要闻

今年,最没节操的几所英国大学!

亲子要闻

孩子患病后,父母要免于恐惧、降低焦虑,掌握真正的康复方法

Uzi再度复出加盟iG组建至臻全神班?辟谣:单纯排位瘾来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版