网易首页 > 网易号 > 正文 申请入驻

Gemini3凭什么自称“全球最智能模型”?实测对比ChatGPT-5

0
分享至

当谷歌CEO桑达尔·皮查伊在发布会上宣称Gemini 3是"我们最智能的模型"时,这句话背后藏着三个技术维度的军备竞赛。不同于前代产品需要数周才能接入核心服务,这次Gemini 3在发布当天就完成了与谷歌搜索的深度整合,这种闪电般的商业化速度,恰好揭示了AI竞赛的新战场——模型性能的较量已经转向落地效率的比拼。


打开百度APP畅享高清图片

image

在编程能力测试中,Gemini 3展现出令人惊讶的"氛围编程"天赋。谷歌实验室副总裁Josh Woodward演示了如何用自然语言提示生成完整代码模块,其响应速度比ChatGPT-5快40%。这得益于全新的动态注意力机制,使得模型能自动识别开发者需求中的关键参数。DeepMind泄露的内部测试显示,在LMArena编程基准测试中,Gemini 3的首次尝试准确率达到92%,而ChatGPT-5仅为78%。

数学推理能力的突破更为惊人。在Humanity's Last Exam基准测试中,Gemini 3的DeepThink模式展现出博士级别的解题能力。面对一道需要多步推导的拓扑学问题,它不仅给出正确答案,还自动生成了三种不同解法。对比测试中,ChatGPT-5在相同问题上的表现更像研究生水平——能解决常规题型,但在需要创造性思维的环节稍逊一筹。这种差距源于谷歌全新设计的混合专家系统,让模型可以动态调用不同领域的"专家模块"。


image

多模态理解可能是Gemini 3最颠覆性的优势。当要求将一段菜谱文字转译为视频分镜时,它能准确识别"文火慢炖"对应的视觉呈现,而ChatGPT-5输出的画面仍停留在基础烹饪场景。这种跨模态对齐技术让Gemini 3在音频转学习卡、会议记录生成图表等复杂任务中,保持了惊人的一致性。官方演示中处理720p视频时,其多模态推理延迟控制在300毫秒以内,几乎达到实时交互水准。

但真正让学术界震动的是其零样本学习能力。面对全新的量子计算问题,Gemini 3在没有专门训练的情况下,其回答质量已经超过80%人类专家。这背后是谷歌首创的"意图洞察"架构,使得模型能通过请求中的细微语境线索,自动构建知识关联网络。在12项行业标准测试中,Gemini 3有9项领先ChatGPT-5超过15个百分点,特别是在需要专业知识的医疗和法律领域。


image

Antigravity智能体平台的推出,则暴露了谷歌更大的野心。开发者现在可以用更高抽象层级的指令,让Gemini 3自主完成邮件整理、行程预订等系列任务。测试显示,这些智能体在连续运行72小时后,决策一致性仍保持在95%以上。相比之下,其他AI模型在类似长周期测试中普遍会出现"任务漂移"现象。

这场较量远未结束。虽然Gemini 3在基准测试中暂时领先,但OpenAI即将推出的GPT-5强化版已开始小范围测试。谷歌选择在此时全面开放Gemini 3的企业级接入,VertexAI平台甚至支持百万级tokens的上下文处理,显然是要在商业化层面建立护城河。当皮查伊坦言行业存在"非理性投资"时,Gemini 3已经用即时落地的产品矩阵,写下了AI竞赛的新规则——未来的胜负手,或许不在实验室的跑分榜上,而在千万用户每日触达的搜索框里。


image


image

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
已确认是张颂文!从车祸现场离去后被官媒报道,高群书果然没说错

已确认是张颂文!从车祸现场离去后被官媒报道,高群书果然没说错

鹿楠
2025-11-18 22:45:03
加入CPTPP:关乎未来的“高难度闯关”搏杀

加入CPTPP:关乎未来的“高难度闯关”搏杀

墨心人
2025-11-19 19:42:48
男女食堂里亲热:肮脏画面流出,全过程披露,女方一动作令人作呕

男女食堂里亲热:肮脏画面流出,全过程披露,女方一动作令人作呕

博士观察
2025-11-19 10:45:17
罗志祥近况:已写好遗嘱,自认被黑惨了,向时间管理大师六字道歉

罗志祥近况:已写好遗嘱,自认被黑惨了,向时间管理大师六字道歉

叨唠
2025-11-19 03:22:18
韩媒警告:一旦东亚开战,韩国导弹将降落北京,同时摧毁中国海军

韩媒警告:一旦东亚开战,韩国导弹将降落北京,同时摧毁中国海军

优趣纪史记
2025-11-20 00:06:12
“漏X装”,火了!

“漏X装”,火了!

微微热评
2025-11-19 14:51:31
俞敏洪南极邮轮被曝入住价在26万至148万元,坐一次要等两年;“内部信”风波后,其发视频称:应邀来南极,为青少年考察自然教育

俞敏洪南极邮轮被曝入住价在26万至148万元,坐一次要等两年;“内部信”风波后,其发视频称:应邀来南极,为青少年考察自然教育

极目新闻
2025-11-19 19:51:43
广东模特大赛冠军诞生后,我笑死在评论区

广东模特大赛冠军诞生后,我笑死在评论区

清书先生
2025-11-19 16:02:32
中日关系高度紧张:大量中国游客赴日!网友:富士山下都是中国人

中日关系高度紧张:大量中国游客赴日!网友:富士山下都是中国人

大国纪录
2025-11-19 15:52:44
11月,深圳又一家精密大厂宣布停止经营了

11月,深圳又一家精密大厂宣布停止经营了

微微热评
2025-11-19 13:44:44
为什么越南女子劫法场,却让全世界刮目相看?

为什么越南女子劫法场,却让全世界刮目相看?

历史总在押韵
2025-11-20 00:17:37
荷兰政府:已暂停对安世半导体的干预

荷兰政府:已暂停对安世半导体的干预

半导体产业纵横
2025-11-19 18:27:31
吴艳妮哭成泪人!颁奖典礼掩面痛哭,三届全运会无缘金牌

吴艳妮哭成泪人!颁奖典礼掩面痛哭,三届全运会无缘金牌

奥拜尔
2025-11-19 22:57:40
模特大赛15号选手夺冠引争议,组委会最新回应:她是太太组冠军,带资进组是谣言

模特大赛15号选手夺冠引争议,组委会最新回应:她是太太组冠军,带资进组是谣言

先锋新闻
2025-11-19 16:47:56
在爱泼斯坦案件中躺枪的金刻羽,学术水平到底如何?

在爱泼斯坦案件中躺枪的金刻羽,学术水平到底如何?

爆角追踪
2025-11-19 14:35:56
中日磋商不欢而散,一细节引发全球热议,美媒:日本毫无还手之力

中日磋商不欢而散,一细节引发全球热议,美媒:日本毫无还手之力

古史青云啊
2025-11-20 02:29:56
陈梦:没想到能进决赛甚至冠军,健康完赛是队伍对我的最大愿望

陈梦:没想到能进决赛甚至冠军,健康完赛是队伍对我的最大愿望

懂球帝
2025-11-19 22:50:07
深圳一模特大赛冠军因突破大众审美认知引发争议,有评委发文称“连评分表都没看到”,一联合主办单位回应只赞助了几千块

深圳一模特大赛冠军因突破大众审美认知引发争议,有评委发文称“连评分表都没看到”,一联合主办单位回应只赞助了几千块

极目新闻
2025-11-19 10:38:42
“穷就别硬装了!”一家三口吃火锅花了217元,父亲心疼钱被群嘲

“穷就别硬装了!”一家三口吃火锅花了217元,父亲心疼钱被群嘲

妍妍教育日记
2025-11-18 19:53:15
杭州官宣取消灵隐寺门票

杭州官宣取消灵隐寺门票

界面新闻
2025-11-19 10:37:00
2025-11-20 05:12:49
大千晋廷
大千晋廷
记录美好生活
196文章数 0关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

家居
时尚
教育
房产
公开课

家居要闻

水岸美学 书香人文生活

辛芷蕾的炸裂10分钟,让人大受震撼

教育要闻

lsa伦敦占星学院是什么

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版