网易首页 > 网易号 > 正文 申请入驻

谷歌发布Gemini 3:AI领域重大突破,多项能力显著领先

0
分享至

2025年下半年,谷歌发布了其最新AI模型Gemini 3,这一模型在多个关键领域取得了显著进步,打破了AI领域的阶段性平淡。Gemini 3不仅在Benchmark测试中取得断层式领先,还在多模态理解、编码能力、长上下文处理和用户体验等方面展现出强大的综合能力。

在Benchmark测试中,Gemini 3的表现尤为突出。在衡量AI解决人类顶尖难题的Humanity's Last Exam测试中,Gemini 3 Pro的得分达到37.5%(无工具)和45.8%(带工具),远超前代和竞争对手。在ARC-AGI-2测试中,Gemini 3 Pro的得分是31.1%,而GPT-5.1仅为17.6%。这表明Gemini 3在抽象推理能力上接近人类水平。此外,在数学能力测试MathArena Apex中,Gemini 3 Pro的得分达到23.4%,远超其他模型。

多模态领域是谷歌的强项,Gemini 3在这一领域表现惊人。在MMMU-Pro和CharXiv Reasoning测试中,Gemini 3的得分分别为81.0%和81.4%,而在理解截图的ScreenSpot-Pro测试中,其得分是72.7%,是Claude Sonnet 4.5的两倍,GPT-5.1的二十倍。

编码能力方面,Gemini 3也实现了重大突破。在LiveCodeBench测试中,Gemini 3的分数比第二名Grok 4.1高出200多分。在Agent工具使用能力测试12-bench中,Gemini 3 Pro的得分达到85.4%,远超其他版本。在长上下文处理能力方面,Gemini 3在MRCR v2 benchmark中28k上下文的平均得分77.0%,1M上下文的逐点得分26.3%,显示出其在理解和利用长文档信息方面的强大能力。

Gemini 3还推出了Deep Think模式,这是一种更高性能但也更高成本的版本。在综合能力测试Vending-Bench 2中,Gemini 3实现了5,478.16的平均净值,相比GPT-5.1的1,473.43和Gemini 2.5 Pro的573.64,展现出断崖式领先。

除了性能上的突破,Gemini 3在用户体验上也进行了重大创新。谷歌推出了“生成式UI”(Generative UI),AI可以根据每个请求动态生成完全定制的用户界面。这种能力不仅改变了人机交互的范式,还使得Gemini 3能够根据用户意图和场景改变设计,提供更加个性化的体验。

Gemini 3的发布标志着谷歌在AI领域的全面发力,其不仅在技术上取得了重大突破,还在用户体验和实际应用中展现出强大的潜力。这一模型的发布不仅让谷歌在AI领域重新确立了领先地位,也为整个行业的发展提供了新的方向和思路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海浦东新区调整部分镇、街道范围

上海浦东新区调整部分镇、街道范围

元爸体育
2025-11-20 01:08:35
1.2万人小镇却有2800名移民!费拉拉居民寒夜上街怒喊:我们真的累了!

1.2万人小镇却有2800名移民!费拉拉居民寒夜上街怒喊:我们真的累了!

意大利华人网0039
2025-11-19 00:11:16
他接受纪律审查和监察调查

他接受纪律审查和监察调查

锡望
2025-11-18 17:29:52
一夜之间,中国传来2个爆炸性突破,美国从88%降到9%,中国猛追

一夜之间,中国传来2个爆炸性突破,美国从88%降到9%,中国猛追

法老不说教
2025-11-19 22:46:19
全运会乒乓!男团决赛对阵出炉,卫冕冠军0-3惨败,王楚钦零封

全运会乒乓!男团决赛对阵出炉,卫冕冠军0-3惨败,王楚钦零封

云景侃记
2025-11-20 02:42:42
34岁金晨增肥后大变样,告别骨感瘦削,美出新高度!

34岁金晨增肥后大变样,告别骨感瘦削,美出新高度!

冒泡泡的鱼儿
2025-11-19 15:06:02
获得金鸡奖第四天,钟楚曦公开“叫板”杨幂,刘亦菲没说错

获得金鸡奖第四天,钟楚曦公开“叫板”杨幂,刘亦菲没说错

悦君兮君不知
2025-11-20 00:50:16
河南23岁智力不全女子出嫁,只为生子养老,彩礼9.9万男方很细心

河南23岁智力不全女子出嫁,只为生子养老,彩礼9.9万男方很细心

牛牛叨史
2025-11-20 00:50:17
东莞市以纯集团一项目存重大事故隐患,中国二十二冶被挂牌督办

东莞市以纯集团一项目存重大事故隐患,中国二十二冶被挂牌督办

中国基建报
2025-11-19 23:37:05
退休后,养老金能够拿到这个数,你就是人生赢家,高枕无忧了

退休后,养老金能够拿到这个数,你就是人生赢家,高枕无忧了

匹夫来搞笑
2025-11-19 15:47:38
日本一地发生大规模火灾,或为该国20年来烧毁建筑最多一次:许多木制房屋,彼此相邻

日本一地发生大规模火灾,或为该国20年来烧毁建筑最多一次:许多木制房屋,彼此相邻

红星新闻
2025-11-19 13:07:15
詹姆斯捂脸无言,爵士本场有7名球员在自己生涯首秀时还没出生

詹姆斯捂脸无言,爵士本场有7名球员在自己生涯首秀时还没出生

懂球帝
2025-11-19 16:29:06
首款超8500mAh电池的第五代骁龙8至尊版旗舰!荣耀GT2 Pro排期12月

首款超8500mAh电池的第五代骁龙8至尊版旗舰!荣耀GT2 Pro排期12月

快科技
2025-11-19 23:44:10
中国证监会,重磅发声!

中国证监会,重磅发声!

中国基金报
2025-11-19 23:28:30
酒店机器人血战:价格从13万打到1.3万

酒店机器人血战:价格从13万打到1.3万

斑马消费
2025-11-19 07:38:04
血迹太空可见,苏丹这场大屠杀何以发生?

血迹太空可见,苏丹这场大屠杀何以发生?

新京报
2025-11-17 13:13:52
最近奥运冠军陈芋汐身上,能明显看出三个变化,跟以前不一样了:

最近奥运冠军陈芋汐身上,能明显看出三个变化,跟以前不一样了:

小光侃娱乐
2025-11-19 18:20:03
枪决前死囚突然要一支烟,抽烟时敲击的节奏,正是我俩的密语!

枪决前死囚突然要一支烟,抽烟时敲击的节奏,正是我俩的密语!

萧竹轻语
2025-11-18 18:05:29
富养自己的最好方式:运动第三,睡觉第二,第一很多人做不到

富养自己的最好方式:运动第三,睡觉第二,第一很多人做不到

蜉蝣说
2025-11-16 10:00:41
今日十月初一寒衣节,牢记:1不说,2不做,3不理,4不留,5要吃

今日十月初一寒衣节,牢记:1不说,2不做,3不理,4不留,5要吃

小茉莉美食记
2025-11-20 00:45:02
2025-11-20 04:44:49
三言科技 incentive-icons
三言科技
聚焦新未来新科技,严肃又活泼。
95984文章数 66710关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

头条要闻

日方要求解释为何未告知磋商后会有媒体拍摄 中方回应

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

重磅!中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

本地
时尚
艺术
数码
公开课

本地新闻

第十二届影展携手重庆来福士丨两江交汇,光影共生

辛芷蕾的炸裂10分钟,让人大受震撼

艺术要闻

惊呆了!外国画家如何颠覆水浒108将的形象?

数码要闻

猫头鹰黑化版散热器风扇来袭

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版