网易首页 > 网易号 > 正文 申请入驻

谷歌Gemini 3.0 Pro模型卡发布,多模态能力大幅领先竞争对手

0
分享至

来源:市场资讯

(来源:网易科技)

谷歌新一代大模型Gemini 3.0即将面世,官网首先正式发布了Gemini 3 Pro模型卡,展示这款大语言模型(LLM)在多模态处理、数学推理和长文本理解等关键领域实现显著突破。

据官方披露的对比测试数据,Gemini 3 Pro在多项基准测试中大幅超越Gemini 2.5 Pro、GPT-5.1和Claude Sonnet 4.5等现有旗舰模型。

模型卡显示,Gemini 3 Pro采用稀疏混合专家架构,支持高达100万token的上下文窗口,并能输出64K token文本内容。该模型在图像理解的逻辑推理测试中表现突出,在AIME 2025等高难度数学榜单的有代码执行场景下达到满分,显示其工具调用与数学推理的组合能力已达行业顶级水准。

在专业应用测试中,加拿大劳瑞尔大学历史学教授Mark Humphries的实验表明,该模型在18世纪手写文稿识别方面字符错误率仅为0.56%,相比前代产品提升50%-70%,达到专家级人类水平。这一突破性表现引发业界对AI推理能力质的飞跃的关注。

此次发布被视为谷歌在AI竞赛中的重要战略转折点。自ChatGPT发布后一度陷入"红色警报"的谷歌,有望通过Gemini 3 Pro重塑市场地位,特别是在搜索AI模式商业化、企业AI等场景实现突破。

架构升级推动性能跨代提升

Gemini 3 Pro基于稀疏混合专家transformer架构构建,原生支持文本、图像、音频和视频多模态输入。该架构通过学习将输入token动态路由到参数子集,实现模型总容量与每token计算成本的解耦,显著提升处理效率。

模型支持高达100万token的上下文窗口,输出能力达64K token。训练数据包含大规模多域多模态数据集,涵盖公开网络文档、代码、图像、音频和视频内容。后训练阶段采用强化学习技术,整合多步推理、问题解决和定理证明数据。

根据模型卡披露,Gemini 3 Pro使用谷歌TPU进行训练,采用JAX和ML Pathways软件框架。数据处理包括去重、安全过滤、质量筛选等步骤,以提升训练数据可靠性并降低风险。

多模态能力实现突破性领先

在多模态处理能力方面,Gemini 3 Pro相比竞争对手建立了显著优势。在MMMU-Pro、ScreenSpot-Pro、Video-MMMU等多模态基准测试中,该模型相比Gemini 2.5 Pro出现明显跳跃式提升,并普遍超越GPT-5.1与Claude 4.5。

特别值得注意的是,在截图理解任务中,Gemini 3 Pro得分达到72.7%,大幅超越其他旗舰模型的36.2%表现。在Video-MMMU维度上,该模型在视频信息抽取与知识问答方面表现尤为突出,延续了谷歌在视频理解领域的传统优势。

在图像理解的逻辑推理测试中,包括Humanity's Last Exam、ARC-AGI-2、AIME 2025、MathArena等基准,Gemini 3 Pro均大幅超越自家前代产品以及GPT-5.1、Claude 4.5等竞争对手。其中在AIME 2025等高难度数学榜单的"有代码执行"场景下达到满分,显示其工具调用与数学推理组合能力已具备行业顶级水准。


代码与智能体能力与竞争对手并驾齐驱

在代码编写和智能体应用方面,Gemini 3 Pro展现出强劲的综合实力。在LiveCodeBench Pro、SWE-Bench Verified、t2-bench、Vending-Bench 2等"代码+智能体"基准测试中,该模型的Elo评分和成功率普遍高于旧版本,并在多数维度与GPT-5.1非常接近。

不过,在部分专项测试中,竞争格局依然激烈。例如在SWE-Bench Verified测试中,Claude 4.5仍保持小幅领先优势。这表明AI行业在真实软件工程类任务上尚处于"多强并立"格局,尚未出现一骑绝尘的模型。

在长文本处理和信息检索方面,Gemini 3 Pro相对2.5 Pro实现明显提升。在MRCR V2、FACTS Benchmark Suite等长上下文与检索基准上,该模型在128K长度下仍能保持较高准确率。在SimpleQA Verified测试中,其得分超过72%,大幅领先于Claude Sonnet 4.5的29%和GPT-5.1的35%,显示出极低的幻觉率。

安全评估通过关键能力临界点测试

根据谷歌DeepMind前沿安全框架评估,Gemini 3 Pro在多个关键领域未达到关键能力临界点。在CBRN(化学、生物、放射、核)、网络安全、有害操控、机器学习研发和错位风险等方面,该模型均未触及警戒阈值。

在内部安全评估中,Gemini 3 Pro在文本安全、多语言安全、图像文本安全、语调控制和不当拒绝等维度相比Gemini 2.5 Pro整体表现改善。人工红队测试确认该模型在儿童安全评估中满足发布要求,内容安全政策表现与前代产品相当或有所改善。

谷歌在模型开发过程中采用了数据集过滤、条件预训练、监督微调、人类反馈强化学习等多重安全缓解措施。模型面临的主要风险包括越狱攻击脆弱性和多轮对话中可能出现的性能下降。

商业化前景与生态整合优势

天风证券分析师李泽宇认为,虽然Gemini 3 Pro在代码能力上尚未完全超越竞争对手,但其在多模态能力、文本RAG能力上的大幅领先,结合谷歌自有的搜索、Workspace、Android生态,有望在搜索AI模式商业化、文档问答、企业AI等场景实现市场开拓能力的大幅提升。

Gemini 3 Pro将通过多个渠道分发,包括Gemini App、Google Cloud/Vertex AI、Google AI Studio、Gemini API、Google AI Mode和Google Antigravity等平台。该模型特别适用于需要智能体性能、高级编码、长上下文和多模态理解以及算法开发的应用场景。

分析认为,多模态能力的突破性提升可能催生大量新兴应用场景,而谷歌庞大的产品生态将为这些能力的商业化提供广阔空间。继续看好谷歌及其产业链相关受益者的投资机会。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有意思!杜锋瞧不起的人,单节轰11分+4次暴扣,今晚决赛还得靠他

有意思!杜锋瞧不起的人,单节轰11分+4次暴扣,今晚决赛还得靠他

南海浪花
2025-11-20 07:43:21
C罗和乔治娜出席特朗普的晚宴,他和库克同桌,马斯克坐门口!

C罗和乔治娜出席特朗普的晚宴,他和库克同桌,马斯克坐门口!

花心电影
2025-11-19 13:33:09
侯耀华北京别墅亲自做饭,灶台杂乱满墙油污,78岁穿范哲思很时尚

侯耀华北京别墅亲自做饭,灶台杂乱满墙油污,78岁穿范哲思很时尚

趣味八卦
2025-11-19 07:29:01
朱婷被欺负后愤怒离开!孙颖莎丢双冠后表现很坦然,没意识到危机

朱婷被欺负后愤怒离开!孙颖莎丢双冠后表现很坦然,没意识到危机

三十年莱斯特城球迷
2025-11-20 00:00:36
中日要开打?叫嚣击沉福建舰,日高官磋商失败,中方直言:不满意

中日要开打?叫嚣击沉福建舰,日高官磋商失败,中方直言:不满意

书中自有颜如玉
2025-11-20 07:05:08
谢谢陈思诚,贡献出25年年底内娱最大的笑话!

谢谢陈思诚,贡献出25年年底内娱最大的笑话!

娱乐圈笔娱君
2025-11-18 18:12:15
成也饭圈败也饭圈!孙颖莎被央视点名,樊振东的话终于有人信了

成也饭圈败也饭圈!孙颖莎被央视点名,樊振东的话终于有人信了

刘蕳爱下厨
2025-11-20 04:34:48
1000 天战火烧出全球真相:西方四笔惊天错账,彻底改写世界格局

1000 天战火烧出全球真相:西方四笔惊天错账,彻底改写世界格局

瞳哥视界
2025-11-10 22:31:41
赵本山长子赵铁蛋因病去世,女儿成网红,亿万家产谁来继承?

赵本山长子赵铁蛋因病去世,女儿成网红,亿万家产谁来继承?

赵钇是个热血青年
2025-11-19 05:08:55
马克·库班坚称:NBA阻止他在球队出售后继续运营达拉斯小牛队

马克·库班坚称:NBA阻止他在球队出售后继续运营达拉斯小牛队

好火子
2025-11-20 06:48:33
告别“AI味”!Gemini 3初体验:不废话、不讨好,但这价格让我手抖

告别“AI味”!Gemini 3初体验:不废话、不讨好,但这价格让我手抖

新浪财经
2025-11-19 08:51:35
易烊千玺组合三人现状:一位金鸡奖影帝,一位被吐槽,一位最可怜

易烊千玺组合三人现状:一位金鸡奖影帝,一位被吐槽,一位最可怜

观察者海风
2025-11-18 18:55:01
“我出59万,你卖不卖?”四川一富商想买人家挂在房梁上53年的猪

“我出59万,你卖不卖?”四川一富商想买人家挂在房梁上53年的猪

忠于法纪
2025-11-19 08:47:40
放假通知!2026中小学生、大学寒假放假时间已定!家长却心情复杂

放假通知!2026中小学生、大学寒假放假时间已定!家长却心情复杂

妍妍教育日记
2025-11-18 19:09:24
压制2米11中锋!杨瀚森憋了20天归来连创新高

压制2米11中锋!杨瀚森憋了20天归来连创新高

体坛周报
2025-11-19 16:16:09
他是上海知名主持人,曾和王志文是好兄弟,如今活成“不老神话”

他是上海知名主持人,曾和王志文是好兄弟,如今活成“不老神话”

锋哥与八卦哥
2025-11-19 11:28:11
知名平台将赴美上市,创始人是3位85后驴友!近4年净亏超35亿元,已融资超70亿元,红杉、软银都投了

知名平台将赴美上市,创始人是3位85后驴友!近4年净亏超35亿元,已融资超70亿元,红杉、软银都投了

每日经济新闻
2025-11-19 22:07:14
叙利亚服软,将向中国移交数百名中国西北地区少数民族圣战分子

叙利亚服软,将向中国移交数百名中国西北地区少数民族圣战分子

我心纵横天地间
2025-11-19 13:10:43
64岁的刘德华终于开始大大方方的公开自己和老婆朱丽倩的照片

64岁的刘德华终于开始大大方方的公开自己和老婆朱丽倩的照片

乡野小珥
2025-10-27 11:08:35
小伙相亲31岁女子,一看打扮扭头就走:白给都不要!

小伙相亲31岁女子,一看打扮扭头就走:白给都不要!

农村情感故事
2025-11-16 15:04:27
2025-11-20 09:20:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1436217文章数 4580关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

中方暂停进口日水产品 日媒:预计中国反制攻势将持续

头条要闻

中方暂停进口日水产品 日媒:预计中国反制攻势将持续

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

英伟达财报,超预期

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

游戏
艺术
时尚
亲子
房产

《幻兽帕鲁手游》G-STAR试玩报告:“大刀阔斧”的改动与调整"/> 主站 商城 论坛 自运营 登录 注册 《幻兽帕鲁手游》G-STAR试玩报告:“大刀...

艺术要闻

看完启功再对比,田蕴章行书你能认全吗?

入冬时节,高雅人士都在品鉴什么好东西?

亲子要闻

“广东重男轻女?园长日常揭秘,真相让人震惊!”

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

无障碍浏览 进入关怀版