网易首页 > 网易号 > 正文 申请入驻

谷歌最强大AI模型Gemini 3来了!推理能力实现重大突破!图像生成、编程与AI搜索全面增强

0
分享至

来源:市场资讯

(来源:每日经济新闻)

当地时间11月18日,Alphabet旗下的谷歌正式发布备受期待的该司迄今最强大人工智能(AI)模型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用。这是谷歌首次在新模型发布当天就将其整合到搜索产品中,显示出公司加快AI技术商业化的决心。

Alphabet首席执行官桑达尔·皮查伊当天表示,新AI模型将针对更复杂的问题提供更优答案。"用户只需更少的提示,即可获得所需结果。"此外,新模型在编程、应用开发与图像生成方面的能力也大幅增强。


图片来源:每经记者 郑雨航 摄

Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及其企业级产品。该模型将自周二起向部分订阅用户开放,并将在未来几周更大范围上线。

此次发布距离谷歌推出Gemini 2.5仅八个月,距离Gemini 2.0上线也仅11个月。引爆生成式AI热潮的OpenAI已于今年8月份发布GPT-5。

皮查伊写道:“令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中全面铺开。”

据谷歌披露的数据显示,Gemini应用目前月活跃用户已达6.5亿,而AI Overviews拥有20亿月活用户。OpenAI则在8月表示,ChatGPT周活跃用户已突破7亿。

谷歌高管在新闻发布会上强调,在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先地位。Gemini 3在全球AI模型LMArena排行榜上以1501分的历史最高分登顶,在衡量通用推理能力的Humanity's Last Exam基准测试中获得37.5%的最高分,超越了此前由GPT-5 Pro保持的31.64%纪录。该模型还在数学、多模态理解和事实准确性等多个维度刷新了行业标准。

谷歌AI研究实验室DeepMind的CEO Demis Hassabis表示,Gemini 3是"世界上最好的多模态理解模型",也是公司迄今最强大的智能体和代码生成模型。谷歌CEO Sundar Pichai在博客中称其为"我们最智能的模型",能够"将任何想法变为现实"。

推理能力实现重大突破

Gemini 3在推理能力上取得了显著进步,在多项学术级基准测试中展现出博士水平的表现。该模型在GPQA Diamond测试中获得91.9%的高分,在数学领域的MathArena Apex基准测试中取得23.4%的新成绩,在事实准确性方面于SimpleQA Verified测试中达到72.1%的得分。

在多模态推理方面,Gemini 3同样表现出色,在MMMU-Pro测试中获得81%的分数,在Video-MMMU测试中达到87.6%。这意味着该模型能够高度可靠地处理科学和数学等广泛领域的复杂问题。


谷歌产品负责人Tulsee Doshi表示:"在Gemini 3身上,我们看到了推理能力的巨大飞跃。它的响应深度和细微程度是我们以前从未见过的。"

除标准版本外,谷歌还推出了Gemini 3 Deep Think增强推理模式,该模式在Humanity's Last Exam测试中达到41.0%的成绩,在GPQA Diamond测试中获得93.8%的分数。在ARC-AGI-2测试中,Deep Think模式创下了45.1%的前所未有成绩,展示了其解决新颖挑战的能力。谷歌表示,该模式正在接受额外的安全评估,将在未来几周内向Google AI Ultra订阅用户开放。


开发者工具全面升级

在代码生成领域,Gemini 3被谷歌称为"迄今构建的最佳vibe coding和智能体编码模型"。该模型在WebDev Arena排行榜上以1487分的高分登顶,在衡量模型通过终端操作计算机能力的Terminal-Bench 2.0测试中获得54.2%的分数,在评估代码智能体的SWE-bench Verified基准测试中达到76.2%,远超Gemini 2.5 Pro的表现。

开发者可以通过Google AI Studio、Vertex AI、Gemini CLI以及Cursor、GitHub、JetBrains、Manus和Replit等第三方平台访问Gemini 3。

谷歌同时推出了以智能体为先的全新开发平台Google Antigravity,该平台利用Gemini 3的高级推理、工具使用和智能体编码能力,将AI辅助从开发者工具箱中的一个工具转变为主动合作伙伴。DeepMind首席技术官Koray Kavukcuoglu表示:"智能体可以在你的编辑器、终端和浏览器之间工作,以最佳方式帮助你构建应用程序。"

多模态理解与智能体能力并进

Gemini 3保留了该系列模型从一开始就具备的跨模态信息综合能力,能够无缝处理文本、图像、视频、音频和代码等多种模态信息,并配备100万token的上下文窗口。

Hassabis举例说,如果用户想学习传统的烹饪,Gemini 3可以破译并翻译不同语言的手写食谱,制作成可分享的家庭食谱书。如果用户想了解新主题,可以提供学术论文、长视频讲座或教程,Gemini 3能够生成交互式闪卡、可视化或其他格式的内容帮助用户掌握材料。该模型甚至可以分析用户匹克球比赛的视频,识别改进空间并生成整体动作改善的训练计划。

在智能体能力方面,Gemini 3在测试长期规划能力的Vending-Bench 2排行榜上位居榜首。该模型能够在整整一年的模拟运营中保持一致的工具使用和决策能力,在不偏离任务的情况下实现更高回报。这意味着Gemini 3能够通过结合更深入的推理与改进的工具使用,代表用户导航更复杂的多步骤工作流程,例如预订本地服务或整理收件箱。

发布即上线多个核心产品

谷歌此次采取了积极的产品策略,在Gemini 3发布首日就将其整合到多个核心产品中。这是谷歌首次在新模型发布当天就将其应用于搜索产品,标志着公司AI商业化战略的重要转变。

在搜索方面,AI Mode现在使用Gemini 3来实现新的生成式用户界面体验,包括沉浸式视觉布局、交互式工具和模拟,所有这些都根据用户查询实时生成。在Gemini App中,所有用户都可以使用Gemini 3,Google AI Pro和Ultra订阅用户还可以在AI Mode搜索中使用该模型。

在安全性方面,谷歌表示Gemini 3是其迄今最安全的模型,经历了谷歌AI模型史上最全面的安全评估。该模型显示出更低的谄媚性、更强的提示注入抵抗力,以及通过网络攻击滥用的更好防护。除了根据其前沿安全框架进行的内部测试外,谷歌还与世界领先的领域专家合作进行评估,向英国AISI等机构提供早期访问权限,并获得了Apollo、Vaultis和Dreadnode等行业专家的独立评估。

每日经济新闻综合公开资料

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全运会男子110米栏:眼镜飞人徐卓一预赛第1,陈圆将刘俊茜晋级

全运会男子110米栏:眼镜飞人徐卓一预赛第1,陈圆将刘俊茜晋级

全景体育V
2025-11-19 10:26:44
“深圳楼市抹去10年内所有涨幅”

“深圳楼市抹去10年内所有涨幅”

靓仔情感
2025-11-19 12:24:12
美国华盛顿州商务厅厅长公开表态:我们州非常希望与中国合作

美国华盛顿州商务厅厅长公开表态:我们州非常希望与中国合作

人大重阳
2025-11-19 18:10:56
iPhoneAir设计师已从苹果离职!

iPhoneAir设计师已从苹果离职!

果粉之家
2025-11-18 12:35:16
80岁老太感染上艾滋,女儿查看监控后瞠目结舌,连捅男保姆43刀

80岁老太感染上艾滋,女儿查看监控后瞠目结舌,连捅男保姆43刀

民间精选故事汇
2025-05-12 08:01:12
A股:今天涨到3960,做好准备,明天,11月20日,很有可能这样走

A股:今天涨到3960,做好准备,明天,11月20日,很有可能这样走

花心电影
2025-11-19 15:50:53
特朗普不去,普京也不去,中方通知日本,不会在G20见高市早苗

特朗普不去,普京也不去,中方通知日本,不会在G20见高市早苗

头条爆料007
2025-11-19 08:06:47
甘油三酯大户被揪出,提醒:50岁后,这4类食物尽早忌口

甘油三酯大户被揪出,提醒:50岁后,这4类食物尽早忌口

涵豆说娱
2025-11-19 10:37:49
国家安全机关:近年来破获一批针对我国的日本间谍案件

国家安全机关:近年来破获一批针对我国的日本间谍案件

新京报
2025-11-19 09:02:47
李忠军任南京市副市长、代理市长

李忠军任南京市副市长、代理市长

新京报
2025-11-18 18:23:07
战犯东条英机孙女公然跳反,撕开日本右翼遮羞布

战犯东条英机孙女公然跳反,撕开日本右翼遮羞布

梨花头
2025-11-15 16:59:18
雷军这回栽了,小米法务被这个女人拿捏,太打脸

雷军这回栽了,小米法务被这个女人拿捏,太打脸

公子麦少
2025-11-07 14:39:17
仅赚两分钱神话破灭:100亿瓶销量也救不了,廉价水王恐将真的“凉”了

仅赚两分钱神话破灭:100亿瓶销量也救不了,廉价水王恐将真的“凉”了

趣味萌宠的日常
2025-11-08 08:45:18
燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼频道
2025-11-13 12:44:36
落袋为安!90岁老人套现10个亿跑了,能卖的全卖,不能卖的全质押

落袋为安!90岁老人套现10个亿跑了,能卖的全卖,不能卖的全质押

来科点谱
2025-11-17 09:05:36
41款进口药退出中国

41款进口药退出中国

临药网
2025-11-19 16:10:30
狗主上门被反杀后续:索赔百万、对警方放狠话,邻居曝光郭家不堪

狗主上门被反杀后续:索赔百万、对警方放狠话,邻居曝光郭家不堪

吭哧有力
2025-11-15 18:42:28
雷军就是一个投机商,仅此而已

雷军就是一个投机商,仅此而已

麦大人
2025-11-02 15:57:39
罗志祥疑似内涵极限男人帮,自称位列“被黑最惨艺人排行榜”前三

罗志祥疑似内涵极限男人帮,自称位列“被黑最惨艺人排行榜”前三

文娱没有圈
2025-11-19 10:15:19
天亮了!被传知三当三、和沈腾有不正当关系的林允,终于扬眉吐气

天亮了!被传知三当三、和沈腾有不正当关系的林允,终于扬眉吐气

涵豆说娱
2025-11-19 16:29:53
2025-11-19 19:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1433292文章数 4572关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

台旅行团在意餐厅点5份披萨遭老板嘲讽 当地华人反击

头条要闻

台旅行团在意餐厅点5份披萨遭老板嘲讽 当地华人反击

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

荷兰政府暂停接管安世半导体

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

教育
时尚
数码
健康
房产

教育要闻

班上不违法纪律,但也不学习的学生很多,是什么回事?

陈嘉桦,不慌不忙的惊艳

数码要闻

荣耀手表X5官宣11月24日发布:拥有1.97英寸超大AMOLED屏幕

警惕超声报告这六大"坑"

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

无障碍浏览 进入关怀版