网易首页 > 网易号 > 正文 申请入驻

谷歌最强大AI模型Gemini 3来了!推理能力实现重大突破!图像生成、编程与AI搜索全面增强

0
分享至

当地时间11月18日,Alphabet旗下的谷歌正式发布备受期待的该司迄今最强大人工智能(AI)模型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用。这是谷歌首次在新模型发布当天就将其整合到搜索产品中,显示出公司加快AI技术商业化的决心。

Alphabet首席执行官桑达尔·皮查伊当天表示,新AI模型将针对更复杂的问题提供更优答案。"用户只需更少的提示,即可获得所需结果。"此外,新模型在编程、应用开发与图像生成方面的能力也大幅增强。


图片来源:每经记者 郑雨航 摄

Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及其企业级产品。该模型将自周二起向部分订阅用户开放,并将在未来几周更大范围上线。

此次发布距离谷歌推出Gemini 2.5仅八个月,距离Gemini 2.0上线也仅11个月。引爆生成式AI热潮的OpenAI已于今年8月份发布GPT-5。

皮查伊写道:“令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中全面铺开。”

据谷歌披露的数据显示,Gemini应用目前月活跃用户已达6.5亿,而AI Overviews拥有20亿月活用户。OpenAI则在8月表示,ChatGPT周活跃用户已突破7亿。

谷歌高管在新闻发布会上强调,在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先地位。Gemini 3在全球AI模型LMArena排行榜上以1501分的历史最高分登顶,在衡量通用推理能力的Humanity's Last Exam基准测试中获得37.5%的最高分,超越了此前由GPT-5 Pro保持的31.64%纪录。该模型还在数学、多模态理解和事实准确性等多个维度刷新了行业标准。

谷歌AI研究实验室DeepMind的CEO Demis Hassabis表示,Gemini 3是"世界上最好的多模态理解模型",也是公司迄今最强大的智能体和代码生成模型。谷歌CEO Sundar Pichai在博客中称其为"我们最智能的模型",能够"将任何想法变为现实"。

推理能力实现重大突破

Gemini 3在推理能力上取得了显著进步,在多项学术级基准测试中展现出博士水平的表现。该模型在GPQA Diamond测试中获得91.9%的高分,在数学领域的MathArena Apex基准测试中取得23.4%的新成绩,在事实准确性方面于SimpleQA Verified测试中达到72.1%的得分。

在多模态推理方面,Gemini 3同样表现出色,在MMMU-Pro测试中获得81%的分数,在Video-MMMU测试中达到87.6%。这意味着该模型能够高度可靠地处理科学和数学等广泛领域的复杂问题。


谷歌产品负责人Tulsee Doshi表示:"在Gemini 3身上,我们看到了推理能力的巨大飞跃。它的响应深度和细微程度是我们以前从未见过的。"

除标准版本外,谷歌还推出了Gemini 3 Deep Think增强推理模式,该模式在Humanity's Last Exam测试中达到41.0%的成绩,在GPQA Diamond测试中获得93.8%的分数。在ARC-AGI-2测试中,Deep Think模式创下了45.1%的前所未有成绩,展示了其解决新颖挑战的能力。谷歌表示,该模式正在接受额外的安全评估,将在未来几周内向Google AI Ultra订阅用户开放。


开发者工具全面升级

在代码生成领域,Gemini 3被谷歌称为"迄今构建的最佳vibe coding和智能体编码模型"。该模型在WebDev Arena排行榜上以1487分的高分登顶,在衡量模型通过终端操作计算机能力的Terminal-Bench 2.0测试中获得54.2%的分数,在评估代码智能体的SWE-bench Verified基准测试中达到76.2%,远超Gemini 2.5 Pro的表现。

开发者可以通过Google AI Studio、Vertex AI、Gemini CLI以及Cursor、GitHub、JetBrains、Manus和Replit等第三方平台访问Gemini 3。

谷歌同时推出了以智能体为先的全新开发平台Google Antigravity,该平台利用Gemini 3的高级推理、工具使用和智能体编码能力,将AI辅助从开发者工具箱中的一个工具转变为主动合作伙伴。DeepMind首席技术官Koray Kavukcuoglu表示:"智能体可以在你的编辑器、终端和浏览器之间工作,以最佳方式帮助你构建应用程序。"

多模态理解与智能体能力并进

Gemini 3保留了该系列模型从一开始就具备的跨模态信息综合能力,能够无缝处理文本、图像、视频、音频和代码等多种模态信息,并配备100万token的上下文窗口。

Hassabis举例说,如果用户想学习传统的烹饪,Gemini 3可以破译并翻译不同语言的手写食谱,制作成可分享的家庭食谱书。如果用户想了解新主题,可以提供学术论文、长视频讲座或教程,Gemini 3能够生成交互式闪卡、可视化或其他格式的内容帮助用户掌握材料。该模型甚至可以分析用户匹克球比赛的视频,识别改进空间并生成整体动作改善的训练计划。

在智能体能力方面,Gemini 3在测试长期规划能力的Vending-Bench 2排行榜上位居榜首。该模型能够在整整一年的模拟运营中保持一致的工具使用和决策能力,在不偏离任务的情况下实现更高回报。这意味着Gemini 3能够通过结合更深入的推理与改进的工具使用,代表用户导航更复杂的多步骤工作流程,例如预订本地服务或整理收件箱。

发布即上线多个核心产品

谷歌此次采取了积极的产品策略,在Gemini 3发布首日就将其整合到多个核心产品中。这是谷歌首次在新模型发布当天就将其应用于搜索产品,标志着公司AI商业化战略的重要转变。

在搜索方面,AI Mode现在使用Gemini 3来实现新的生成式用户界面体验,包括沉浸式视觉布局、交互式工具和模拟,所有这些都根据用户查询实时生成。在Gemini App中,所有用户都可以使用Gemini 3,Google AI Pro和Ultra订阅用户还可以在AI Mode搜索中使用该模型。

在安全性方面,谷歌表示Gemini 3是其迄今最安全的模型,经历了谷歌AI模型史上最全面的安全评估。该模型显示出更低的谄媚性、更强的提示注入抵抗力,以及通过网络攻击滥用的更好防护。除了根据其前沿安全框架进行的内部测试外,谷歌还与世界领先的领域专家合作进行评估,向英国AISI等机构提供早期访问权限,并获得了Apollo、Vaultis和Dreadnode等行业专家的独立评估。

每日经济新闻综合公开资料

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国公民赴俄将免签,元旦假期赴俄机票预订量同比增约32%

中国公民赴俄将免签,元旦假期赴俄机票预订量同比增约32%

新京报
2025-11-19 17:31:10
退休后,养老金能够拿到这个数,你就是人生赢家,高枕无忧了

退休后,养老金能够拿到这个数,你就是人生赢家,高枕无忧了

匹夫来搞笑
2025-11-19 15:47:38
iPhone无折痕屏幕已正式定型:屏幕将由三星独家供应;该机型按计划将于明年9月亮相

iPhone无折痕屏幕已正式定型:屏幕将由三星独家供应;该机型按计划将于明年9月亮相

鲁中晨报
2025-11-19 13:47:07
无我——追记北京市公安局副局长、交通管理总队(交通管理局)总队长(局长)董亦军

无我——追记北京市公安局副局长、交通管理总队(交通管理局)总队长(局长)董亦军

公安部交通安全微发布
2025-11-19 16:06:58
美女美图7139期

美女美图7139期

手工制作阿歼
2025-11-14 08:13:28
上海乒乓女团摘得全运会铜牌!陈熠坦言没想到

上海乒乓女团摘得全运会铜牌!陈熠坦言没想到

现代快报
2025-11-19 17:59:05
中国军方宣布,将于11月17日至19日举行实弹军事演习

中国军方宣布,将于11月17日至19日举行实弹军事演习

百态人间
2025-11-19 05:05:03
江苏卫视上星!42集谍战大作来袭,“特工专业户”祖峰强势回归

江苏卫视上星!42集谍战大作来袭,“特工专业户”祖峰强势回归

乐枫电影
2025-11-19 17:25:03
全运会女子100米栏:吴艳妮预赛跑进13秒内,决赛PK林雨薇

全运会女子100米栏:吴艳妮预赛跑进13秒内,决赛PK林雨薇

全景体育V
2025-11-19 09:53:12
特朗普万万没想不到,C919迪拜首秀32国开门,适航证成废纸

特朗普万万没想不到,C919迪拜首秀32国开门,适航证成废纸

星辰夜语
2025-11-19 18:12:19
天呐!巩俐这身材太惊艳了,胸围几乎到肚脐,状态却依旧十分亮眼

天呐!巩俐这身材太惊艳了,胸围几乎到肚脐,状态却依旧十分亮眼

TVB的四小花
2025-10-22 02:25:03
小米法务的这个骚操作,让人彻底看清雷军的本质

小米法务的这个骚操作,让人彻底看清雷军的本质

热点菌本君
2025-11-19 16:18:57
冯德莱恩筹不到钱,泽连斯基打电话给土耳其,想找俄罗斯谈谈

冯德莱恩筹不到钱,泽连斯基打电话给土耳其,想找俄罗斯谈谈

壹只灰鸽子
2025-11-19 18:05:33
30岁快递员因送错快递被杀害,知情人:收件人嫌配送太慢发生口角,收件人丈夫突然情绪失控,拿刀实施了暴行

30岁快递员因送错快递被杀害,知情人:收件人嫌配送太慢发生口角,收件人丈夫突然情绪失控,拿刀实施了暴行

观威海
2025-11-19 16:34:02
突破“卡脖子”!清华学霸干出又一个世界第一

突破“卡脖子”!清华学霸干出又一个世界第一

华商韬略
2025-11-17 10:27:22
江苏女子为省钱每天带饭上班,坚持5天不带了,网友:现实太残酷

江苏女子为省钱每天带饭上班,坚持5天不带了,网友:现实太残酷

双色球的方向舵
2025-11-19 12:37:28
秦基伟将军86年重返上甘岭之后:把黄继光侄女调到北京,大校退休

秦基伟将军86年重返上甘岭之后:把黄继光侄女调到北京,大校退休

墨兰史书
2025-11-18 02:30:03
蓝厅观察|中方多部门一周内对日密集发声或采取相应措施16次

蓝厅观察|中方多部门一周内对日密集发声或采取相应措施16次

澎湃新闻
2025-11-17 21:44:26
白菜是糖尿病导火索?提醒:若想胰岛强壮,这5物能不吃就不吃!

白菜是糖尿病导火索?提醒:若想胰岛强壮,这5物能不吃就不吃!

橘子约定
2025-11-19 16:34:31
大批日本专家,抛弃日本涌入中国,表面为了赚钱,实则另有目的?

大批日本专家,抛弃日本涌入中国,表面为了赚钱,实则另有目的?

壹知眠羊
2025-11-07 14:39:53
2025-11-19 19:28:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1406103文章数 2720100关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

佘智江刚被引渡回国 缅甸政府突袭其名下"亚太新城"

头条要闻

佘智江刚被引渡回国 缅甸政府突袭其名下"亚太新城"

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

荷兰政府暂停接管安世半导体

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

时尚
房产
家居
旅游
本地

陈嘉桦,不慌不忙的惊艳

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

家居要闻

水岸美学 书香人文生活

旅游要闻

灵隐寺免门票,打开文旅新姿势 | 新京报专栏

本地新闻

第十二届影展携手重庆来福士丨两江交汇,光影共生

无障碍浏览 进入关怀版